Sunday 24 February 2019

Transformação de dados em stata forex


Para perguntas rápidas, envie um email para dataprinceton. edu. Não há appts. Necessário durante horas walk-in. Nota: o laboratório DSS está aberto enquanto o Firestone estiver aberto, sem compromissos necessários para usar os computadores do laboratório para sua própria análise. Transformações de logs Se a distribuição de uma variável tiver uma inclinação positiva, assumir um logaritmo natural da variável às vezes ajuda a ajustar a variável em um modelo. As transformações de log tornam a distribuição do ponto de vista mais equilibrada mais normal. Além disso, quando uma alteração na variável dependente está relacionada com a variação percentual em uma variável independente, ou vice-versa, a relação é melhor modelada tomando o log natural de uma ou ambas as variáveis. Por exemplo, estimar as pessoas com salário baseadas em educação, experiência e região de residência usando dados da amostra de Statas nlsw88, um extrato do Estudo Logualinal Nacional de Mulheres Jovens de 1988. Parece ok, mas quando olho para a distribuição de posse, parece um pouco distorcido. Então eu computo um registro natural de posse. Parece ter superado um pouco, mas parece um tanto normal. Eu tento uma regressão com o mandato registrado. O R-squared ficou um pouco mais alto, então, tomar o log natural parece ter ajudado a ajustá-lo melhor ao modelo. Quando a variável independente, mas não a variável dependente, é registrada, uma alteração de porcentagem na variável independente é associada a 1100 vezes a alteração do coeficiente na variável dependente. Salário previsto. -1.6390.681GRADE0.774LNTENURE-1.134SOUTH Portanto, um aumento percentual na posse está associado a um aumento no salário de 0,01x0,774 ou cerca de 0,0077. Agora eu examino o salário, e acho que é muito distorcido. Então pego um log natural de salários e analise a distribuição do salário registrado. A distribuição parece muito mais normal. Agora eu lanço a mesma regressão com o salário registrado como variável dependente. Quando a variável dependente, mas não uma variável independente, é registrada, uma variação de uma unidade na variável independente está associada a uma mudança de porcentagem de coeficiente de 100 vezes na variável dependente. Nesses dados, a posse é medida em anos: então, um aumento de um ano na posse aumenta o salário em 100x0.026 ou cerca de 2.6. Se registramos as variáveis ​​dependentes e independentes, então estamos olhando a elasticidade: a variação percentual em X resulta em variação percentual em Y. lança prevista 0,659 0,084GRADE0.136LNTENURA-0.151SOUTH Um aumento de um por cento na posse é estimado em aproximadamente Aumento de 0.136 no salário. Copie 2007 The Truestees of Princeton University. Todos os direitos reservados. Dataprinceton. edu Esta página foi atualizada pela última vez em 28 de agosto de 2008 Modelos estatísticos lineares: Transformação de dados de regressão Objetivo das transformações Para linearizar o modelo de regressão. Para estabilizar a variância (reduzir a heterogeneidade de variância, heterocedasticidade). Para normalizar variáveis. Algumas transformações servirão para mais de um propósito. Por exemplo, uma transformação que lineariza uma variável também pode ajudar a normalizá-la. As transformações podem ser necessárias devido a: considerações teóricas. A variável dependente pode ter uma distribuição de probabilidade na qual a média está relacionada à variância. Evidência empírica do exame dos resíduos. Variáveis ​​a serem transformadas A variável dependente pode ser transformada. Nota: Isso afeta a relação da variável dependente com todas as variáveis ​​preditoras no modelo. Variáveis ​​de preditores individuais podem ser transformadas. Ambas variáveis ​​dependentes e independentes podem ser transformadas Principais Desvantagens A interpretação da regressão envolve variáveis ​​transformadas e não as próprias variáveis ​​originais. O relacionamento das variáveis ​​transformadas com as variáveis ​​originais pode ser difícil ou confuso. A transformação pode não ser capaz de corrigir todos os problemas nos dados originais, a análise de regressão ainda pode ser suspeita. 1. Para linearizar o modelo de regressão com uma inclinação consistentemente crescente. 2. Estabilize a variância quando a variação dos resíduos aumenta acentuadamente com o aumento de Y. 3. Para normalizar Y quando a distribuição dos resíduos é positivamente desviada. Transformação da raiz quadrada do exemplo Stata (SQRT) Usada para estabilizar a variância quando proporcional à média de Y especialmente quando Y se aproxima de uma distribuição de Poisson. Para estabilizar a variância quando proporcional à 4ª potência da média de Y, ou seja, um aumento enorme na variância acima de um limite de Y. O objetivo é minimizar o efeito de grandes valores de Y. O Ys grande transformado será próximo de zero, portanto grandes aumentos em Y Resultará em apenas diminuições triviais em Y. 1. Linearize quando X vs Y é curvilíneo para baixo, ou seja, a inclinação diminui à medida que X aumenta .. 2. Estabilize a variância quando diminui com a média de Y. 3. Normalize Y quando a distribuição de resíduos é Negativamente inclinado. Estabilize a variância quando Y é uma proporção ou uma taxa. Distribuição de Poisson Possíveis transformações: Poisson Exemplos Número de eventos em um período, área ou volume específicos. Acidentes por mês Erros de digitação por página Partes por milhão de toxinas em emissões Entradas por meinte na janela do caixa Número de falhas do computador por mês Distribuição Binomial Transformação possível: Distribuição Binomial Negativa Comece com uma distribuição altamente distorcida. Transformação de SQRT: melhor transformação de logs: muito aumentado para o poder de .25: melhor até agora O que fazer se você não consegue descobrir qual transformação usar Escada de poderes: Cada uma das seguintes transformações e testes de normalidade. Y 3. Y 2. Y, sqrt (Y), ln (Y), 1sqrt (Y), 1Y, 1Y 2. 1Y 3. Em Stata o comando é: Transformação Box-Cox: Localiza o valor u para a transformação, (Yu -1) u, ​​que normaliza a variável transformada. Os valores que estão sendo transformados devem ser estritamente positivos, ou seja, maiores do que zero. Em Stata o comando é:

No comments:

Post a Comment