Rede Agronomia

Rede dos Engenheiros Agrônomos do Brasil

Por motivo do Dia Mundial do Meio Ambiente, comemorado hoje, dia 5 de Junho, eu abro este tópico para reunir algumas soluções matemáticas de problemas ligados ao meio ambiente. São extratos das minhas leituras e anotações, e visam servir de 'formulário' para quando se fizer necessário. Convido os colegas a colaborar com outros exemplos, que poderão nos ajudar em diversas áreas da Agronomia, estando o Licenciamento Ambiental na cabeça da lista. Por motivos óbvios, darei destaque nas soluções ao software (gratuito) R, ao qual já me referi em vários momentos e ocasiões aqui na Rede Agronomia.  

Mãos à obra.

Exibições: 256

Comentar

Você precisa ser um membro de Rede Agronomia para adicionar comentários!

Entrar em Rede Agronomia

Comentário de JOSÉ LUIZ VIANA DO COUTO 13 horas atrás

TESTE DE NORMALIDADE

A verificação se uma dada distribuição é Normal ou não, é de fundamental importância, pois irá direcionar os testes a serem feitos. A Figura abaixo apresenta uma amostra de população e, após os cálculos da amplitude (3,6), do desvio padrão (0,866) e da sua relação (4,16), uma tabela indicará, para o número de variáveis (17), se aceitamos a hipótese nula (Ho) de que a amostra pertence a uma distribuição Normal.

No caso, como o valor calculado (q = 4.16) se encaixa nos limites da tabela para n= 17 variáveis e  5% (ou 95% de probabilidade), considera-se a distribuição como Normal.

A Figura abaixo mostra a programação em R, com os cálculos do número de variáveis (n), amplitude (w), desvio padrão (s), média, mediana, relação entre amplitude e desvio padrão (q), teste Shapiro-Wilk (como valor-p=0.03 < alfa=0.05, rejeita-se Ho) e três tipos de gráficos que nos ajudam a concluir sobre a normalidade.

1) HISTOGRAMA. Se os dados pertencessem a uma distribuição Normal característica, a Média (linha tracejada cor azul) e a Mediana (linha vermelha) estariam na mesma posição. Além disso a curva seria simétrica e não influenciada por um ponto fora da curva (outlier) como ocorre à direita.

2) GRÁFICO DE CAIXA. O boxplot deixa bem claro que existe um outlier na distribuição, que interfere no valor da amplitude e não permite que a Média se sobreponha à Mediana (linha grossa horizontal na parte inferior da caixa).

3) GRÁFICO DOS QUARTIS. O QQ-Plot concorda com a indicação da quase-normalidade da distribuição, vez que os pontos azuis indicativos das variáveis, não estão perfeitamente alinhados sob a reta, além de destacar (no alto e à direita) o outlier (ponto fora da curva).

A Figura abaixo apresenta a Tabela dos valores críticos da relação Amplitude-Desvio padrão (q = w/s) para o Teste da Normalidade. Como vimos acima, considerando que o valor calculado se encontra entre os valores-limites (para n = 17 variáveis e α = 0.05), a distribuição pode ser considerada Normal.

A Tabela abaixo lista quatro outros testes de normalidade e seus resultados, evidenciando o que foi mostrado na programação do R, negando a Normalidade quando da aplicação do teste Shapiro-Wilk.

A Figura abaixo apresenta um pacote do R (fitdistrplus) cujo objetivo é colaborar com os estudos de adequação dos testes. Com um único comando, p.ex., são traçados dois gráficos automaticamente, comparando os dados da distribuição.

Comentário de JOSÉ LUIZ VIANA DO COUTO 23 horas atrás

DETECÇÃO DE VALORES EXTREMOS - TESTE DE DIXON

O teste de valor extremo de Dixon pode ser usado para testar outliers estatísticos quando o tamanho da amostra é menor ou igual a 25. Este teste considera ambos os valores extremos que são muito menores que os resto dos dados (caso 1) e valores extremos que são muito maiores que o resto dos dados (caso 2).

Este teste supõe que os dados sem o valor atípico suspeito são normalmente distribuídos; portanto, é necessário realizar um teste de normalidade nos dados sem a suspeita de um outlier antes aplicar este teste. Se os dados não forem normalmente distribuídos, transforme os dados, aplique um teste diferente, ou consulte um estatístico. As diretrizes para o teste de valor extremo estão contidas na caixa 4-15; Um exemplo desse teste está contido no Quadro 4-16.

Comentário de JOSÉ LUIZ VIANA DO COUTO sexta-feira

DISTRIBUIÇÕES ESTATÍSTICAS NO R

RESUMO:

z<-qnorm(.975)

F<-qf(.975,gln,gld)    #gln=graus de liberdade do numerador;gld=idem denominador

t<-qt(.975,n-1)

X2<-qchisq(.95,n-1)

pt(q=4.29,df=9,ncp=5)

Comentário de JOSÉ LUIZ VIANA DO COUTO quinta-feira

TESTE DE DISCORDÂNCIA

O teste de discordância pode ser usado para testar se um valor extremo é um 'ponto fora da curva' (outlier). Esse teste considera dois casos: 1) se o valor extremo (potencial outlier) é o menor valor do conjunto de dados; e 2) se o valor é o maior do conjunto. Ele pressupõe que os dados são normalmente distribuídos; portanto, é necessário realizar um teste de normalidade antes de aplicar este teste de discordância. Se os dados não forem normalmente distribuídos, transforme os dados, aplique um teste diferente ou consulte um Estatístico. Observe que o teste supõe que os dados sem o outlier são normalmente distribuídos e, portanto, o teste de normalidade deve ser realizado sem o outlier suspeito. Diretrizes e exemplo do teste estão na Figura abaixo (Box4-18 e 4-17).

Comentário de JOSÉ LUIZ VIANA DO COUTO em 8 agosto 2018 às 17:45

TESTE t PARA DUAS AMOSTRAS

CALCULADORA ON LINE PARA t:

http://onlinestatbook.com/2/calculators/t_dist.html

Comentário de JOSÉ LUIZ VIANA DO COUTO em 8 agosto 2018 às 10:05

DETECÇÃO DE VALORES EXTREMOS - TESTE DE DIXON

O teste de valor extremo de Dixon pode ser usado para testar outliers estatísticos quando o tamanho da amostra é menor ou igual a 25. Este teste considera ambos os valores extremos que são muito menores que os resto dos dados (caso 1) e valores extremos que são muito maiores que o resto dos dados (caso 2).

Este teste supõe que os dados sem o valor atípico suspeito são normalmente distribuídos; portanto, é necessário realizar um teste de normalidade nos dados sem a suspeita de um outlier antes aplicar este teste. Se os dados não forem normalmente distribuídos, transforme os dados, aplique um teste diferente, ou consulte um estatístico. As diretrizes para o teste de valor extremo estão contidas na caixa 4-15; Um exemplo desse teste está contido no Quadro 4-16.

A Figura abaixo mostra a aplicação do teste Dixons's no R. Observe que a Caixa 4-16 acima se refere ao valor C = 0,584 que, no teste, chama-se Q e tem mais casas decimais. Como este valor é maior do que o tabelado (0,477) para o nível de 5%, conclui-se que é um outlier.

Comentário de JOSÉ LUIZ VIANA DO COUTO em 7 agosto 2018 às 20:05

TESTES PARAMÉTRICOS E NÃO PARAMÉTRICOS

A grande maioria dos estudos pode ser resolvida através de uma cesta com cerca de 30 testes de mais de 100 que estão em uso. O teste a ser utilizado depende do tipo de pergunta de pesquisa que está sendo feita. Os outros fatores determinantes são o tipo de dados que estão sendo analisados e o número de grupos ou conjuntos de dados envolvidos no estudo.

COMO ESCOLHER ?

http://rcompanion.org/handbook/D_03.html

https://stats.idre.ucla.edu/other/mult-pkg/whatstat/

https://www.graphpad.com/support/faqid/1790/

http://www.biostathandbook.com/testchoice.html

http://www.dataanalytics.org.uk/Data%20Analysis/Statistics/choosing...

Comentário de JOSÉ LUIZ VIANA DO COUTO em 4 agosto 2018 às 9:41

TESTE DE WALD WOLFOWITZ

Comentário de JOSÉ LUIZ VIANA DO COUTO em 3 agosto 2018 às 9:44

ESCOLHA DO TESTE

(outra dica)

Comentário de JOSÉ LUIZ VIANA DO COUTO em 1 agosto 2018 às 15:29

TESTE DE MANN-KENDALL PARA MAIS DE 10 AMOSTRAS

Para tamanhos de amostra maiores que 10, uma aproximação normal para o teste de Mann-Kendall é muito preciso. As diretrizes para essa aproximação estão contidas no Quadro 4-9 e um exemplo é dado na Caixa 4-10. Observações vinculadas (ou seja, quando duas ou mais medições são iguais) degradam o poder estatístico e devem ser evitadas, se possível, registrando-se os dados com suficiente precisão.

Conclusão: como o valor de Z calculado (1,605) é MENOR que o valor de t tabelado (1,655), a hipótese nula (Ho) não é rejeitada e, portanto, não há evidências suficientes para determinar que há uma tendência ascendente, ao nível de 95% de probabilidade.

© 2018   Criado por Gilberto Fugimoto.   Ativado por

Badges  |  Relatar um incidente  |  Termos de serviço

Offline

Vídeo ao vivo