Rede Agronomia

Rede dos Engenheiros Agrônomos do Brasil

Por motivo do Dia Mundial do Meio Ambiente, comemorado hoje, dia 5 de Junho, eu abro este tópico para reunir algumas soluções matemáticas de problemas ligados ao meio ambiente. São extratos das minhas leituras e anotações, e visam servir de 'formulário' para quando se fizer necessário. Convido os colegas a colaborar com outros exemplos, que poderão nos ajudar em diversas áreas da Agronomia, estando o Licenciamento Ambiental na cabeça da lista. Por motivos óbvios, darei destaque nas soluções ao software (gratuito) R, ao qual já me referi em vários momentos e ocasiões aqui na Rede Agronomia.  

Mãos à obra.

Exibições: 520

Comentar

Você precisa ser um membro de Rede Agronomia para adicionar comentários!

Entrar em Rede Agronomia

Comentário de JOSÉ LUIZ VIANA DO COUTO em 9 agosto 2018 às 18:43

TESTE DE DISCORDÂNCIA

O teste de discordância pode ser usado para testar se um valor extremo é um 'ponto fora da curva' (outlier). Esse teste considera dois casos: 1) se o valor extremo (potencial outlier) é o menor valor do conjunto de dados; e 2) se o valor é o maior do conjunto. Ele pressupõe que os dados são normalmente distribuídos; portanto, é necessário realizar um teste de normalidade antes de aplicar este teste de discordância. Se os dados não forem normalmente distribuídos, transforme os dados, aplique um teste diferente ou consulte um Estatístico. Observe que o teste supõe que os dados sem o outlier são normalmente distribuídos e, portanto, o teste de normalidade deve ser realizado sem o outlier suspeito. Diretrizes e exemplo do teste estão na Figura abaixo (Box4-18 e 4-17).

Comentário de JOSÉ LUIZ VIANA DO COUTO em 8 agosto 2018 às 17:45

TESTE t PARA DUAS AMOSTRAS

CALCULADORA ON LINE PARA t:

http://onlinestatbook.com/2/calculators/t_dist.html

Comentário de JOSÉ LUIZ VIANA DO COUTO em 8 agosto 2018 às 10:05

DETECÇÃO DE VALORES EXTREMOS - TESTE DE DIXON

O teste de valor extremo de Dixon pode ser usado para testar outliers estatísticos quando o tamanho da amostra é menor ou igual a 25. Este teste considera ambos os valores extremos que são muito menores que os resto dos dados (caso 1) e valores extremos que são muito maiores que o resto dos dados (caso 2).

Este teste supõe que os dados sem o valor atípico suspeito são normalmente distribuídos; portanto, é necessário realizar um teste de normalidade nos dados sem a suspeita de um outlier antes aplicar este teste. Se os dados não forem normalmente distribuídos, transforme os dados, aplique um teste diferente, ou consulte um estatístico. As diretrizes para o teste de valor extremo estão contidas na caixa 4-15; Um exemplo desse teste está contido no Quadro 4-16.

A Figura abaixo mostra a aplicação do teste Dixons's no R. Observe que a Caixa 4-16 acima se refere ao valor C = 0,584 que, no teste, chama-se Q e tem mais casas decimais. Como este valor é maior do que o tabelado (0,477) para o nível de 5%, conclui-se que é um outlier.

Comentário de JOSÉ LUIZ VIANA DO COUTO em 7 agosto 2018 às 20:05

TESTES PARAMÉTRICOS E NÃO PARAMÉTRICOS

A grande maioria dos estudos pode ser resolvida através de uma cesta com cerca de 30 testes de mais de 100 que estão em uso. O teste a ser utilizado depende do tipo de pergunta de pesquisa que está sendo feita. Os outros fatores determinantes são o tipo de dados que estão sendo analisados e o número de grupos ou conjuntos de dados envolvidos no estudo.

COMO ESCOLHER ?

http://rcompanion.org/handbook/D_03.html

https://stats.idre.ucla.edu/other/mult-pkg/whatstat/

https://www.graphpad.com/support/faqid/1790/

http://www.biostathandbook.com/testchoice.html

http://www.dataanalytics.org.uk/Data%20Analysis/Statistics/choosing...

Comentário de JOSÉ LUIZ VIANA DO COUTO em 4 agosto 2018 às 9:41

TESTE DE WALD WOLFOWITZ

Comentário de JOSÉ LUIZ VIANA DO COUTO em 3 agosto 2018 às 9:44

ESCOLHA DO TESTE

(outra dica)

Comentário de JOSÉ LUIZ VIANA DO COUTO em 1 agosto 2018 às 15:29

TESTE DE MANN-KENDALL PARA MAIS DE 10 AMOSTRAS

Para tamanhos de amostra maiores que 10, uma aproximação normal para o teste de Mann-Kendall é muito preciso. As diretrizes para essa aproximação estão contidas no Quadro 4-9 e um exemplo é dado na Caixa 4-10. Observações vinculadas (ou seja, quando duas ou mais medições são iguais) degradam o poder estatístico e devem ser evitadas, se possível, registrando-se os dados com suficiente precisão.

Conclusão: como o valor de Z calculado (1,605) é MENOR que o valor de t tabelado (1,655), a hipótese nula (Ho) não é rejeitada e, portanto, não há evidências suficientes para determinar que há uma tendência ascendente, ao nível de 95% de probabilidade.

Comentário de JOSÉ LUIZ VIANA DO COUTO em 31 julho 2018 às 15:38

MÉDIA APARADA

Média aparada é aquela calculada a partir de um conjunto de dados do qual foram retirados os valores extremos (discrepantes - outliers), em igual quantidade, no início e no final da série, depois de ordenada, do menor para o maior valor. Normalmente esses valores correspondem de 2,5% a 5% dos valores observados. Ex.: {200,250,250,300,450,460,2300} e média (aparada): x(m=1)=(250+250+300+450+460)÷5=342, sendo 'm' o número de valores 'aparados', no início (valor 200) e no final (valor 2300).

Na estimativa de uma média populacional, muitas vezes, os valores extremos da distribuição (correspondentes aos dados das caudas da curva) precisam ser descartados, a fim de que os resultados não seja mascarados. Nos dados ambientais, os dados não detectados, em geral, ocorrem na cauda esquerda. O método de Atchison é usado neste caso para ajustar o média e variância.

A Figura abaixo apresenta os cálculos do box anterior feitos no R. Duas explicações se fazem necessárias. Como pode ser visto nos dados do exemplo acima, os três dados não detectados (ND) iniciam a lista, e não constam da série abaixo (dados x), razão porque, como já haviam sido retirados, parece que só foram suprimidos os 3 dados do final. A Média sem os 6 dados que foram suprimidos da série, foi calculada no R com o comando mean(xa, trim=pp) onde pp é a relação 3(calculado pelo Método de Atchison) ÷ 21 (número de variáveis sem os 3 valores  não detectados) = 0.14 (ou 14%). 

A Figura abaixo apresenta o roteiro para os cálculos do box acima.

A Figura abaixo mostra a programação em R para a plotagem do gráfico com os dados após a retirada dos valores extremos.

Comentário de JOSÉ LUIZ VIANA DO COUTO em 29 julho 2018 às 11:19

ROTEIRO PARA A ESCOLHA DOS TESTES

Comentário de JOSÉ LUIZ VIANA DO COUTO em 26 julho 2018 às 9:57

TESTE DE TENDÊNCIA PARA PEQUENAS AMOSTRAS

O Teste de Mann-Kendall trabalha com a hipótese de que as observações da série possuem tendência monotônica no tempo (ou seja, há tendência), enquanto que a hipótese nula é que as observações são independentes e identicamente distribuídas.

A Figura abaixo apresenta dois pacotes do R (trend e Kendall) que abordam o método. Tanto no primeiro como no segundo o valor-p = 0,3 e 0,2 > α = 0,05 (5%) sugere que seja rejeitada a Hipótese nula (Ho) e conclui-se que há tendência na série.

O teste aplicado no final, cujo valor T = 8 significa o número de sinais positivos mostrado na Figura anterior, mostra um valor de p diferente da Tabela para n = 5 (número de variáveis) e S = 8 - 2 = 6, exibida abaixo.

Chamando os dados (data) de x e o tempo (time) de w, o comando (R): Kendall(x,w) resulta em:

tau = 0.6, s-sided pvalue = 0.22067

© 2018   Criado por Gilberto Fugimoto.   Ativado por

Badges  |  Relatar um incidente  |  Termos de serviço

Offline

Vídeo ao vivo