Rede Agronomia

Rede dos Engenheiros Agrônomos do Brasil

Por motivo do Dia Mundial do Meio Ambiente, comemorado hoje, dia 5 de Junho, eu abro este tópico para reunir algumas soluções matemáticas de problemas ligados ao meio ambiente. São extratos das minhas leituras e anotações, e visam servir de 'formulário' para quando se fizer necessário. Convido os colegas a colaborar com outros exemplos, que poderão nos ajudar em diversas áreas da Agronomia, estando o Licenciamento Ambiental na cabeça da lista. Por motivos óbvios, darei destaque nas soluções ao software (gratuito) R, ao qual já me referi em vários momentos e ocasiões aqui na Rede Agronomia.  

Mãos à obra.

Exibições: 520

Comentar

Você precisa ser um membro de Rede Agronomia para adicionar comentários!

Entrar em Rede Agronomia

Comentário de JOSÉ LUIZ VIANA DO COUTO em 25 agosto 2018 às 11:49

ESCOLHA DO TESTE

Comentário de JOSÉ LUIZ VIANA DO COUTO em 24 agosto 2018 às 9:20

INTERVALOS DE CONFIANÇA PARA UMA ÚNICA VARIÂNCIA

Esta seção discute intervalos de confiança para uma única variância ou desvio padrão para analistas interessados ​​na precisão das estimativas de variância. Esta informação pode ser necessária para realizar uma análise de sensibilidade do teste estatístico ou método de análise. O método descrito na Caixa 4-22 pode ser usado para encontrar um intervalo de confiança de dois lados com 100 (1 - α)%. O ponto final superior de um intervalo de confiança 100 (1 - α)% frente e verso é um limite de confiança superior de 100 (1 - α/2)% e ponto final mais baixo de um intervalo de confiança 100 (1 - α)% de dois lados é uma confiança de 100 (1 - α/2)% menor limite. Por exemplo, o ponto final superior de um intervalo de confiança de 90% é uma confiança superior de 95% limite e o ponto final inferior é um limite de confiança 95% menor. Como o desvio padrão é a raiz quadrada da variância, um intervalo de confiança para a variância pode ser convertido em intervalo de confiança para o desvio padrão, tomando as raízes quadradas dos pontos finais do intervalo. Este intervalo de confiança pressupõe que os dados constituem uma amostra aleatória de um população normalmente distribuída e pode ser altamente sensível a outliers e a desvios da normalidade.

A Figura abaixo mostra o cálculo da Média e da Mediana da amostra e, como são praticamente os mesmos, sugere uma distribuição Normal. Em seguida, procedeu-se ao teste de Shapiro-Wilk de normalidade e, como o valor-p foi superior a α = 0.05, aplicou-se em seguida o teste t para uma amostra. No primeiro caso (p > α) a hipótese nula foi aceita, o que não aconteceu no segundo teste. Para tirar definitivamente a dúvida, houve uma pequena Assimetria positiva de 0.21, indicando que a distribuição não é Normal.

Comentário de JOSÉ LUIZ VIANA DO COUTO em 23 agosto 2018 às 16:22

AMOSTRAS PAREADAS - t TEST

Um experimento agrícola foi conduzido à campo numa Escola de Agronomia da Índia, para comparar dois tipos de gramíneas em parcelas vizinhas de 5 x 2 m em cada replicação. Os pesos das gramas por parcela (em kg) na colheita foram anotados nas 7 replicações. Testar se houve uma diferença significativa entre as duas gramas, em relação às suas respectivas colheitas. A Hipótese nula é de igualdade (Ho: μ1 = μ2). Empregar o teste t.

A fonte é o livro "Statistics for Agricultural Sciences", Rao G.N., 2a. ed., Hyderabad, India.

Conclusão:  t (calculado) > t (tabulado), (2.447) com 6 g.l. e  nível de significância de 5%. No teste t, o valor-p (0.01) < α (0.05), o que confirma o resultado. A hipótese nula é rejeitada. Existe diferença significativa entre as duas gramíneas em relação ao rendimento. O gráfico de caixa confirma que as duas amostras são bem diferentes quanto às suas Médias e Medianas.

A Figura abaixo mostra o gráfico de caixa (boxplot) das duas gramas, para ressaltar a grande diferença entre as Médias e Medianas das duas distribuições. Observe que enquanto a Mediana (traço grosso) da grama 1 mede 1.95 a da grama 2 coincide com o valor da Média, o que indica uma distribuição Normal.

Comentário de JOSÉ LUIZ VIANA DO COUTO em 22 agosto 2018 às 15:35

ALTURA DE ALUNOS

Quando a hipótese a ser testada é unilateral como μ1>μ2 ou μ1<μ2 em vez de μ1=μ2, o teste da hipótese será ligeiramente mudado uma vez que temos de considerar apenas um dos lados da curva normal padrão ou distribuição t porque as diferenças com base em 'as amostras podem ser + ve ou - ve de cada vez. o A hipótese unilateral é mostrada na Figura abaixo.

Aqui, o valor calculado de Z (ou t) é comparado com valor tabelado de Z (ou t), respectivamente, a um nível de 2,5% significância que corresponde a 5 por cento de significância no caso dos dois lados. Similarmente nível de significância de 1% correspondendo a 2% de significância nos dois lados caso.

A fonte é o livro "Statistics for Agricultural Sciences", Rao G.N., 2a. ed., Hyderabad, India.

Comentário de JOSÉ LUIZ VIANA DO COUTO em 22 agosto 2018 às 15:31

MAIS UM BOM LIVRO DE ESTATÍSTICA

Nas minhas andanças pelo Pai dos Burros (Google), descobri mais um bom livro de Estatística Ambiental; dessa vez, da Índia. Assim, passarei a dividir os exemplos apresentados com o livro americano.

 

Comentário de JOSÉ LUIZ VIANA DO COUTO em 19 agosto 2018 às 11:45

TESTE DE ROSNER PARA OUTLIERS

O teste do Rosner é usado para identificar até 10 outliers. O teste assume que a população tem uma distribuição normal. Se uma distribuição lognormal é mais plausível, todos os cálculos devem ser realizados nos logaritmos dos dados. Portanto, uma nova série deve ser criada e valores logarítmicos calculados com a função de Transformação da Série. A abordagem de Rosner é projetada para evitar o mascaramento de um outlier por outro. O mascaramento ocorre quando um valor atípico não é detectado porque é muito próximo em valor a outro outlier.

O número máximo de outliers detectados é 10. O procedimento exclui repetidamente o valor mais distante da média e recomputa a estatística de teste após cada exclusão. Uma tabela é usada para avaliar a estatística de teste. O teste de Rosner é bicaudal, pois o procedimento identifica dados suspeitos, grandes ou suspeitosamente pequenos.

Comentário de JOSÉ LUIZ VIANA DO COUTO em 16 agosto 2018 às 10:01

Teste de Normalidade (continuação)

A Figura abaixo resume os três principais tipos de distribuição, tendo ao lado a disposição dos dados em relação à linha de tendência (QQ-Plot); de cima pra baixo: 1) Normal, 2) Assimétrica à direita e 3) Assimétrica à esquerda

A Figura abaixo mostra um outro pacote do R (fBasics) para testar a Normalidade de uma distribuição. O comando skewness(x) mede a Assimetria da distribuição. Lembre-se que uma distribuição tipicamente Normal, não existe assimetria, pois os dados se apresentam no gráfico em forma de sino (Curva de Gauss), que é simétrica. A Assimetria de x fica à direita.

O Shapiro-Wilk é um teste de Normalidade do R. Ele tem 3 tipos de apresentação: a) usando só a variável; b) usando os valores da média e desvio padrão da distribuição; e c) usando os valores mínimo e máximo da série. Observe que ele deu negativo (não aceitou a Normalidade) em a e c e positivo em b (valor-p > α).

Dados circulares são dados que indicam uma orientação angular (por exemplo, de que maneira um animal está voltado ou em movimento, que pode ser medido em graus ou radianos) ou um evento periódico (por exemplo, ritmos circadianos). A Figura abaixo mostra uma aplicação do pacote circular do r com os dados da variável x. Os pontos no círculo indicam a normalidade da distribuição; assim, se a distribuição em causa fosse Normal, os pontos estariam igualmente espaçados ao longo do círculo, o que não acontece.

Outra forma de apresentação do gráfico do pacote circular, apontando para o valor da média.

Comentário de JOSÉ LUIZ VIANA DO COUTO em 14 agosto 2018 às 19:45

TESTE DE NORMALIDADE

A verificação se uma dada distribuição é Normal ou não, é de fundamental importância, pois irá direcionar os testes a serem feitos. A Figura abaixo apresenta uma amostra de população e, após os cálculos da amplitude (3,6), do desvio padrão (0,866) e da sua relação (4,16), uma tabela indicará, para o número de variáveis (17), se aceitamos a hipótese nula (Ho) de que a amostra pertence a uma distribuição Normal.

No caso, como o valor calculado (q = 4.16) se encaixa nos limites da tabela para n= 17 variáveis e  5% (ou 95% de probabilidade), considera-se a distribuição como Normal.

A Figura abaixo mostra a programação em R, com os cálculos do número de variáveis (n), amplitude (w), desvio padrão (s), média, mediana, relação entre amplitude e desvio padrão (q), teste Shapiro-Wilk (como valor-p=0.03 < alfa=0.05, rejeita-se Ho) e três tipos de gráficos que nos ajudam a concluir sobre a normalidade.

1) HISTOGRAMA. Se os dados pertencessem a uma distribuição Normal característica, a Média (linha tracejada cor azul) e a Mediana (linha vermelha) estariam na mesma posição. Além disso a curva seria simétrica e não influenciada por um ponto fora da curva (outlier) como ocorre à direita.

2) GRÁFICO DE CAIXA. O boxplot deixa bem claro que existe um outlier na distribuição, que interfere no valor da amplitude e não permite que a Média se sobreponha à Mediana (linha grossa horizontal na parte inferior da caixa).

3) GRÁFICO DOS QUARTIS. O QQ-Plot concorda com a indicação da quase-normalidade da distribuição, vez que os pontos azuis indicativos das variáveis, não estão perfeitamente alinhados sob a reta, além de destacar (no alto e à direita) o outlier (ponto fora da curva).

A Figura abaixo apresenta a Tabela dos valores críticos da relação Amplitude-Desvio padrão (q = w/s) para o Teste da Normalidade. Como vimos acima, considerando que o valor calculado se encontra entre os valores-limites (para n = 17 variáveis e α = 0.05), a distribuição pode ser considerada Normal.

A Tabela abaixo lista quatro outros testes de normalidade e seus resultados, evidenciando o que foi mostrado na programação do R, negando a Normalidade quando da aplicação do teste Shapiro-Wilk.

A Figura abaixo apresenta um pacote do R (fitdistrplus) cujo objetivo é colaborar com os estudos de adequação dos testes. Com um único comando, p.ex., são traçados dois gráficos automaticamente, comparando os dados da distribuição.

Comentário de JOSÉ LUIZ VIANA DO COUTO em 14 agosto 2018 às 9:58

DETECÇÃO DE VALORES EXTREMOS - TESTE DE DIXON

O teste de valor extremo de Dixon pode ser usado para testar outliers estatísticos quando o tamanho da amostra é menor ou igual a 25. Este teste considera ambos os valores extremos que são muito menores que os resto dos dados (caso 1) e valores extremos que são muito maiores que o resto dos dados (caso 2).

Este teste supõe que os dados sem o valor atípico suspeito são normalmente distribuídos; portanto, é necessário realizar um teste de normalidade nos dados sem a suspeita de um outlier antes aplicar este teste. Se os dados não forem normalmente distribuídos, transforme os dados, aplique um teste diferente, ou consulte um estatístico. As diretrizes para o teste de valor extremo estão contidas na caixa 4-15; Um exemplo desse teste está contido no Quadro 4-16.

Comentário de JOSÉ LUIZ VIANA DO COUTO em 10 agosto 2018 às 19:33

DISTRIBUIÇÕES ESTATÍSTICAS NO R

RESUMO:

z<-qnorm(.975)

F<-qf(.975,gln,gld)    #gln=graus de liberdade do numerador;gld=idem denominador

t<-qt(.975,n-1)

X2<-qchisq(.95,n-1)

pt(q=4.29,df=9,ncp=5)

© 2018   Criado por Gilberto Fugimoto.   Ativado por

Badges  |  Relatar um incidente  |  Termos de serviço

Offline

Vídeo ao vivo