Rede Agronomia

Rede dos Engenheiros Agrônomos do Brasil

Por motivo do Dia Mundial do Meio Ambiente, comemorado hoje, dia 5 de Junho, eu abro este tópico para reunir algumas soluções matemáticas de problemas ligados ao meio ambiente. São extratos das minhas leituras e anotações, e visam servir de 'formulário' para quando se fizer necessário. Convido os colegas a colaborar com outros exemplos, que poderão nos ajudar em diversas áreas da Agronomia, estando o Licenciamento Ambiental na cabeça da lista. Por motivos óbvios, darei destaque nas soluções ao software (gratuito) R, ao qual já me referi em vários momentos e ocasiões aqui na Rede Agronomia.  

Mãos à obra.

Exibições: 6772

Comentar

Você precisa ser um membro de Rede Agronomia para adicionar comentários!

Entrar em Rede Agronomia

Comentário de JOSÉ LUIZ VIANA DO COUTO em 10 setembro 2018 às 18:32

EXPRESSÕES NO R

Comentário de JOSÉ LUIZ VIANA DO COUTO em 10 setembro 2018 às 11:34

CURVA DE PRODUÇÃO DE FERTILIZANTES

No exemplo desta apostilha de R que baixei da Internet, os dados de produção de fertilizantes (que é uma curva polinomial de grau maior que 1) podem ser plotados sob a forma de pontos e da curva a eles ajustada. Veja na Figura abaixo.

Comentário de JOSÉ LUIZ VIANA DO COUTO em 7 setembro 2018 às 15:04

PÁSSAROS MIGRATÓRIOS

A massa de 10 pássaros migratórios foi medida em duas ocasiões: primeiro em Agosto, e os mesmos pássaros (marcados individualmente com anéis nas pernas e recapturados) foram medidos novamente em Setembro. Parece que os pássaros ganharam peso entre Agosto e Setembro (vide as médias) mas, essa diferença é significativa ?

Fonte: Bioestatística Usando R.

Resultado:  como pode ser visto pelas médias e os resultados de 2 testes (Wilcox e t), a hipótese nula de que as Médias dos pesos dos pássaros em Agosto é Setembro são iguais, foi rejeitada, ou seja, a Média de Setembro é significativamente maior do que a de Agosto, indicando que os pássaros ganharam peso. Nas caixas, a linha grossa é a Mediana e o sinal de "+" é a Média.

Comentário de JOSÉ LUIZ VIANA DO COUTO em 4 setembro 2018 às 19:09

TESTE DE CORRELAÇÃO ENTRE VARIÁVEIS

Quando o coeficiente de correlação (ρ) não é igual a zero na população, a exata distribuição de r fica distante da normal e a expressão r√n-2/√1-r² não segue a distribuição t de Student. Para contornar essa dificuldade, R. A. Fisher sugere a transformação-Z onde Z=1/2*log_e(1+r/1-r). Assim descobriu-se que Z segue a distribuição Normal com erro padrão 1/√n-3.

A Figura abaixo, mostra uma aplicação. A fonte é o livro "Statistics for Agricultural Sciences", Rao G.N., 2a. ed., Hyderabad, India.

Comentário de JOSÉ LUIZ VIANA DO COUTO em 3 setembro 2018 às 19:53

ESTUDO DE VENTOS NO CEARÁ

A avaliação do potencial eólico exige um conhecimento detalhado do comportamento dos ventos. Os dados relativos a esse comportamento - que auxiliam na determinação do potencial eólico de uma região - são relativos à intensidade da velocidade e à direção do vento. A geração de energia elétrica se inicia com velocidades de ventos da ordem de v = 2,5 m/s  (ou v > 8 km/h) durante pelo menos 60% do tempo. Abaixo deste valor o conteúdo energético do vento não justifica o seu aproveitamento.

Reza a bibliografia que quando o fator de forma da distribuição dos ventos k < 1.8 é alto o conteúdo de ventos termais e, se k > 2.5 é uma indicação de ventos muito constantes. O outro parâmetro da distribuição de Weibull é o fator de escala ou a velocidade média dos ventos, representado pela letra c.

A Figura abaixo mostra o histograma com os dados mensais de velocidade do vento (m/s) e as respectivas curvas real (cor cinza claro) e de Weibull (em vermelho), às quais foram acrescidas a Média (em verde) e Mediana (vermelho).

A Figura abaixo apresenta algumas aplicações da energia eólica. Tomando, p.ex., um catavento com 8 pás e 5 m de diâmetro e a velocidade média de vento calculada acima para o Ceará (v = 5.49 m/s), a potência média do vento seria de:

Pv = 0,5*1,225*19,63*5,49³ = 1.990 w ~= 2 kW (< 10 kW)

compatível, portanto com a indicação da Eletrobrás para usinas de pequeno porte.

Comentário de JOSÉ LUIZ VIANA DO COUTO em 3 setembro 2018 às 9:53

REGRESSÃO LINEAR

Os dados que se seguem (x e y) são os pesos, em miligramas, da cabeça e do corpo de 10 insetos (mosca doméstica ou Drosophila melanogaster). Calcule o coeficiente de correlação entre ambos e teste a sua significância, para a Hipótese nula: ρ = 0. A fonte é o livro "Statistics for Agricultural Sciences", Rao G.N., 2a. ed., Hyderabad, India.

Conclusão: Como t_calc.(20,58) > t_tab.(2,306) com 8 graus de liberdade (g.l.) a 5% de significância, a Hipótese nula é rejeitada, isto é, há uma correlação significativa entre as duas variáveis.

A Figura abaixo (gráfico de dispersão) confirma a correlação que existe entre os dados de peso da cabeça e do corpo deste inseto, com as amostras analisadas.

A Figura abaixo (gráfico de caixa) mostra, por outro lado, as diferenças que existem nas duas distribuições (Média), embora a Mediana, ao se localizar no centro da caixa, indique uma distribuição Normal para ambas as amostras.

A Figura abaixo mostra o resultado do Teste de Correlação de Pearson, feito com o R. Como resultado: sendo o valor-p (3.2e-08) < α (0.05), rejeita-se a Hipótese nula, isto é, há uma forte correlação (r = 0.99) entre as variáveis. Observe que o valor t (20.58) é o mesmo do calculado na Figura 1 acima.

Comentário de JOSÉ LUIZ VIANA DO COUTO em 1 setembro 2018 às 16:03

TESTE DE PROPORÇÕES

Para uma variedade particular de trigo foi estimado que 5% das plantas estavam atacadas com uma doença. Uma amostra de 600 plantas da mesma variedade foi observada e observou-se que 50 plantas estavam infectadas com a doença. Testar se os resultados da amostra estão de conformidade com a população.

A fonte é o livro "Statistics for Agricultural Sciences", Rao G.N., 2a. ed., Hyderabad, India.

Comentário de JOSÉ LUIZ VIANA DO COUTO em 30 agosto 2018 às 9:44

TESTE F PARA IGUALDADE DE DUAS VARIÂNCIAS

O teste F pode ser usado para testar se as verdadeiras Variâncias de duas populações são iguais. Normalmente, o teste F é empregado como um teste preliminar, antes de aplicar o Teste-t para a igualdade de duas Médias. As suposições subjacentes ao teste F são que as duas amostras são aleatórias independentes de duas populações normais. O teste F para a igualdade de Variâncias é altamente sensível a desvios da normalidade. Instruções para implementação do teste F com um exemplo é dado no Quadro 4-23.

Comentário de JOSÉ LUIZ VIANA DO COUTO em 28 agosto 2018 às 16:15

TESTE DE SIGNIFICÂNCIA RANQUEADO

Num certo concurso de competição de produção agrícola, dois juízes conferiram 10 notas, mostradas nas variáveis X e Y. Calcule o coeficiente de correlação entre as notas dos 2 juízes.

A fonte é o livro "Statistics for Agricultural Sciences", Rao G.N., 2a. ed., Hyderabad, India.

Hipótese nula Ho: É aquela que será testada, admite-se que a diferença observada entre a estatística amostral (estimador) e o parâmetro populacional é devido tão somente ao acaso ou seja, essa diferença não é significativa.

Hipótese alternativa H1: É aquela hipótese que contradiz a hipótese nula, isto é, aquela que será aceita caso o teste indique que Ho deva ser rejeitada sendo que, neste caso, conclui-se que a diferença citada é significativa.

A Figura abaixo mostra os cálculos aí de cima feitos com o R. A conclusão é que, como o valor de t calculado (3.07) é maior que o de t tabelado (2.31), rejeita-se a Hipótese nula (Ho), ou seja, há significativa correlação entre as notas dos 2 juízes. Foram elaborados, ainda, 2 testes: o de Wilcox e o de Kendall. Pela regra de decisão baseada no valor p mostrada acima, o teste de Wilcox aceita Ho e o de Kendall não, lembrando que α = 0.05 ou 5% de significância.

A Figura abaixo apresenta 2 gráficos (Dispersão e de Caixa) mostrando a correlação entre as notas.

FORMULÁRIO:

https://en.wikipedia.org/wiki/Test_statistic

SELEÇÃO DO TESTE:

https://www.socialresearchmethods.net/selstat/ssstart.htm

Comentário de JOSÉ LUIZ VIANA DO COUTO em 27 agosto 2018 às 11:28

UMA OPINIÃO PESSOAL

De tanto consultar o Google sobre Estatística e o uso do software R, a gente acaba aprendendo alguma coisa. Observei, p.ex., que os gráficos são uma ferramenta muito poderosa que nos ajudam a interpretar as fórmulas e as distribuições estatísticas. Os chamados "pontos fora da curva" (outliers, em inglês) são um caso típico. O boxplot (Figura abaixo) ou "caixa de bigodes" como chamam os nossos patrícios da terrinha, é o único que os identifica explicitamente. Mas não é sobre isso que eu quero falar.

No Manual de Estatística do Serviço de Proteção Ambiental dos Estados Unidos, que tenho usado como exemplo nessa série de comentários sobre Estatística, o gráfico de caixa (boxplot) a que me referi, tem uma cruzinha indicando a posição da Média, que não costuma aparecer claramente na literatura. A Mediana, por sua vez, merece destaque com a linha mais grossa cortando a caixa.

Por considerar a Média um valor (muito) importante, eu acho que o boxplot deveria destacá-la assim como faz com a Mediana. Enquanto isso não acontece, sugiro que se "copie" o "+" dos americanos, exatamente no ponto do gráfico onde deve aparecer. Além disso, não custa nada mostrar o seu valor. Para isso (no caso do post que iniciou esta série), sugiro que se coloque próximo ao sinal, o símbolo da Média, que costuma ser o dígito x com traço em cima (lê-se "X-barra"), seguido do seu valor, previamente calculado.

O texto em vermelho, PrtScn do console do R, mostra como se faz. Bom proveito e bons estudos. Na quarta linha, o valor cex=1.7 nada tem a ver com a média mas sim, que a cruz deve ter um valor 70% maior que o normal, para que a espessura do traço se aproxime ao da linha que representa a Mediana.

© 2022   Criado por Gilberto Fugimoto.   Ativado por

Badges  |  Relatar um incidente  |  Termos de serviço