Rede Agronomia

Rede dos Engenheiros Agrônomos do Brasil

Por motivo do Dia Mundial do Meio Ambiente, comemorado hoje, dia 5 de Junho, eu abro este tópico para reunir algumas soluções matemáticas de problemas ligados ao meio ambiente. São extratos das minhas leituras e anotações, e visam servir de 'formulário' para quando se fizer necessário. Convido os colegas a colaborar com outros exemplos, que poderão nos ajudar em diversas áreas da Agronomia, estando o Licenciamento Ambiental na cabeça da lista. Por motivos óbvios, darei destaque nas soluções ao software (gratuito) R, ao qual já me referi em vários momentos e ocasiões aqui na Rede Agronomia.  

Mãos à obra.

Exibições: 418

Comentar

Você precisa ser um membro de Rede Agronomia para adicionar comentários!

Entrar em Rede Agronomia

Comentário de JOSÉ LUIZ VIANA DO COUTO em 10 junho 2018 às 9:47

ESTATÍSTICA DE DADOS AMBIENTAIS

A primeira coisa que se faz com um novo conjunto de dados é calcular as suas estatísticas: média, mediana, desvio padrão, coeficiente de assimetria e intervalo. Esses parâmetros resumem o ponto médio dos dados, a dispersão em torno dele, a simetria da distribuição e a diferença entre o maior e o menor valor.

Tomemos como exemplo 60 amostras de chumbo no solo do livro "Environmental Monitoring and Characterization".

Esses cálculos, feitos no software R mostram os seguintes resultados: média = 48,9 mg/kg; mediana = 31,6; desvio padrão = 56,9; coef.assimetria = 0,91; e intervalo = 301,5 mgChumbo/kgSolo.

Usando o pacote fBasics (do R) fica ainda mais fácil pois, com uma única linha de comando são calculadas todas as estatísticas básicas da série de dados. Veja na Figura abaixo:

Quando os dados são altamente assimétricos (média >> mediana), então os logaritmos dos dados podem resumir melhor as suas características. A plotagem dos dados sob a forma de gráfico de dispersão (conhecido como gráfico X Y) e o histograma (gráfico de coluna vertical 2D) também pode facilitar a interpretação da assimetria, como podemos constatar nos cálculos e desenhos da Figura abaixo. Os 2 primeiros gráficos usaram os dados normais e os outros, depois de transformados em logaritmo neperiano (LN ou log no R).

No Excel, podemos usar a janela Inserir função, da aba Fórmulas e o menu Inserir Função (fx). Ou clicar no ícone Mais Funções > Estatística, para fazer o mesmo.

Quando os pontos médios das barras verticais do Histograma são unidos entre si, formam uma Curva, como pode ser visto nas duas últimas da direita da Figura abaixo. Aliás, a Lognormal que, ao contrário da Normal, é assimétrica, se assemelha ao último gráfico da Figura acima, com a diferença que o pico da curva fica à direita e não à esquerda. Confira.

Um outro tipo de gráfico muito útil em estudos de dados ambientais é o Boxplot, visto na vertical e na horizontal da Figura abaixo. Aliás, é o único que detecta os pontos fora da curva. A média dos valores, representada pela linha grossa dentro da caixa (que contem os Quartis), quando não está no seu centro, identifica uma distribuição assimétrica, como no nosso caso.

Comentário de JOSÉ LUIZ VIANA DO COUTO em 9 junho 2018 às 10:14

ÁREA SOB A CURVA NORMAL

Esta área é formada pelos dados de uma população, dispostos verticalmente num histograma unidos por uma curva e apresenta como características principais: ter a forma de um sino e os valores máximos serem a média e a mediana, além de valerem a unidade ou 100% de probabilidade.

A distribuição de probabilidades é uma função matemática usada para descrever o padrão de variação de uma variável contínua. A função matemática que representa a distribuição normal envolve dois parâmetros (média e variância), a curva que a descreve tem forma de “sino” e sua principal propriedade é a simetria em torno da média. A Distribuição Normal ou Curva de Gauss é a mais importante em Estatística.

A normalidade dos dados pode ser analisada descritivamente por meio de histogramas, box-plots, análise da distância entre média e mediana e coeficientes de assimetria e curtose, que medem, respectivamente, o grau de desvio ou afastamento da simetria e do achatamento da distribuição. Além dos métodos descritivos, existem testes de hipóteses que avaliam a normalidade, como por exemplo, os testes de Kolmogorov-Smirnov e de Shapiro-Wilks.

Após a análise preliminar, podem ser usados testes não-paramétricos; os mais conhecidos são o Mann Whitney como alternativa ao teste t de Student, Wilcoxon como alternativa ao teste t pareado e Kruskall-Wallis como alternativa à ANOVA com um fator.

Para dados de contagem é comum usar a Distribuição de Poisson e não a Distribuição Normal. Para variáveis contínuas positivas (por exemplo, dados relacionados a medidas de tempo), podemos utilizar uma distribuição exponencial, gama ou Weibull.

A Figura abaixo mostra algumas Distribuições Estatísticas mais comuns, começando pela Distribuição Normal, da qual mostraremos algumas aplicações.

A Distribuição Normal é um dos mais importantes exemplos de distribuição contínua de probabilidade, que tem a forma de um sino e apresenta como propriedades:

  1. a) a curva é suave, unimodal e simétrica em relação à média;
  2. b) a curva tende a se aproximar do eixo horizontal à medida que x se afasta da média;
  3. c) a área total sob qualquer curva normal representa 100% de probabilidade; e
  4. d) por causa da simetria, a probabilidade de se observar um valor inferior à média é 50%, como é também a probabilidade de se observar um valor superior à média.

A Distribuição normal, com algumas variantes em seus parâmetros (μ = média e σ² = variância = desvio padrão ao quadrado) é mostrada na Figura baixo.

A chamada regra 68-95-99,7 da Curva Normal é mostrada na Figura abaixo. Significa que quando tomamos no eixo horizontal a distância equivalente à média da distribuição mais o desvio padrão (μ + σ), a área (cinza clara) sob a curva será de 68%; se considerarmos a média mais 2 desvios padrão (área cinza média), a área será de 95%; e se for média + 3 desvios (área cinza mais escuro), a área será de 99,7% de probabilidade de ocorrência.

A Distribuição Normal Reduzida ou Padronizada foi criada para facilitar os cálculos de probabilidades. Ela adota no eixo dos x valores de z obtidos da equação z = (x - μ)/σ onde z é a variável reduzida, x é a variável aleatória, μ é a média da distribuição e σ é o desvio padrão.

Estes conceitos e os exemplos abaixo constam do trabalho Estatística II, A Distribuição Normal, da Escola Superior de Administração, Marketing e Comunicação - ESAMC, que foram enxertados com a solução com o software R, para substituir o uso de Tabelas.

Exemplo 1: queremos determinar a área entre 0 e z = 1,25 ou P(0 < z < 1,25) sendo P a probabilidade de ocorrência. A Figura abaixo mostra a solução.

Como se vê, o comando pnorm(z)-0.5 do R calcula o valor sob a curva entre 0 e z (cor cinza) e que é o mesmo da Tabela da Curva Normal, à direita. Esse valor ( Área = A = 0,3944) significa que a probabilidade de ser obtido nessa distribuição é de 39%.

Exemplo 2: achar a área da curva entre z = -1 e z =1. Vide a Figura abaixo.

O valor encontrado no R e na Tabela (A = 0,3413) só vale de 0 a 1 ou do centro para a direita mas, como a curva é simétrica, o valor procurado (área cinza total) é o dobro, ou 0,6827.

Exemplo 3: achar a área entre z = 1 e z = 2. Vide Figura.

Como feito anteriormente, acha-se a área para z = 2 (chamada de Am) e para z =1 (AM), subtraindo-se depois os resultados. Assim, a área cinza vale 0,1359 ou P = 14%.

Exemplo 4: achar a área para z => 2,25 (maior ou igual). Na Figura abaixo, a área pesquisada é a cinza clara, da extrema direita da curva.

Adotando z = 2,25 basta determinar um único valor de área, entre 0 e z (0,4878) para resolver o problema, pois sabe-se que a área da metade da curva vale sempre 0,50. Logo, A = 0,50 - 0,4878 = 0,0122 = 1,2%.

Bibliografia:

http://unesav.com.br/ckfinder/userfiles/files/Apostila%20de%20Estat...

http://apps.einstein.br/revista/arquivos/PDF/1173-ECv7n1_3-4.pdf

Comentário de JOSÉ LUIZ VIANA DO COUTO em 5 junho 2018 às 15:33

O MENOR MAMÍFERO DO MUNDO

É um morcego do tamanho de uma abelha grande, conhecido como 'gatinho nariz-de-porco'. Seu nome científico é Craseonycteris thonglongyai e vive na Tailândia. Foram coletados 15 desses animais, cuja população apresenta um peso médio de 1,8 g por indivíduo. Usando o Teste t e o software R, testar a hipótese desses morcegos (cujos pesos são listados na variável x) pertencerem à mesma população.

A Figura abaixo apresenta a programação (letras vermelhas), o gráfico Boxplot (para mostrar que 3 dos 15 animais da amostra fogem do padrão estatístico), a foto do bichinho, a Curva Normal, a Tabela (que está aí só para comprovar o cálculo feito no R), as Hipóteses e a Conclusão.

(*)https://mundoestranho.abril.com.br/mundo-animal/qual-e-o-menor-mami...

© 2018   Criado por Gilberto Fugimoto.   Ativado por

Badges  |  Relatar um incidente  |  Termos de serviço

Offline

Vídeo ao vivo