Rede Agronomia

Rede dos Engenheiros Agrônomos do Brasil

Por motivo do Dia Mundial do Meio Ambiente, comemorado hoje, dia 5 de Junho, eu abro este tópico para reunir algumas soluções matemáticas de problemas ligados ao meio ambiente. São extratos das minhas leituras e anotações, e visam servir de 'formulário' para quando se fizer necessário. Convido os colegas a colaborar com outros exemplos, que poderão nos ajudar em diversas áreas da Agronomia, estando o Licenciamento Ambiental na cabeça da lista. Por motivos óbvios, darei destaque nas soluções ao software (gratuito) R, ao qual já me referi em vários momentos e ocasiões aqui na Rede Agronomia.  

Mãos à obra.

Exibições: 487

Comentar

Você precisa ser um membro de Rede Agronomia para adicionar comentários!

Entrar em Rede Agronomia

Comentário de JOSÉ LUIZ VIANA DO COUTO em 12 julho 2018 às 19:12

BOXPLOT DA USEPA

O Boxplot ou Caixa de bigodes é um diagrama esquemático útil na visualização de importantes variáveis estatísticas, mostrando detalhes da distribuição. A versão norte-americana mostra a Média como uma cruz; os valores mínimo e máximo são ligados à caixa por linha cheia (em vex de pontilhada) e não apresentam segmentos de reta no final; e os outliers (pontos 'fora da curva') são representados por asteriscos e não por bolinhas.

A Figura abaixo lista 22 amostras de Trifluorine (em ppm), com o traçado do Boxplot com os 5 valores notáveis (Mínimo, 1o. Quartil, Mediana, 3o. Quartil e Máximo), mostrando como foi calculado o Intervalo Inter Quartil: IQR = Q3 - Q1.

A Figura abaixo mostra a programação em R com o cálculo da Média e do IQR (Intervalo Inter-Quartil em inglês) e, abaixo, o traçado do Boxplot, onde foram acrescidos os valores notáveis e a Média que, normalmente, não aparecem no traçado comum.

A Figura abaixo mostra como se gera um Boxplot, em 5 passos.

Comentário de JOSÉ LUIZ VIANA DO COUTO em 11 julho 2018 às 18:39

GRÁFICO DE FOLHAS E CAULE

É usado para mostrar os valores numéricos e informações sobre a distribuição dos dados, sendo útil  para armazenar dados de forma compacta e, ao mesmo tempo, classificar os dados do menor para o maior. Por outro lado, é subjetiva, pois requer que o analista faça algumas escolhas arbitrárias com relação ao particionamento dos dados. A Figura abaixo apresenta um exemplo do emprego deste gráfico.

A Figura abaixo mostra como se apresentam os dados e como se faz a leitura do Gráfico de Caule-e-Folha. Observe que no Caule os dados são dispostos de cima para baixo e do menor para o maior e, na Folha, horizontalmente, da esquerda para a direita e (também) do menor para o maior. A amplitude é a diferença entre os valores extremos: 41 - 15 = 26.

Como pode ser visto, cada observação (dado) consiste de 2 partes: o caule e as folhas. O caule é formado pelo primeiro dígito (1,2,3,4,etc.) e as folhas pelos dígitos que lhe ficam à direita, em sequência. O caule pode ser mudado, aumentando-se ou diminuindo-se os dígitos a serem usados,dividindo-se os agrupamentos da haste (ou seja, todos os números que iniciam com um dado dígito (p.ex., 6) podem ser divididos em agrupamentos menores) ou multiplicam-se os dados por um fator constante (p.ex., multiplicando-o por 10 ou 100). Os dados não detectados podem ser colocados num único caule.

A Figura abaixo mostra os dados do Box 2-12 (com os dados do Box 2-10) transformados em Gráfico de Caule e folhas pelo R com o comando stem(x) e, em seguida, com stem (x,scale=2) para que fiquem mais próximos do que foi apresentado na Figura inicial.

Na Figura acima, o caule 0 (zero) representa o intervalo de classe de zero a 0.09; o caule 1 representa o intervalo entre 1 e 10; o caule 2 entre 20 e 30; e assim por diante. Com a escala 2, o intervalo de 4 a 9 foi dividido em de 4 a 5 e de 5 a 9.

O gráfico de caule-e-folha mostra uma distribuição de dados aproximada. Assim, p.ex., a Distribuição Normal tem a forma aproximada de um sino, enquanto as demais podem parecer assimétricas. No caso da Assimetria à esquerda, o gráfico reúne o maior volume de dados no topo do caule e menos dados ficam espalhados na parte inferior do gráfico.

Um gerador deste tipo de gráfico está disponível no endereço abaixo:

https://www.calculatorsoup.com/calculators/statistics/stemleaf.php

Comentário de JOSÉ LUIZ VIANA DO COUTO em 9 julho 2018 às 19:44

TRAÇADO DO HISTOGRAMA

O histograma, também conhecido como Distribuição de Frequências, é a representação gráfica em colunas (barras ou retângulos) de um conjunto de dados previamente tabulados e divididos em classes. A base de cada retângulo, no eixo horizontal ou dos x, representa uma classe da variável em estudo. A altura das barras, no eixo vertical ou dos y, representa a quantidade ou frequência absoluta com que o valor da classe ocorre no conjunto de dados para as classes uniformes, ou a densidade da frequência para as classes não uniformes.

A Figura abaixo mostra, com um exemplo, os 6 passos para o traçado de um histograma e que, na grande maioria das vezes é um processo automático quando se utiliza como ferramenta o Excel ou o R (Figura 2).

O histograma fornece um meio de se avaliar a simetria e a variabilidade dos dados, que estão relacionadas às várias distribuições estatísticas. Na Distribuição Normal (Curva de Gauss), os dados apresentam tal simetria, que os retângulos, em conjunto, se assemelham a um sino, cujo ponto máximo reúne: a média, mediana e a moda. Por outro lado, nas Distribuições Assimétricas, há sempre um lado da curva maior que o outro e, quando a cúpula do sino fica à esquerda, diz-se que há uma 'assimetria à direita ou positiva'; e vice-versa.  O achatamento lateral do sino indica a Curtose e, quando ele é grande, diz-se que a curtose é alta.

A Figura abaixo mostra a solução do problema apresentado no box 2-10 com a ajuda do software R.

A Figura abaixo mostra os 6 passos para a construção do Histograma que, como dissemos acima, basta um comando em R (hist(x)) para ser executado imediata e automaticamente.

Comentário de JOSÉ LUIZ VIANA DO COUTO em 9 julho 2018 às 10:01

COEFICIENTE DE CORRELAÇÃO DE PEARSON

O Coeficiente de Correlação de Pearson mede a relação linear entre duas variáveis. No caso acima, as leituras (Reading) são medições de poluição tomadas de um aterro sanitário e os períodos de tempo (Time Periods) em que foram feitas, correspondem às distâncias, em linha reta, a partir da borda do aterro. Assim, o número 1 indica que às 12:00 hs foi tomada a medida de 6,5 num ponto situado a 10 pés (ou 3,5 m); o número 2: às 13:00 hs foi medido 6,6 a 7,0 m de distância; e assim por diante.

O Coeficiente de correlação linear diz que quando uma variável aumenta, a outra também; e vice versa (se uma diminui, a outra também faz o mesmo). Os valores variam de +1 (correlação positiva) a -1 (correlação negativa), e a interpretação dos intervalos entre esses extremos consta da tabelinha mostrada na Figura abaixo.

O Coeficiente de Correlação de Pearson, que na Figura inicial vale r = 0,432 (classificada como Regular pela tabelinha da Figura acima) foi calculado com 7 casas decimais com o comando cor.test() ou a abreviação de teste de correlação, em inglês.

O gráfico de dispersão pode ser utilizado para nos mostrar e dizer se o coeficiente é significativo ou não. Este coeficiente pode ser sensível à presença de um ou dois valores extremos que possam existir na amostra, em especial quando o número de variáveis é pequeno (N < 30).

Comentário de JOSÉ LUIZ VIANA DO COUTO em 7 julho 2018 às 18:01

MEDIDAS DE ASSOCIAÇÃO

Os dados sempre incluem medidas de muitas características (variáveis) em cada amostra pontual e ha interesse em conhecer a relação ou o nível de associação entre duas ou mais variáveis. Uma das medidas mais comuns de associação é o Coeficiente de Correlação. Ele mede a relação entre duas variáveis, como acontece com a Relação Linear entre dois grupos de medições. Na Figura acima o coeficiente vale r = 0,948 (forte) e na Figura de baixo é chamado de rho = 0,9486833 pelo Método de Spearman.

Comentário de JOSÉ LUIZ VIANA DO COUTO em 6 julho 2018 às 18:37

MEDIDAS DE TENDÊNCIA CENTRAL

As medidas de tendência central são a Média, a Mediana e a Moda. A Média é a soma das variáveis dividida pelo seu número; a Mediana é o valor que divide a distribuição em partes iguais; e a Moda é o valor que mais se repete.

A Figura abaixo mostra os cálculos feitos com o software R lembrando que, no caso da Moda, os valores 4 e 3 indicam que a variável 4, que é a medida, se repete por 3 vezes na amostra.  O comando fivenum (cinco-números) serve para discriminar no gráfico de caixa (boxplot) os 5 valores notáveis de uma distribuição que são: 1) o menor ou mínimo, 2) Q1 ou primeiro Quartil, 3) Mediana ou segundo Quartil, 4) Q3 ou terceiro Quartil, e 5) o maior ou máximo valor da amostra. No caso em pauta, Min. = Q1 = Moda.   

Outra observação é que o gráfico (boxplot) não costuma vir acompanhado de qualquer número ou texto e, também, não apresenta a Média. Nós o fizemos, via programação, para fins didáticos.

Comentário de JOSÉ LUIZ VIANA DO COUTO em 5 julho 2018 às 16:42

CÁLCULO DO PERCENTIL

Comentário de JOSÉ LUIZ VIANA DO COUTO em 4 julho 2018 às 19:21

ÁREA CONTAMINADA

Comentário de JOSÉ LUIZ VIANA DO COUTO em 3 julho 2018 às 15:42

(Para ficar mais legível)

Comentário de JOSÉ LUIZ VIANA DO COUTO em 2 julho 2018 às 16:38

CURVAS DE DISTRIBUIÇÃO

© 2018   Criado por Gilberto Fugimoto.   Ativado por

Badges  |  Relatar um incidente  |  Termos de serviço

Offline

Vídeo ao vivo