Compreendendo os histogramas do Matplotlib

Ao explorar a análise de dados, você pode encontrar histogramas Matplotlib , que são gráficos que exibem a distribuição de frequência de seu conjunto de dados. Esses gráficos de barras usam o eixo x para representar o intervalo de valores e o eixo y para representar a frequência ou a contagem de observações que se enquadram nesse intervalo.

Como analista de dados, você pode achar que os histogramas são uma representação gráfica útil de seus dados que exibem a distribuição de frequência de um conjunto de variáveis ​​contínuas ou discretas.

Eles podem ajudá-lo a explorar a forma, a dispersão e a tendência central do seu conjunto de dados. Felizmente, você pode usar o Matplotlib, uma poderosa biblioteca Python para visualização de dados, para criar e personalizar histogramas com inúmeras funções.

Se você estiver interessado em aprender mais sobre os benefícios e recursos dos histogramas Matplotlib, bem como ver exemplos de como usá-los, este artigo é para você.



Histograma MatplotlibName

Ao usar o Matplotlib para visualização de dados, você pode aproveitar a função hist() para criar histogramas. Essa função usa seu conjunto de dados como entrada, calcula a distribuição de frequência dividindo-a em compartimentos e gera um gráfico de barras em que a altura de cada barra representa a frequência dos pontos de dados que se enquadram nesse compartimento.

Embora o Matplotlib ofereça uma variedade de tipos de histogramas, todos eles servem ao mesmo propósito: ilustrar as distribuições de frequência. Especificamente, os histogramas mostram com que frequência determinados valores ou intervalos de valores ocorrem em seu conjunto de dados.

Com um histograma, você pode visualizar facilmente o número de pontos de dados dentro de um determinado período de tempo, sem a necessidade de interpretar valores de dados brutos.

Exemplo : Se você fornecer informações sobre a idade do número de pacientes, provavelmente obterá um histograma parecido com este:

Histograma MatplotlibName

De acordo com o histograma, os resultados prováveis ​​são:

  • Alguns pacientes da faixa etária de 20 a 30 anos
  • Alguns pacientes da faixa etária de 40 a 50 anos
  • Alguns pacientes da faixa etária de 60 a 70 anos

Criar um histograma

Para criar histogramas Matplotlib, você pode usar a função hist() de forma a gerar o gráfico necessário. Especificamente, você precisará fornecer à função uma matriz de números, que ela usará para construir o histograma.

Para tornar esse processo mais eficiente, você pode usar o NumPy para construir uma matriz de 400 valores. Por padrão, esta matriz focará no número 90, com um desvio padrão de 40.

À medida que continuar aprendendo sobre aprendizado de máquina, você obterá mais informações sobre a distribuição normal de dados , o que pode ajudá-lo a interpretar os resultados de seus histogramas.

Ao aproveitar o NumPy, você pode calcular facilmente a distribuição normal de dados, fornecendo uma compreensão mais abrangente do seu conjunto de dados.

Example: 

1
2
3
4
5
6
import numpy as npy
mrx = npy.random.normal(90, 40, 400)
print(mrx)
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

No exemplo a seguir, aplique a média = 320 e o desvio padrão = 280 :

Example: 

1
2
3
4
5
6
import numpy as npy
mrx = npy.random.normal(320, 280, 50)
print(mrx)
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

Nos histogramas do Matplotlib, a função hist() pega a matriz e gera um histograma:

Exibir o histograma básico.

Example: 

1
2
3
4
5
6
7
8
import matplotlib.pyplot as pt
import numpy as npy
mrx = npy.random.normal(60, 90, 5)
pt.hist(mrx)
pt.show()
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

Utilize a função de distribuição normal numpy no histograma abaixo.

Example: 

1
2
3
4
5
6
7
8
import matplotlib.pyplot as pt
import numpy as npy
mrx = npy.random.normal(320, 280, 50)
pt.hist(mrx)
pt.show()
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

Exemplo de Explicação

No exemplo acima, usamos Python e a biblioteca Matplotlib para gerar um gráfico de histograma de um conjunto de dados. Aqui está um detalhamento de cada linha de código que usamos:

  1. Primeiro, importamos a biblioteca Matplotlib usando import matplotlib.pyplot como pt , dando a ela o alias mais curto pt por conveniência.
  2. Em seguida, importamos a biblioteca NumPy usando import numpy as npy , também dando a ela um alias mais curto de npy.
  3. Para criar o conjunto de dados, usamos a função random.normal() do NumPy , gerando 50 números aleatórios extraídos de uma distribuição normal com média de 320 e desvio padrão de 280. Atribuímos esse conjunto de dados à variável mrx.
  4. Usando a função hist() do Matplotlib , criamos um gráfico de histograma dos dados em mrx .
  5. Por fim, exibimos o gráfico de histograma resultante usando pt.show() .

Os histogramas são uma maneira útil de representar visualmente a distribuição de dados, exibindo a contagem de observações em cada intervalo ou “caixa” no eixo y e o intervalo de dados no eixo x. As barras no histograma representam a frequência de observações em cada caixa. Neste exemplo, criamos um conjunto de dados aleatório usando NumPy e geramos um gráfico de histograma para exibir sua distribuição usando Matplotlib.


Benefícios dos Histogramas Matplotlib

  1. Os histogramas são uma maneira útil de representar visualmente a distribuição de dados. Os histogramas Matplotlib podem criar gráficos claros e informativos que exibem a frequência de pontos de dados em vários intervalos ou compartimentos.
  2. Os histogramas Matplotlib são altamente personalizáveis, com várias opções disponíveis para ajustar a aparência do gráfico. Os usuários podem modificar o tamanho do compartimento, cor e outros parâmetros para atender às suas necessidades.
  3. Os histogramas Matplotlib funcionam perfeitamente com matrizes NumPy, permitindo que os usuários trabalhem com grandes conjuntos de dados e analisem estruturas de dados complexas.
  4. Os histogramas Matplotlib podem acomodar uma ampla gama de tipos de dados , incluindo dados contínuos e categóricos, tornando-os uma ferramenta versátil para análise de dados.
  5. Os histogramas do Matplotlib podem ser combinados com outros gráficos do Matplotlib, como gráficos de linhas ou gráficos de dispersão, para criar visualizações mais complexas que revelam informações mais profundas sobre os dados.
  6. Existem muitos exemplos e recursos disponíveis online para ajudar os usuários a aprender como usar os histogramas Matplotlib de forma eficaz, tornando mais fácil começar a usar esta poderosa ferramenta.

Conclusão

Os histogramas Matplotlib são uma ferramenta útil e poderosa que pode representar visualmente a distribuição de dados . Eles são personalizáveis, funcionam bem com matrizes NumPy, suportam vários tipos de dados e podem ser combinados com outros gráficos Matplotlib para criar visualizações mais complexas. Existem muitos exemplos e recursos disponíveis online, que tornam os histogramas Matplotlib uma opção acessível e flexível para análise e visualização de dados.

Nós valorizamos o seu feedback.
+1
0
+1
0
+1
0
+1
0
+1
0
+1
0
+1
0

Assine a nossa newsletter
Digite seu e-mail para receber um resumo semanal de nossos melhores posts. Saber mais!
ícone