Série Pandas
Neste artigo, exploraremos o que é a série Pandas , como ela funciona e como usá-la com exemplos .
Pandas é uma biblioteca popular de análise de dados em Python que fornece várias estruturas de dados para trabalhar com dados tabulares e de séries temporais. Uma das estruturas de dados mais usadas no Pandas é a Series.
Série Pandas – O que é?
Uma série Pandas é um objeto unidimensional semelhante a uma matriz que pode conter qualquer tipo de dados. É semelhante a uma lista ou array do Python, mas com algumas funcionalidades e recursos adicionais.
Uma série consiste em duas partes principais – um índice e uma matriz de dados.
O índice é um conjunto de rótulos que identificam cada elemento da matriz de dados . Por padrão, o índice é uma sequência de inteiros começando em 0, mas também pode ser especificado como qualquer outro tipo de valor, como datas, strings ou até mesmo outros arrays.
Como criar uma série Pandas?
Uma série Pandas pode ser criada a partir de uma lista, um dicionário , uma matriz ou qualquer outro objeto semelhante a uma sequência.
Existe uma analogia entre uma série Pandas e uma coluna em uma tabela.
É uma matriz unidimensional que pode conter qualquer tipo de dados, independentemente do seu tipo.
Para criar uma Série, podemos usar a função construtora Series() .
Utilize a lista de maiúsculas para fazer uma série básica do Pandas com o método Series():
Example:
Aqui está um exemplo de como você pode construir uma série básica de Pandas a partir de uma lista:
Example:
Etiquetas
Os valores são rotulados com seus números de índice se nenhuma outra informação for fornecida. O primeiro elemento contém o índice 0, o segundo elemento contém o índice 1, etc.
Um determinado item pode ser obtido através desta etiqueta.
Recupere o primeiro item da série de maiúsculas:
Example:
Da série de ligas, exiba os três itens iniciais:
Example:
Criar etiquetas
Você pode dar nomes aos seus rótulos personalizados por meio do argumento index.
Você pode fazer suas etiquetas pessoais da seguinte maneira:
Example:
Com o índice de argumento opcional, personalize seu próprio rótulo:
Example:
Através de suas etiquetas personalizadas, você pode localizar itens identificando-os em suas etiquetas.
Exibir o valor do índice “a”:
Example:
Mostre os palíndromos nos locais “p2”, “p3” e “p5”:
Example:
Objetos de chave/valor como série
Ao criar uma série, você também pode utilizar um objeto de valor-chave, como um dicionário.
Aplique o dicionário de bilionários para fazer uma série básica do Pandas com o método Series():
Example:
Veja a seguir um exemplo de como você pode gerar uma série básica do Pandas a partir de um dicionário:
Example:
É possível selecionar apenas alguns dos elementos do dicionário por meio do argumento index e, a seguir, indicar apenas os elementos que você deseja que apareçam na série.
Faça uma série utilizando apenas valores de “ 2 ” e “ 3 ” no seguinte dicionário:
Example:
No dicionário de ligas a seguir, gere uma série cujos dados sejam apenas dos índices abaixo.
Example:
DataFrames
Um conjunto de dados do Pandas é geralmente uma tabela multidimensional conhecida como DataFrame.
É importante observar que uma Series é semelhante a uma coluna, enquanto um DataFrame é como uma tabela em sua totalidade.
Construa um DataFrame billionaires_data da série “rank” e “name”:
Example:
Crie um conjunto de dados de leagues_data implementando a função DataFrame() :
Example:
Exemplo de Explicação
O código acima importa a biblioteca pandas e cria um dicionário leagues_data que contém informações sobre quatro ligas de futebol diferentes em países diferentes.
As chaves no dicionário representam os diferentes atributos das ligas, como “ País ” e “Nome da liga”, e os valores associados a essas chaves são listas de strings que contêm os dados reais.
O código então usa a função pds.DataFrame() para converter o dicionário leagues_data em um Pandas DataFrame mrx. Este DataFrame possui duas colunas “Country” e “League name”, com os valores do dicionário original como linhas.