Série Pandas

Neste artigo, exploraremos o que é a série Pandas , como ela funciona e como usá-la com exemplos .

Pandas é uma biblioteca popular de análise de dados em Python que fornece várias estruturas de dados para trabalhar com dados tabulares e de séries temporais. Uma das estruturas de dados mais usadas no Pandas é a Series.



Série Pandas – O que é?

Uma série Pandas é um objeto unidimensional semelhante a uma matriz que pode conter qualquer tipo de dados. É semelhante a uma lista ou array do Python, mas com algumas funcionalidades e recursos adicionais.

Uma série consiste em duas partes principais – um índice e uma matriz de dados.

O índice é um conjunto de rótulos que identificam cada elemento da matriz de dados . Por padrão, o índice é uma sequência de inteiros começando em 0, mas também pode ser especificado como qualquer outro tipo de valor, como datas, strings ou até mesmo outros arrays.


Como criar uma série Pandas?

Uma série Pandas pode ser criada a partir de uma lista, um dicionário , uma matriz ou qualquer outro objeto semelhante a uma sequência.

Existe uma analogia entre uma série Pandas e uma coluna em uma tabela.

É uma matriz unidimensional que pode conter qualquer tipo de dados, independentemente do seu tipo.

Para criar uma Série, podemos usar a função construtora Series() .

Utilize a lista de maiúsculas para fazer uma série básica do Pandas com o método Series():

Example: 

1
2
3
4
5
6
7
import pandas as pds
capitals = ["Washington","London","Berlin","Paris","Islamabad","Rome"]
mrx = pds.Series(capitals)
print(mrx)
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

Aqui está um exemplo de como você pode construir uma série básica de Pandas a partir de uma lista:

Example: 

1
2
3
4
5
6
7
import pandas as pds
leagues = ["Major League Soccer","Premier League","La Liga","Serie A","Süper Lig"]
mrx = pds.Series(leagues)
print(mrx)
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

Etiquetas

Os valores são rotulados com seus números de índice se nenhuma outra informação for fornecida. O primeiro elemento contém o índice 0, o segundo elemento contém o índice 1, etc.

Um determinado item pode ser obtido através desta etiqueta.

Recupere o primeiro item da série de maiúsculas:

Example: 

1
2
3
4
5
6
7
import pandas as pds
capitals = ["Washington","London","Berlin","Paris","Islamabad","Rome"]
mrx = pds.Series(capitals)
print(mrx[0])
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

Da série de ligas, exiba os três itens iniciais:

Example: 

1
2
3
4
5
6
7
8
9
import pandas as pds
leagues = ["Major League Soccer","Premier League","La Liga","Serie A","Süper Lig"]
mrx = pds.Series(leagues)
print(mrx[0])
print(mrx[1])
print(mrx[2])
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

Criar etiquetas

Você pode dar nomes aos seus rótulos personalizados por meio do argumento index.

Você pode fazer suas etiquetas pessoais da seguinte maneira:

Example: 

1
2
3
4
5
6
7
import pandas as pds
evenNum = [0, 2, 4, 6, 8, 10]
mrx = pds.Series(evenNum, index = ["a", "b", "c", "d", "e", "f"])
print(mrx)
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

Com o índice de argumento opcional, personalize seu próprio rótulo:

Example: 

1
2
3
4
5
6
7
import pandas as pds
palindrome = [101, 252, 14541, 333, 87979, 21112]
mrx = pds.Series(palindrome, index = ["p1", "p2", "p3", "p4", "p5", "p6"])
print(mrx)
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

Através de suas etiquetas personalizadas, você pode localizar itens identificando-os em suas etiquetas.

Exibir o valor do índice “a”:

Example: 

1
2
3
4
5
6
7
import pandas as pds
evenNum = [0, 2, 4, 6, 8, 10]
mrx = pds.Series(evenNum, index = ["a", "b", "c", "d", "e", "f"])
print(mrx["a"])
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

Mostre os palíndromos nos locais “p2”, “p3” e “p5”:

Example: 

1
2
3
4
5
6
7
8
9
import pandas as pds
palindrome = [101, 252, 14541, 333, 87979, 21112]
mrx = pds.Series(palindrome, index = ["p1", "p2", "p3", "p4", "p5", "p6"])
print(mrx["p2"])
print(mrx["p3"])
print(mrx["p5"])
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

Objetos de chave/valor como série

Ao criar uma série, você também pode utilizar um objeto de valor-chave, como um dicionário.

Aplique o dicionário de bilionários para fazer uma série básica do Pandas com o método Series():

Example: 

1
2
3
4
5
6
7
8
import pandas as pds
billionaires = {"1": "Bernard Arnault", "2": "Elon Musk", "3":
"Bill Gates", "4":"Jeff Bezos"}
mrx = pds.Series(billionaires)
print(mrx)
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
Lembrete : No dicionário, as chaves representam os rótulos e os rótulos representam as palavras.

Veja a seguir um exemplo de como você pode gerar uma série básica do Pandas a partir de um dicionário:

Example: 

1
2
3
4
5
6
7
import pandas as pds
leagues = {"United States of America":"Major League Soccer", "England":"Premier League", "Spain":"La Liga","Italy":"Serie A"}
mrx = pds.Series(leagues)
print(mrx)
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

É possível selecionar apenas alguns dos elementos do dicionário por meio do argumento index e, a seguir, indicar apenas os elementos que você deseja que apareçam na série.

Faça uma série utilizando apenas valores de “ 2 ” e “ 3 ” no seguinte dicionário:

Example: 

1
2
3
4
5
6
7
8
import pandas as pds
billionaires = {"1": "Bernard Arnault", "2": "Elon Musk", "3":
"Bill Gates", "4":"Jeff Bezos"}
mrx = pds.Series(billionaires, index = ["2", "3"])
print(mrx)
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

No dicionário de ligas a seguir, gere uma série cujos dados sejam apenas dos índices abaixo.

Example: 

1
2
3
4
5
6
7
import pandas as pds
leagues = {"United States of America":"Major League Soccer", "England":"Premier League", "Spain":"La Liga","Italy":"Serie A"}
mrx = pds.Series(leagues, index = ["United States of America", "England", "Spain"])
print(mrx)
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

DataFrames

Um conjunto de dados do Pandas é geralmente uma tabela multidimensional conhecida como DataFrame.

É importante observar que uma Series é semelhante a uma coluna, enquanto um DataFrame é como uma tabela em sua totalidade.

Construa um DataFrame billionaires_data da série “rank” e “name”:

Example: 

1
2
3
4
5
6
7
8
9
10
import pandas as pds
billionaires_data = {
"rank": [1, 2, 3, 4],
"name": ["Bernard Arnault", "Elon Musk", "Bill Gates", "Jeff Bezos"]
}
mrx = pds.DataFrame(billionaires_data)
print(mrx)
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

Crie um conjunto de dados de leagues_data implementando a função DataFrame() :

Example: 

1
2
3
4
5
6
7
8
9
10
import pandas as pds
leagues_data = {
"Country": ["United States of America", "England", "Spain", "Italy"],
"League name": ["Major League Soccer", "Premier League", "La Liga", "Serie A"]
}
mrx = pds.DataFrame(leagues_data)
print(mrx)
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

Exemplo de Explicação

O código acima importa a biblioteca pandas e cria um dicionário leagues_data que contém informações sobre quatro ligas de futebol diferentes em países diferentes.

As chaves no dicionário representam os diferentes atributos das ligas, como “ País ” e “Nome da liga”, e os valores associados a essas chaves são listas de strings que contêm os dados reais.

O código então usa a função pds.DataFrame() para converter o dicionário leagues_data em um Pandas DataFrame mrx. Este DataFrame possui duas colunas “Country” e “League name”, com os valores do dicionário original como linhas.

Nós valorizamos o seu feedback.
+1
0
+1
0
+1
0
+1
0
+1
0
+1
0
+1
0

Assine a nossa newsletter
Digite seu e-mail para receber um resumo semanal de nossos melhores posts. Saber mais!
ícone