Pandas DataFrames
O objetivo deste artigo é explicar o que são Pandas DataFrames , como implementá-los e manipulá-los e algumas operações importantes que eles podem executar.
Pandas DataFrame – o que é?
É importante entender que um Pandas Dataframe é uma estrutura de dados bidimensional, como uma matriz bidimensional ou uma tabela com colunas e linhas como em uma planilha.
Existem várias maneiras de criar um Pandas DataFrame. O método mais comum é passar um dicionário de listas de comprimento igual ou matrizes NumPy como parâmetro de dados para o construtor DataFrame.
Utilizando Pandas, gere um DataFrame employee_detail da seguinte forma:
Example:
Faça um Pandas student_detail DataFrame chamando a função DataFrame() da seguinte maneira:
Example:
Pandas Dataframes - Linha
Os Pandas Dataframes são semelhantes a uma tabela com uma linha e uma coluna, como você pode observar na saída acima.
Uma ou mais linhas podem ser recuperadas pelo Pandas através do atributo loc
Exiba a primeira linha (índice 0) do DataFrame employee_detail:
Example:
Mostre os detalhes do quarto aluno índice:
Example:
Recupere os dados dos três primeiros funcionários do conjunto de dados employee_detail:
Example:
A partir do conjunto de dados student_detail, exiba os dados do índice 3 e 4:
Example:
Índices nomeados
Você pode fornecer identidade para seus índices personalizados com o argumento index.
Atribua um nome a uma linha individual fornecendo uma lista de nomes:
Example:
Personalize os índices do conjunto de dados course_detail:
Example:
Fazendo referência ao atributo loc , você pode recuperar a(s) linha(s) solicitada(s).
Mostre as informações do aluno índice “102”:
Example:
Do conjunto de dados course_detail, recupere os dados do índice “9991” e “9994”:
Example:
Dados de arquivos em DataFrame
Os Pandas podem carregar conjuntos de dados contidos em arquivos em DataFrames.
Utilizando um arquivo CSV como entrada para um DataFrame, você pode carregar um arquivo de valor separado por vírgula da seguinte maneira:
Example:
Defina “RANKING” como um título de índice:
Example:
Exemplo de Explicação
O código de exemplo acima lê um arquivo CSV chamado 'language_data.csv' usando a função read_csv() da biblioteca pandas e cria um DataFrame pandas chamado mrx_df . O método set_index() é então usado para definir a coluna ' RANKING ' como o índice do DataFrame.
O DataFrame mrx_df resultante é então impresso no console usando a função print() . Este DataFrame conterá todos os dados do arquivo CSV, mas com a coluna 'RANKING' usada como índice.
Ao definir a coluna 'RANKING' como o índice, o DataFrame pode ser consultado de maneira fácil e eficiente com base na classificação de diferentes linguagens de programação. Isso facilita a realização de análises e visualizações dos dados.