Pridanie nového stĺpca do existujúceho DataFrame v Pandas
Pridanie nových stĺpcov do existujúceho DataFrame je základnou úlohou pri analýze údajov pandy . Umožňuje vám obohatiť vaše údaje o ďalšie informácie a uľahčiť ďalšiu analýzu a manipuláciu. Tento článok preskúma rôzne metódy pridávania nových stĺpcov, vrátane jednoduchého priradenia insert()> metóda, assign()> metóda. Poďme diskutovať o pridávaní nových stĺpcov do existujúceho DataFrame Pandas.
Čo je Pandas DataFrame?
A DataFrame Pandas je dvojrozmerná, veľkosťou meniteľná, potenciálne heterogénna tabuľková dátová štruktúra s označenými osami (riadky a stĺpce). Je to základná dátová štruktúra v ekosystéme vedy o údajoch Python a poskytuje výkonný spôsob práce s tabuľkovými údajmi.
Tu sú niektoré kľúčové vlastnosti Pandas DataFrame:
- Reprezentácia údajov: Ukladá údaje vo formáte tabuľky s riadkami a stĺpcami.
- Heterogénne typy údajov: Môže obsahovať rôzne typy údajov v rôznych stĺpcoch (napr. celé čísla, pohyblivé čísla, reťazce, boolovské hodnoty).
- Označenie: Každý riadok a stĺpec má označenie (názvy indexov a stĺpcov).
- Meniteľné: Umožňuje manipuláciu a úpravu údajov.
- Výkonné operácie: Poskytuje rôzne funkcie a metódy na analýzu, manipuláciu a prieskum údajov.
- Rozšíriteľné: Dá sa prispôsobiť a rozšíriť o ďalšie funkcie prostredníctvom knižníc a užívateľsky definovaných funkcií.
Existuje niekoľko spôsobov, ako pridať nový stĺpec do existujúceho dátového rámca v Pandas Python :
- Vytvorenie vzorového dátového rámca
- Používaním Dataframe.insert() metóda
- Používaním Dataframe.assign() metóda
- Používanie slovníka
- Pomocou zoznamu
- Použitím .miesto()
- Pridanie viac ako jedného stĺpca do existujúceho dátového rámca
Vytvorenie vzorového dátového rámca
Tu vytvárame vzorový dátový rámec:
Python3
import> pandas as pd> data> => {> 'Name'> : [> 'Jai'> ,> 'Princi'> ,> 'Gaurav'> ,> 'Anuj'> ],> > 'Height'> : [> 5.1> ,> 6.2> ,> 5.1> ,> 5.2> ],> > 'Qualification'> : [> 'Msc'> ,> 'MA'> ,> 'Msc'> ,> 'Msc'> ]}> df> => pd.DataFrame(data)> print> (df)> |
Výkon:
Name Height Qualification 0 Jai 5.1 Msc 1 Princi 6.2 MA 2 Gaurav 5.1 Msc 3 Anuj 5.2 Msc
Upozorňujeme, že dĺžka vášho zoznamu by sa mala zhodovať s dĺžkou stĺpca indexu, inak sa zobrazí chyba.
Pridajte nový stĺpec do existujúceho dátového rámca pomocou DataFrame.insert()
Poskytuje slobodu pridať stĺpec na ľubovoľnú pozíciu, ktorá sa nám páči, nielen na konci. Poskytuje tiež rôzne možnosti vkladania hodnôt stĺpcov.
Python3
import> pandas as pd> # Define a dictionary containing Students data> data> => {> 'Name'> : [> 'Jai'> ,> 'Princi'> ,> 'Gaurav'> ,> 'Anuj'> ],> > 'Height'> : [> 5.1> ,> 6.2> ,> 5.1> ,> 5.2> ],> > 'Qualification'> : [> 'Msc'> ,> 'MA'> ,> 'Msc'> ,> 'Msc'> ]}> # Convert the dictionary into DataFrame> df> => pd.DataFrame(data)> # Using DataFrame.insert() to add a column> df.insert(> 2> ,> 'Age'> , [> 21> ,> 23> ,> 24> ,> 21> ],> True> )> # Observe the result> print> (df)> |
Výkon:
Name Height Age Qualification 0 Jai 5.1 21 Msc 1 Princi 6.2 23 MA 2 Gaurav 5.1 24 Msc 3 Anuj 5.2 21 Msc
Pridanie stĺpcov do Pandas DataFrame pomocou Dataframe.assign()
Táto metóda vytvorí nový dátový rámec s novým stĺpcom pridaným do starého dátového rámca.
Python3
import> pandas as pd> # Define a dictionary containing Students data> data> => {> 'Name'> : [> 'Jai'> ,> 'Princi'> ,> 'Gaurav'> ,> 'Anuj'> ],> > 'Height'> : [> 5.1> ,> 6.2> ,> 5.1> ,> 5.2> ],> > 'Qualification'> : [> 'Msc'> ,> 'MA'> ,> 'Msc'> ,> 'Msc'> ]}> # Convert the dictionary into DataFrame> df> => pd.DataFrame(data)> # Using 'Address' as the column name and equating it to the list> df2> => df.assign(address> => [> 'Delhi'> ,> 'Bangalore'> ,> 'Chennai'> ,> 'Patna'> ])> print> (df2)> |
Výkon:
Name Height Qualification address 0 Jai 5.1 Msc Delhi 1 Princi 6.2 MA Bangalore 2 Gaurav 5.1 Msc Chennai 3 Anuj 5.2 Msc Patna
Pandy Pridať stĺpec do DataFrame pomocou slovníka
Môžeme použiť a Pythonský slovník na pridanie nového stĺpca do pandas DataFrame. Použite existujúci stĺpec ako kľúčové hodnoty a ich príslušné hodnoty budú hodnotami pre nový stĺpec.
Python3
# Import pandas package> import> pandas as pd> # Define a dictionary containing Students data> data> => {> 'Name'> : [> 'Jai'> ,> 'Princi'> ,> 'Gaurav'> ,> 'Anuj'> ],> > 'Height'> : [> 5.1> ,> 6.2> ,> 5.1> ,> 5.2> ],> > 'Qualification'> : [> 'Msc'> ,> 'MA'> ,> 'Msc'> ,> 'Msc'> ]}> # Define a dictionary with key values of> # an existing column and their respective> # value pairs as the # values for our new column.> address> => {> 'Delhi'> :> 'Jai'> ,> 'Bangalore'> :> 'Princi'> ,> > 'Patna'> :> 'Gaurav'> ,> 'Chennai'> :> 'Anuj'> }> # Convert the dictionary into DataFrame> df> => pd.DataFrame(data)> # Provide 'Address' as the column name> df[> 'Address'> ]> => address> # Observe the output> print> (df)> |
Výkon:
Name Height Qualification Address 0 Jai 5.1 Msc Delhi 1 Princi 6.2 MA Bangalore 2 Gaurav 5.1 Msc Chennai 3 Anuj 5.2 Msc Patna
Pridanie nového stĺpca do dátového rámca Pandas pomocou zoznamu
V tomto príklade Pandy pridávajú nové stĺpce zo zoznamu Adresa do existujúceho Pandas DataFrame pomocou slovníka a zoznamu.
Python3
# Declare a list that is to be converted into a column> address> => [> 'Delhi'> ,> 'Bangalore'> ,> 'Chennai'> ,> 'Patna'> ]> # Using 'Address' as the column name> # and equating it to the list> df[> 'Address'> ]> => address> print> (df)> |
Výkon:
Name Height Qualification Address 0 Jai 5.1 Msc Delhi 1 Princi 6.2 MA Bangalore 2 Gaurav 5.1 Msc Chennai 3 Anuj 5.2 Msc Patna
Pridajte nový stĺpec do existujúceho dátového rámca Pandas pomocou Dataframe.loc()
V tomto príklade vytvorí Pandas DataFrame s názvom df> so stĺpcami Názov, Výška a Kvalifikácia a pridá nový stĺpec Adresa pomocou loc> atribút.
Python3
import> pandas as pd> data> => {> 'Name'> : [> 'Jai'> ,> 'Princi'> ,> 'Gaurav'> ,> 'Anuj'> ],> > 'Height'> : [> 5.1> ,> 6.2> ,> 5.1> ,> 5.2> ],> > 'Qualification'> : [> 'Msc'> ,> 'MA'> ,> 'Msc'> ,> 'Msc'> ]}> df> => pd.DataFrame(data)> # Create the list of new column values> address> => [> 'Delhi'> ,> 'Bangalore'> ,> 'Chennai'> ,> 'Patna'> ]> # Add the new column using loc> df.loc[:,> 'Address'> ]> => address> print> (df)> |
Výkon:
Name Height Qualification Address 0 Jai 5.1 Msc Delhi 1 Princi 6.2 MA Bangalore 2 Gaurav 5.1 Msc Chennai 3 Anuj 5.2 Msc Patna
Pridanie viac ako jedného stĺpca do existujúceho dátového rámca
V tomto príklade rozširuje existujúci DataFrame Pandas df> s dvoma novými stĺpcami, Vek a Stav, pomocou príslušných zoznamov údajov.
Python3
import> pandas as pd> data> => {> 'Name'> : [> 'Jai'> ,> 'Princi'> ,> 'Gaurav'> ,> 'Anuj'> ],> > 'Height'> : [> 5.1> ,> 6.2> ,> 5.1> ,> 5.2> ],> > 'Qualification'> : [> 'Msc'> ,> 'MA'> ,> 'Msc'> ,> 'Msc'> ],> > 'Address'> : [> 'Delhi'> ,> 'Bangalore'> ,> 'Chennai'> ,> 'Patna'> ]}> df> => pd.DataFrame(data)> # Define new data for additional columns> age> => [> 22> ,> 25> ,> 23> ,> 24> ]> state> => [> 'NCT'> ,> 'Karnataka'> ,> 'Tamil Nadu'> ,> 'Bihar'> ]> # Add multiple columns using dictionary assignment> new_data> => {> 'Age'> : age,> 'State'> : state }> df> => df.assign(> *> *> new_data)> print> (df)> |
Výkon:
Name Height Qualification Address Age State 0 Jai 5.1 Msc Delhi 22 NCT 1 Princi 6.2 MA Bangalore 25 Karnataka 2 Gaurav 5.1 Msc Chennai 23 Tamil Nadu 3 Anuj 5.2 Msc Patna 24 Bihar
Záver
Pochopenie toho, ako pridať nové stĺpce do DataFrames, je nevyhnutné pre prieskum údajov a manipuláciu s nimi v Pandas. Výber vhodnej metódy závisí od konkrétneho kontextu a požadovaného výsledku. Osvojením si týchto techník môžete efektívne manipulovať, analyzovať a získavať cenné poznatky z vašich údajov.