Dodajanje novega stolpca obstoječemu DataFrame v Pandas

Dodajanje novih stolpcev obstoječemu DataFrame je temeljna naloga pri analizi podatkov z uporabo Pande . Omogoča vam, da svoje podatke obogatite z dodatnimi informacijami in olajšate nadaljnje analize in manipulacije. Ta članek bo raziskal različne metode za dodajanje novih stolpcev, vključno s preprosto dodelitvijo, insert()> metoda, assign()> metoda. Pogovorimo se o dodajanju novih stolpcev obstoječemu Pandas DataFrame.

Kaj je Pandas DataFrame?

A Pandas DataFrame je dvodimenzionalna, velikostno spremenljiva, potencialno heterogena tabelarična podatkovna struktura z označenimi osmi (vrstice in stolpci). Je temeljna podatkovna struktura v ekosistemu podatkovne znanosti Python in zagotavlja zmogljiv način za delo s tabelarnimi podatki.

Tukaj je nekaj ključnih funkcij Pandas DataFrame:

  • Predstavitev podatkov: Shranjuje podatke v obliki tabele z vrsticami in stolpci.
  • Heterogeni tipi podatkov: Lahko vsebuje različne tipe podatkov v različnih stolpcih (npr. cela števila, plavajoče vrednosti, nize, logične vrednosti).
  • Označevanje: Vsaka vrstica in stolpec ima oznako (imena indeksa in stolpca).
  • Spremenljiv: Omogoča manipulacijo in spreminjanje podatkov.
  • Močne operacije: Zagotavlja različne funkcije in metode za analizo podatkov, manipulacijo in raziskovanje.
  • Razširljivo: Lahko se prilagodi in razširi z dodatnimi funkcijami prek knjižnic in uporabniško definiranih funkcij.

Obstaja več načinov za dodajanje novega stolpca obstoječemu DataFrame v Pandas in Python :

  • Ustvarjanje vzorčnega podatkovnega okvira
  • Z uporabo Dataframe.insert() metoda
  • Z uporabo Dataframe.assign() metoda
  • Uporaba slovarja
  • Uporaba seznama
  • Uporaba .place()
  • Dodajanje več kot enega stolpca v obstoječi podatkovni okvir

Ustvarjanje vzorčnega podatkovnega okvira

Tukaj ustvarjamo vzorčni podatkovni okvir:

Python3




import> pandas as pd> data> => {> 'Name'> : [> 'Jai'> ,> 'Princi'> ,> 'Gaurav'> ,> 'Anuj'> ],> > 'Height'> : [> 5.1> ,> 6.2> ,> 5.1> ,> 5.2> ],> > 'Qualification'> : [> 'Msc'> ,> 'MA'> ,> 'Msc'> ,> 'Msc'> ]}> df> => pd.DataFrame(data)> print> (df)>

Izhod:

   Name Height Qualification     0    Jai 5.1 Msc   1    Princi 6.2 MA   2   Gaurav 5.1 Msc   3   Anuj 5.2 Msc 

Upoštevajte, da se mora dolžina vašega seznama ujemati z dolžino stolpca indeksa, sicer bo prikazana napaka.

Dodajte nov stolpec obstoječemu okvirju Datframe z uporabo DataFrame.insert()

Omogoča svobodo dodajanja stolpca na poljubnem položaju in ne le na koncu. Ponuja tudi različne možnosti za vstavljanje vrednosti stolpcev.

Python3




import> pandas as pd> # Define a dictionary containing Students data> data> => {> 'Name'> : [> 'Jai'> ,> 'Princi'> ,> 'Gaurav'> ,> 'Anuj'> ],> > 'Height'> : [> 5.1> ,> 6.2> ,> 5.1> ,> 5.2> ],> > 'Qualification'> : [> 'Msc'> ,> 'MA'> ,> 'Msc'> ,> 'Msc'> ]}> # Convert the dictionary into DataFrame> df> => pd.DataFrame(data)> # Using DataFrame.insert() to add a column> df.insert(> 2> ,> 'Age'> , [> 21> ,> 23> ,> 24> ,> 21> ],> True> )> # Observe the result> print> (df)>

Izhod:

  Name Height Age Qualification     0   Jai 5.1 21 Msc   1   Princi 6.2 23 MA   2   Gaurav 5.1 24 Msc   3    Anuj 5.2 21 Msc 

Dodajanje stolpcev v Pandas DataFrame z uporabo Dataframe.assign()

Ta metoda bo ustvarila nov podatkovni okvir z novim stolpcem, dodanim staremu podatkovnemu okvirju.

Python3




import> pandas as pd> # Define a dictionary containing Students data> data> => {> 'Name'> : [> 'Jai'> ,> 'Princi'> ,> 'Gaurav'> ,> 'Anuj'> ],> > 'Height'> : [> 5.1> ,> 6.2> ,> 5.1> ,> 5.2> ],> > 'Qualification'> : [> 'Msc'> ,> 'MA'> ,> 'Msc'> ,> 'Msc'> ]}> # Convert the dictionary into DataFrame> df> => pd.DataFrame(data)> # Using 'Address' as the column name and equating it to the list> df2> => df.assign(address> => [> 'Delhi'> ,> 'Bangalore'> ,> 'Chennai'> ,> 'Patna'> ])> print> (df2)>

Izhod:

   Name Height Qualification address     0    Jai 5.1 Msc Delhi   1    Princi 6.2 MA Bangalore   2    Gaurav 5.1 Msc Chennai   3    Anuj 5.2 Msc Patna 

Pandas Dodaj stolpec v DataFrame s pomočjo slovarja

Uporabimo lahko a Slovar Python da dodate nov stolpec v pandas DataFrame. Uporabite obstoječi stolpec kot ključne vrednosti in njihove ustrezne vrednosti bodo vrednosti za nov stolpec.

Python3




# Import pandas package> import> pandas as pd> # Define a dictionary containing Students data> data> => {> 'Name'> : [> 'Jai'> ,> 'Princi'> ,> 'Gaurav'> ,> 'Anuj'> ],> > 'Height'> : [> 5.1> ,> 6.2> ,> 5.1> ,> 5.2> ],> > 'Qualification'> : [> 'Msc'> ,> 'MA'> ,> 'Msc'> ,> 'Msc'> ]}> # Define a dictionary with key values of> # an existing column and their respective> # value pairs as the # values for our new column.> address> => {> 'Delhi'> :> 'Jai'> ,> 'Bangalore'> :> 'Princi'> ,> > 'Patna'> :> 'Gaurav'> ,> 'Chennai'> :> 'Anuj'> }> # Convert the dictionary into DataFrame> df> => pd.DataFrame(data)> # Provide 'Address' as the column name> df[> 'Address'> ]> => address> # Observe the output> print> (df)>

Izhod:

  Name Height Qualification Address     0   Jai 5.1 Msc Delhi   1   Princi 6.2 MA Bangalore   2   Gaurav 5.1 Msc Chennai   3    Anuj 5.2 Msc Patna 

Dodajanje novega stolpca v Pandas DataFrame z uporabo seznama

V tem primeru Pande dodajo nove stolpce s seznama Naslov na obstoječi Pandas DataFrame z uporabo slovarja in seznama.

Python3




# Declare a list that is to be converted into a column> address> => [> 'Delhi'> ,> 'Bangalore'> ,> 'Chennai'> ,> 'Patna'> ]> # Using 'Address' as the column name> # and equating it to the list> df[> 'Address'> ]> => address> print> (df)>

Izhod:

  Name Height Qualification Address     0   Jai 5.1 Msc Delhi   1   Princi 6.2 MA Bangalore   2   Gaurav 5.1 Msc Chennai   3    Anuj 5.2 Msc Patna 

Dodajte nov stolpec obstoječemu Pandas DataFrame z uporabo Dataframe.loc()

V tem primeru ustvari Pandas DataFrame z imenom df> s stolpci Ime, Višina in Kvalifikacija ter doda nov stolpec Naslov z uporabo loc> atribut.

Python3




import> pandas as pd> data> => {> 'Name'> : [> 'Jai'> ,> 'Princi'> ,> 'Gaurav'> ,> 'Anuj'> ],> > 'Height'> : [> 5.1> ,> 6.2> ,> 5.1> ,> 5.2> ],> > 'Qualification'> : [> 'Msc'> ,> 'MA'> ,> 'Msc'> ,> 'Msc'> ]}> df> => pd.DataFrame(data)> # Create the list of new column values> address> => [> 'Delhi'> ,> 'Bangalore'> ,> 'Chennai'> ,> 'Patna'> ]> # Add the new column using loc> df.loc[:,> 'Address'> ]> => address> print> (df)>

Izhod:

  Name Height Qualification Address     0    Jai 5.1 Msc Delhi   1   Princi 6.2 MA Bangalore   2   Gaurav 5.1 Msc Chennai   3   Anuj 5.2 Msc Patna 

Dodajanje več kot enega stolpca v obstoječi podatkovni okvir

V tem primeru razširi obstoječi Pandas DataFrame df> z dvema novima stolpcema, Starost in Stanje, z uporabo ustreznih seznamov podatkov.

Python3




import> pandas as pd> data> => {> 'Name'> : [> 'Jai'> ,> 'Princi'> ,> 'Gaurav'> ,> 'Anuj'> ],> > 'Height'> : [> 5.1> ,> 6.2> ,> 5.1> ,> 5.2> ],> > 'Qualification'> : [> 'Msc'> ,> 'MA'> ,> 'Msc'> ,> 'Msc'> ],> > 'Address'> : [> 'Delhi'> ,> 'Bangalore'> ,> 'Chennai'> ,> 'Patna'> ]}> df> => pd.DataFrame(data)> # Define new data for additional columns> age> => [> 22> ,> 25> ,> 23> ,> 24> ]> state> => [> 'NCT'> ,> 'Karnataka'> ,> 'Tamil Nadu'> ,> 'Bihar'> ]> # Add multiple columns using dictionary assignment> new_data> => {> 'Age'> : age,> 'State'> : state }> df> => df.assign(> *> *> new_data)> print> (df)>

Izhod:

   Name Height Qualification Address Age State     0    Jai 5.1 Msc Delhi 22 NCT   1   Princi 6.2 MA Bangalore 25 Karnataka   2    Gaurav 5.1 Msc Chennai 23 Tamil Nadu   3   Anuj 5.2 Msc Patna 24 Bihar 

Zaključek

Razumevanje, kako dodati nove stolpce v DataFrames, je bistveno za raziskovanje podatkov in manipulacijo v Pandas. Izbira ustrezne metode je odvisna od specifičnega konteksta in želenega rezultata. Z obvladovanjem teh tehnik lahko učinkovito manipulirate s svojimi podatki, jih analizirate in pridobite dragocene vpoglede.