Hinzufügen einer neuen Spalte zum vorhandenen DataFrame in Pandas

Das Hinzufügen neuer Spalten zu einem vorhandenen DataFrame ist eine grundlegende Aufgabe bei der Datenanalyse mit Pandas . Es ermöglicht Ihnen, Ihre Daten mit zusätzlichen Informationen anzureichern und weitere Analysen und Manipulationen zu erleichtern. In diesem Artikel werden verschiedene Methoden zum Hinzufügen neuer Spalten untersucht, einschließlich der einfachen Zuweisung insert()> Methode, die assign()> Methode. Lassen Sie uns das Hinzufügen neuer Spalten zum vorhandenen DataFrame von Pandas besprechen.

Was ist Pandas DataFrame?

A Pandas DataFrame ist eine zweidimensionale, größenveränderliche, potenziell heterogene tabellarische Datenstruktur mit beschrifteten Achsen (Zeilen und Spalten). Es handelt sich um eine grundlegende Datenstruktur im Python-Data-Science-Ökosystem und bietet eine leistungsstarke Möglichkeit, mit Tabellendaten zu arbeiten.

Hier sind einige Hauptfunktionen eines Pandas DataFrame:

  • Daten Präsentation: Speichert Daten in einem Tabellenformat mit Zeilen und Spalten.
  • Heterogene Datentypen: Kann verschiedene Datentypen in verschiedenen Spalten enthalten (z. B. Ganzzahlen, Gleitkommazahlen, Zeichenfolgen, Boolesche Werte).
  • Beschriftung: Jede Zeile und Spalte hat eine Beschriftung (Index- und Spaltennamen).
  • Veränderlich: Ermöglicht die Manipulation und Änderung von Daten.
  • Leistungsstarke Operationen: Bietet verschiedene Funktionen und Methoden zur Datenanalyse, -manipulation und -exploration.
  • Erweiterbar: Kann durch Bibliotheken und benutzerdefinierte Funktionen individuell angepasst und um zusätzliche Funktionalitäten erweitert werden.

Es gibt mehrere Möglichkeiten, in Pandas eine neue Spalte zu einem vorhandenen DataFrame hinzuzufügen Python :

  • Erstellen eines Beispieldatenrahmens
  • Durch die Nutzung Dataframe.insert() Methode
  • Durch die Nutzung Dataframe.assign() Methode
  • Verwenden des Wörterbuchs
  • Verwenden von Liste
  • Benutzen .Ort()
  • Hinzufügen mehrerer Spalten zum vorhandenen Datenrahmen

Erstellen eines Beispieldatenrahmens

Hier erstellen wir einen Beispieldatenrahmen:

Python3




import> pandas as pd> data> => {> 'Name'> : [> 'Jai'> ,> 'Princi'> ,> 'Gaurav'> ,> 'Anuj'> ],> > 'Height'> : [> 5.1> ,> 6.2> ,> 5.1> ,> 5.2> ],> > 'Qualification'> : [> 'Msc'> ,> 'MA'> ,> 'Msc'> ,> 'Msc'> ]}> df> => pd.DataFrame(data)> print> (df)>

Ausgabe:

   Name Height Qualification     0    Jai 5.1 Msc   1    Princi 6.2 MA   2   Gaurav 5.1 Msc   3   Anuj 5.2 Msc 

Beachten Sie, dass die Länge Ihrer Liste mit der Länge der Indexspalte übereinstimmen sollte, andernfalls wird ein Fehler angezeigt.

Fügen Sie mit DataFrame.insert() eine neue Spalte zu einem vorhandenen Datframe hinzu

Es gibt die Freiheit, eine Spalte an jeder beliebigen Position und nicht nur am Ende hinzuzufügen. Es bietet auch verschiedene Optionen zum Einfügen der Spaltenwerte.

Python3




import> pandas as pd> # Define a dictionary containing Students data> data> => {> 'Name'> : [> 'Jai'> ,> 'Princi'> ,> 'Gaurav'> ,> 'Anuj'> ],> > 'Height'> : [> 5.1> ,> 6.2> ,> 5.1> ,> 5.2> ],> > 'Qualification'> : [> 'Msc'> ,> 'MA'> ,> 'Msc'> ,> 'Msc'> ]}> # Convert the dictionary into DataFrame> df> => pd.DataFrame(data)> # Using DataFrame.insert() to add a column> df.insert(> 2> ,> 'Age'> , [> 21> ,> 23> ,> 24> ,> 21> ],> True> )> # Observe the result> print> (df)>

Ausgabe:

  Name Height Age Qualification     0   Jai 5.1 21 Msc   1   Princi 6.2 23 MA   2   Gaurav 5.1 24 Msc   3    Anuj 5.2 21 Msc 

Hinzufügen von Spalten zu Pandas DataFrame mit Dataframe.assign()

Diese Methode erstellt einen neuen Datenrahmen, wobei eine neue Spalte zum alten Datenrahmen hinzugefügt wird.

Python3




import> pandas as pd> # Define a dictionary containing Students data> data> => {> 'Name'> : [> 'Jai'> ,> 'Princi'> ,> 'Gaurav'> ,> 'Anuj'> ],> > 'Height'> : [> 5.1> ,> 6.2> ,> 5.1> ,> 5.2> ],> > 'Qualification'> : [> 'Msc'> ,> 'MA'> ,> 'Msc'> ,> 'Msc'> ]}> # Convert the dictionary into DataFrame> df> => pd.DataFrame(data)> # Using 'Address' as the column name and equating it to the list> df2> => df.assign(address> => [> 'Delhi'> ,> 'Bangalore'> ,> 'Chennai'> ,> 'Patna'> ])> print> (df2)>

Ausgabe:

   Name Height Qualification address     0    Jai 5.1 Msc Delhi   1    Princi 6.2 MA Bangalore   2    Gaurav 5.1 Msc Chennai   3    Anuj 5.2 Msc Patna 

Pandas fügen mithilfe eines Wörterbuchs eine Spalte zu DataFrame hinzu

Wir können a verwenden Python-Wörterbuch um eine neue Spalte in Pandas DataFrame hinzuzufügen. Verwenden Sie eine vorhandene Spalte als Schlüsselwerte und ihre jeweiligen Werte sind die Werte für eine neue Spalte.

Python3




# Import pandas package> import> pandas as pd> # Define a dictionary containing Students data> data> => {> 'Name'> : [> 'Jai'> ,> 'Princi'> ,> 'Gaurav'> ,> 'Anuj'> ],> > 'Height'> : [> 5.1> ,> 6.2> ,> 5.1> ,> 5.2> ],> > 'Qualification'> : [> 'Msc'> ,> 'MA'> ,> 'Msc'> ,> 'Msc'> ]}> # Define a dictionary with key values of> # an existing column and their respective> # value pairs as the # values for our new column.> address> => {> 'Delhi'> :> 'Jai'> ,> 'Bangalore'> :> 'Princi'> ,> > 'Patna'> :> 'Gaurav'> ,> 'Chennai'> :> 'Anuj'> }> # Convert the dictionary into DataFrame> df> => pd.DataFrame(data)> # Provide 'Address' as the column name> df[> 'Address'> ]> => address> # Observe the output> print> (df)>

Ausgabe:

  Name Height Qualification Address     0   Jai 5.1 Msc Delhi   1   Princi 6.2 MA Bangalore   2   Gaurav 5.1 Msc Chennai   3    Anuj 5.2 Msc Patna 

Hinzufügen einer neuen Spalte zu einem Pandas DataFrame mithilfe von List

In diesem Beispiel, Pandas fügen neue Spalten aus der Liste hinzu Adressieren Sie mithilfe eines Wörterbuchs und einer Liste einen vorhandenen Pandas DataFrame.

Python3




# Declare a list that is to be converted into a column> address> => [> 'Delhi'> ,> 'Bangalore'> ,> 'Chennai'> ,> 'Patna'> ]> # Using 'Address' as the column name> # and equating it to the list> df[> 'Address'> ]> => address> print> (df)>

Ausgabe:

  Name Height Qualification Address     0   Jai 5.1 Msc Delhi   1   Princi 6.2 MA Bangalore   2   Gaurav 5.1 Msc Chennai   3    Anuj 5.2 Msc Patna 

Mit Dataframe.loc() eine neue Spalte zu einem vorhandenen Pandas-DataFrame hinzufügen

In diesem Beispiel wird ein Pandas DataFrame mit dem Namen erstellt df> mit den Spalten „Name“, „Höhe“ und „Qualifikation“ und fügt mithilfe der eine neue Spalte „Adresse“ hinzu loc> Attribut.

Python3




import> pandas as pd> data> => {> 'Name'> : [> 'Jai'> ,> 'Princi'> ,> 'Gaurav'> ,> 'Anuj'> ],> > 'Height'> : [> 5.1> ,> 6.2> ,> 5.1> ,> 5.2> ],> > 'Qualification'> : [> 'Msc'> ,> 'MA'> ,> 'Msc'> ,> 'Msc'> ]}> df> => pd.DataFrame(data)> # Create the list of new column values> address> => [> 'Delhi'> ,> 'Bangalore'> ,> 'Chennai'> ,> 'Patna'> ]> # Add the new column using loc> df.loc[:,> 'Address'> ]> => address> print> (df)>

Ausgabe:

  Name Height Qualification Address     0    Jai 5.1 Msc Delhi   1   Princi 6.2 MA Bangalore   2   Gaurav 5.1 Msc Chennai   3   Anuj 5.2 Msc Patna 

Hinzufügen mehrerer Spalten zum vorhandenen Datenrahmen

In diesem Beispiel wird ein vorhandener Pandas DataFrame erweitert df> mit zwei neuen Spalten, Alter und Staat, unter Verwendung ihrer jeweiligen Datenlisten.

Python3




import> pandas as pd> data> => {> 'Name'> : [> 'Jai'> ,> 'Princi'> ,> 'Gaurav'> ,> 'Anuj'> ],> > 'Height'> : [> 5.1> ,> 6.2> ,> 5.1> ,> 5.2> ],> > 'Qualification'> : [> 'Msc'> ,> 'MA'> ,> 'Msc'> ,> 'Msc'> ],> > 'Address'> : [> 'Delhi'> ,> 'Bangalore'> ,> 'Chennai'> ,> 'Patna'> ]}> df> => pd.DataFrame(data)> # Define new data for additional columns> age> => [> 22> ,> 25> ,> 23> ,> 24> ]> state> => [> 'NCT'> ,> 'Karnataka'> ,> 'Tamil Nadu'> ,> 'Bihar'> ]> # Add multiple columns using dictionary assignment> new_data> => {> 'Age'> : age,> 'State'> : state }> df> => df.assign(> *> *> new_data)> print> (df)>

Ausgabe:

   Name Height Qualification Address Age State     0    Jai 5.1 Msc Delhi 22 NCT   1   Princi 6.2 MA Bangalore 25 Karnataka   2    Gaurav 5.1 Msc Chennai 23 Tamil Nadu   3   Anuj 5.2 Msc Patna 24 Bihar 

Abschluss

Für die Datenexploration und -manipulation in Pandas ist es wichtig zu verstehen, wie neue Spalten zu DataFrames hinzugefügt werden. Die Wahl der geeigneten Methode hängt vom spezifischen Kontext und dem gewünschten Ergebnis ab. Wenn Sie diese Techniken beherrschen, können Sie Ihre Daten effektiv manipulieren, analysieren und wertvolle Erkenntnisse daraus gewinnen.