Pandas DataFrame.loc[] Mètode

Pandas DataFrame és una estructura de dades tabulars bidimensionals de mida variable i potencialment heterogènia amb eixos etiquetats (files i columnes). Les operacions aritmètiques s'alineen a les etiquetes de files i columnes. Es pot considerar com un contenidor semblant a un dictat per a objectes de la sèrie. Aquesta és l'estructura de dades principal del Pandes .

Pandas DataFrame loc[] Sintaxi

Pandes DataFrame.loc l'atribut accedeix a un grup de files i columnes per etiquetes o una matriu booleana en el Pandas DataFrame .

Sintaxi: DataFrame.loc

Paràmetre: Cap

Devolucions: Escalar, Sèrie, DataFrame

Pandas DataFrame loc Propietat

A continuació es mostren alguns exemples amb els quals podem utilitzar Pandas DataFrame loc[]:

Exemple 1: Seleccioneu una sola fila i una columna per etiqueta amb loc[]

Utilitzeu l'atribut DataFrame.loc per accedir a una cel·la concreta de la determinada Pandas Dataframe utilitzant les etiquetes d'índex i columna. Aleshores, seleccionem una sola fila i columna per etiqueta mitjançant loc[].

Python 3




# importing pandas as pd> import> pandas as pd> # Creating the DataFrame> df> => pd.DataFrame({> 'Weight'> : [> 45> ,> 88> ,> 56> ,> 15> ,> 71> ],> > 'Name'> : [> 'Sam'> ,> 'Andrea'> ,> 'Alex'> ,> 'Robin'> ,> 'Kia'> ],> > 'Age'> : [> 14> ,> 25> ,> 55> ,> 8> ,> 21> ]})> # Create the index> index_> => [> 'Row_1'> ,> 'Row_2'> ,> 'Row_3'> ,> 'Row_4'> ,> 'Row_5'> ]> # Set the index> df.index> => index_> # Print the DataFrame> print> (> 'Original DataFrame:'> )> print> (df)> # Corrected selection using loc for a specific cell> result> => df.loc[> 'Row_2'> ,> 'Name'> ]> # Print the result> print> (> ' Selected Value at Row_2, Column 'Name':'> )> print> (result)>

Sortida

Original DataFrame:  Weight Name Age Row_1 45 Sam 14 Row_2 88 Andrea 25 Row_3 56 Alex 55 Row_4 15 Robin 8 Row_5 71 Kia 21 Selected Value at Row_2, Column 'Name': Andrea 

Exemple 2: Seleccioneu diverses files i columnes

Utilitzeu l'atribut DataFrame.loc per retornar dues de les columnes del Dataframe donat i, a continuació, seleccioneu diverses files i columnes tal com es fa a l'exemple següent.

Python 3




# importing pandas as pd> import> pandas as pd> # Creating the DataFrame> df> => pd.DataFrame({> 'A'> :[> 12> ,> 4> ,> 5> ,> None> ,> 1> ],> > 'B'> :[> 7> ,> 2> ,> 54> ,> 3> ,> None> ],> > 'C'> :[> 20> ,> 16> ,> 11> ,> 3> ,> 8> ],> > 'D'> :[> 14> ,> 3> ,> None> ,> 2> ,> 6> ]})> # Create the index> index_> => [> 'Row_1'> ,> 'Row_2'> ,> 'Row_3'> ,> 'Row_4'> ,> 'Row_5'> ]> # Set the index> df.index> => index_> # Print the DataFrame> print> (> 'Original DataFrame:'> )> print> (df)> # Corrected column names ('A' and 'D') in the result> result> => df.loc[:, [> 'A'> ,> 'D'> ]]> # Print the result> print> (> ' Selected Columns 'A' and 'D':'> )> print> (result)>

Sortida

Original DataFrame:  A B C D Row_1 12.0 7 20 14.0 Row_2 4.0 2 16 3.0 Row_3 5.0 54 11 NaN Row_4 NaN 3 3 2.0 Row_5 1.0 NaN 8 6.0 Selected Columns 'A' and 'D':  A D Row_1 12.0 14.0 Row_2 4.0 3.0 Row_3 5.0 NaN Row_4 NaN 2.0 Row_5 1.0 6.0 

Exemple 3: seleccioneu entre dues files o columnes

En aquest exemple, creem un DataFrame pandas anomenat 'df', establim índexs de files personalitzats i, a continuació, utilitzem el loc> d'accés per seleccionar files entre 'Row_2' i 'Row_4' incloses i columnes 'B' a 'D'. S'imprimeixen les files i columnes seleccionades, demostrant l'ús de la indexació basada en etiquetes loc> .

Python 3




# importing pandas as pd> import> pandas as pd> # Creating the DataFrame> df> => pd.DataFrame({> 'A'> : [> 12> ,> 4> ,> 5> ,> None> ,> 1> ],> > 'B'> : [> 7> ,> 2> ,> 54> ,> 3> ,> None> ],> > 'C'> : [> 20> ,> 16> ,> 11> ,> 3> ,> 8> ],> > 'D'> : [> 14> ,> 3> ,> None> ,> 2> ,> 6> ]})> # Create the index> index_> => [> 'Row_1'> ,> 'Row_2'> ,> 'Row_3'> ,> 'Row_4'> ,> 'Row_5'> ]> # Set the index> df.index> => index_> # Print the original DataFrame> print> (> 'Original DataFrame:'> )> print> (df)> # Select Rows Between 'Row_2' and 'Row_4'> selected_rows> => df.loc[> 'Row_2'> :> 'Row_4'> ]> print> (> ' Selected Rows:'> )> print> (selected_rows)> # Select Columns 'B' through 'D'> selected_columns> => df.loc[:,> 'B'> :> 'D'> ]> print> (> ' Selected Columns:'> )> print> (selected_columns)>

Sortida

Original DataFrame:  A B C D Row_1 12.0 7 20 14.0 Row_2 4.0 2 16 3.0 Row_3 5.0 54 11 NaN Row_4 NaN 3 3 2.0 Row_5 1.0 NaN 8 6.0 Selected Rows:  A B C D Row_2 4 2 16 3.0 Row_3 5 54 11 NaN Row_4 NaN 3 3 2.0 Selected Columns:  B C D Row_1 7 20 14.0 Row_2 2 16 3.0 Row_3 54 11 NaN Row_4 3 3 2.0 Row_5 NaN 8 6.0 

Exemple 4: seleccioneu files o columnes alternatives

En aquest exemple, creem un DataFrame pandas anomenat 'df', establim índexs de files personalitzats i, a continuació, utilitzem el iloc> d'accés per seleccionar files alternatives (cada segona fila) i columnes alternatives (cada segona columna). Les seleccions resultants s'imprimeixen, mostrant l'ús de la indexació basada en nombres enters iloc> .

Python 3




# importing pandas as pd> import> pandas as pd> # Creating the DataFrame> df> => pd.DataFrame({> 'A'> : [> 12> ,> 4> ,> 5> ,> None> ,> 1> ],> > 'B'> : [> 7> ,> 2> ,> 54> ,> 3> ,> None> ],> > 'C'> : [> 20> ,> 16> ,> 11> ,> 3> ,> 8> ],> > 'D'> : [> 14> ,> 3> ,> None> ,> 2> ,> 6> ]})> # Create the index> index_> => [> 'Row_1'> ,> 'Row_2'> ,> 'Row_3'> ,> 'Row_4'> ,> 'Row_5'> ]> # Set the index> df.index> => index_> # Print the original DataFrame> print> (> 'Original DataFrame:'> )> print> (df)> # Select Alternate Rows> alternate_rows> => df.iloc[::> 2> ]> print> (> ' Alternate Rows:'> )> print> (alternate_rows)> # Select Alternate Columns> alternate_columns> => df.iloc[:, ::> 2> ]> print> (> ' Alternate Columns:'> )> print> (alternate_columns)>

Sortida

Original DataFrame:  A B C D Row_1 12.0 7 20 14.0 Row_2 4.0 2 16 3.0 Row_3 5.0 54 11 NaN Row_4 NaN 3 3 2.0 Row_5 1.0 NaN 8 6.0 Alternate Rows:  A B C D Row_1 12.0 7 20 14.0 Row_3 5.0 54 11 NaN Row_5 1.0 NaN 8 6.0 Alternate Columns:  A C Row_1 12.0 20 Row_2 4.0 16 Row_3 5.0 11 Row_4 NaN 3 Row_5 1.0 8 

Exemple 5: Ús de condicions amb Pandas loc

En aquest exemple, estem creant un DataFrame pandas anomenat 'df', estableix índexs de files personalitzats i utilitza el loc> d'accés per seleccionar files en funció de les condicions. Demostra la selecció de files on la columna 'A' té valors superiors a 5 i la selecció de files on la columna 'B' no és nul·la. A continuació, s'imprimeixen les seleccions resultants, mostrant l'ús del filtratge condicional amb loc> .

Python 3




# importing pandas as pd> import> pandas as pd> # Creating the DataFrame> df> => pd.DataFrame({> 'A'> : [> 12> ,> 4> ,> 5> ,> None> ,> 1> ],> > 'B'> : [> 7> ,> 2> ,> 54> ,> 3> ,> None> ],> > 'C'> : [> 20> ,> 16> ,> 11> ,> 3> ,> 8> ],> > 'D'> : [> 14> ,> 3> ,> None> ,> 2> ,> 6> ]})> # Create the index> index_> => [> 'Row_1'> ,> 'Row_2'> ,> 'Row_3'> ,> 'Row_4'> ,> 'Row_5'> ]> # Set the index> df.index> => index_> # Print the original DataFrame> print> (> 'Original DataFrame:'> )> print> (df)> # Using Conditions with loc> # Example: Select rows where column 'A' is greater than 5> selected_rows> => df.loc[df[> 'A'> ]>> 5> ]> print> (> ' Rows where column 'A' is greater than 5:'> )> print> (selected_rows)> # Example: Select rows where column 'B' is not null> non_null_rows> => df.loc[df[> 'B'> ].notnull()]> print> (> ' Rows where column 'B' is not null:'> )> print> (non_null_rows)>

Sortida

Original DataFrame:  A B C D Row_1 12.0 7 20 14.0 Row_2 4.0 2 16 3.0 Row_3 5.0 54 11 NaN Row_4 NaN 3 3 2.0 Row_5 1.0 NaN 8 6.0 Rows where column 'A' is greater than 5:  A B C D Row_1 12.0 7 20 14.0 Row_3 5.0 54 11 NaN Rows where column 'B' is not null:  A B C D Row_1 12.0 7 20 14.0 Row_2 4.0 2 16 3.0 Row_3 5.0 54 11 NaN Row_4 NaN 3 3 2.0