Pandas의 기존 DataFrame에 새 열 추가
기존 DataFrame에 새 열을 추가하는 것은 다음을 사용하여 데이터 분석의 기본 작업입니다. 팬더 . 이를 통해 추가 정보로 데이터를 풍부하게 하고 추가 분석 및 조작을 용이하게 할 수 있습니다. 이 문서에서는 간단한 할당, insert()> 방법, assign()> 방법. Pandas의 기존 DataFrame에 새 열을 추가하는 방법에 대해 논의해 보겠습니다.
팬더 데이터프레임이란 무엇입니까?
ㅏ 팬더 데이터프레임 레이블이 지정된 축(행 및 열)이 있는 2차원의 크기 변경이 가능하며 잠재적으로 이질적인 표 형식의 데이터 구조입니다. 이는 Python 데이터 과학 생태계의 기본 데이터 구조이며 표 형식 데이터로 작업하는 강력한 방법을 제공합니다.
Pandas DataFrame의 주요 기능은 다음과 같습니다.
- 데이터 표현: 행과 열이 있는 테이블 형식으로 데이터를 저장합니다.
- 이기종 데이터 유형: 다양한 열에 다양한 데이터 유형(예: 정수, 부동 소수점, 문자열, 부울)을 보유할 수 있습니다.
- 라벨링: 각 행과 열에는 레이블(인덱스 및 열 이름)이 있습니다.
- 변하기 쉬운: 데이터 조작 및 수정을 허용합니다.
- 강력한 작업: 데이터 분석, 조작, 탐색을 위한 다양한 기능과 방법을 제공합니다.
- 확장 가능: 라이브러리 및 사용자 정의 기능을 통해 추가 기능으로 사용자 정의하고 확장할 수 있습니다.
Pandas의 기존 DataFrame에 새 열을 추가하는 방법에는 여러 가지가 있습니다. 파이썬 :
- 샘플 데이터프레임 생성
- 사용하여 데이터프레임.삽입() 방법
- 사용하여 데이터프레임.할당() 방법
- 사전 사용
- 목록 사용
- 사용 .장소()
- 기존 데이터 프레임에 둘 이상의 열 추가
샘플 데이터프레임 생성
여기서는 샘플 데이터프레임을 생성합니다.
파이썬3
import> pandas as pd> data> => {> 'Name'> : [> 'Jai'> ,> 'Princi'> ,> 'Gaurav'> ,> 'Anuj'> ],> > 'Height'> : [> 5.1> ,> 6.2> ,> 5.1> ,> 5.2> ],> > 'Qualification'> : [> 'Msc'> ,> 'MA'> ,> 'Msc'> ,> 'Msc'> ]}> df> => pd.DataFrame(data)> print> (df)> |
산출:
Name Height Qualification 0 Jai 5.1 Msc 1 Princi 6.2 MA 2 Gaurav 5.1 Msc 3 Anuj 5.2 Msc
목록의 길이는 인덱스 열의 길이와 일치해야 합니다. 그렇지 않으면 오류가 표시됩니다.
DataFrame.insert()를 사용하여 기존 Datframe에 새 열 추가
끝뿐만 아니라 원하는 위치에 자유롭게 열을 추가할 수 있습니다. 또한 열 값을 삽입하기 위한 다양한 옵션도 제공합니다.
파이썬3
import> pandas as pd> # Define a dictionary containing Students data> data> => {> 'Name'> : [> 'Jai'> ,> 'Princi'> ,> 'Gaurav'> ,> 'Anuj'> ],> > 'Height'> : [> 5.1> ,> 6.2> ,> 5.1> ,> 5.2> ],> > 'Qualification'> : [> 'Msc'> ,> 'MA'> ,> 'Msc'> ,> 'Msc'> ]}> # Convert the dictionary into DataFrame> df> => pd.DataFrame(data)> # Using DataFrame.insert() to add a column> df.insert(> 2> ,> 'Age'> , [> 21> ,> 23> ,> 24> ,> 21> ],> True> )> # Observe the result> print> (df)> |
산출:
Name Height Age Qualification 0 Jai 5.1 21 Msc 1 Princi 6.2 23 MA 2 Gaurav 5.1 24 Msc 3 Anuj 5.2 21 Msc
Dataframe.sign()을 사용하여 Pandas DataFrame에 열 추가
이 메서드는 이전 데이터 프레임에 새 열이 추가된 새 데이터 프레임을 생성합니다.
파이썬3
import> pandas as pd> # Define a dictionary containing Students data> data> => {> 'Name'> : [> 'Jai'> ,> 'Princi'> ,> 'Gaurav'> ,> 'Anuj'> ],> > 'Height'> : [> 5.1> ,> 6.2> ,> 5.1> ,> 5.2> ],> > 'Qualification'> : [> 'Msc'> ,> 'MA'> ,> 'Msc'> ,> 'Msc'> ]}> # Convert the dictionary into DataFrame> df> => pd.DataFrame(data)> # Using 'Address' as the column name and equating it to the list> df2> => df.assign(address> => [> 'Delhi'> ,> 'Bangalore'> ,> 'Chennai'> ,> 'Patna'> ])> print> (df2)> |
산출:
Name Height Qualification address 0 Jai 5.1 Msc Delhi 1 Princi 6.2 MA Bangalore 2 Gaurav 5.1 Msc Chennai 3 Anuj 5.2 Msc Patna
Pandas는 사전을 사용하여 DataFrame에 열을 추가합니다.
우리는 파이썬 사전 Pandas DataFrame에 새 열을 추가합니다. 기존 열을 키 값으로 사용하면 해당 값이 새 열의 값이 됩니다.
파이썬3
# Import pandas package> import> pandas as pd> # Define a dictionary containing Students data> data> => {> 'Name'> : [> 'Jai'> ,> 'Princi'> ,> 'Gaurav'> ,> 'Anuj'> ],> > 'Height'> : [> 5.1> ,> 6.2> ,> 5.1> ,> 5.2> ],> > 'Qualification'> : [> 'Msc'> ,> 'MA'> ,> 'Msc'> ,> 'Msc'> ]}> # Define a dictionary with key values of> # an existing column and their respective> # value pairs as the # values for our new column.> address> => {> 'Delhi'> :> 'Jai'> ,> 'Bangalore'> :> 'Princi'> ,> > 'Patna'> :> 'Gaurav'> ,> 'Chennai'> :> 'Anuj'> }> # Convert the dictionary into DataFrame> df> => pd.DataFrame(data)> # Provide 'Address' as the column name> df[> 'Address'> ]> => address> # Observe the output> print> (df)> |
산출:
Name Height Qualification Address 0 Jai 5.1 Msc Delhi 1 Princi 6.2 MA Bangalore 2 Gaurav 5.1 Msc Chennai 3 Anuj 5.2 Msc Patna
List를 사용하여 Pandas DataFrame에 새 열 추가
이 예에서는 Pandas는 목록에서 새 열을 추가합니다. 사전과 목록을 사용하여 기존 Pandas DataFrame에 대한 주소를 지정합니다.
파이썬3
# Declare a list that is to be converted into a column> address> => [> 'Delhi'> ,> 'Bangalore'> ,> 'Chennai'> ,> 'Patna'> ]> # Using 'Address' as the column name> # and equating it to the list> df[> 'Address'> ]> => address> print> (df)> |
산출:
Name Height Qualification Address 0 Jai 5.1 Msc Delhi 1 Princi 6.2 MA Bangalore 2 Gaurav 5.1 Msc Chennai 3 Anuj 5.2 Msc Patna
Dataframe.loc()를 사용하여 기존 Pandas DataFrame에 새 열 추가
이 예에서는 Pandas DataFrame이라는 이름을 생성합니다. df> Name, Height 및 Qualification 열을 사용하고 다음을 사용하여 새 열 Address를 추가합니다. loc> 기인하다.
파이썬3
import> pandas as pd> data> => {> 'Name'> : [> 'Jai'> ,> 'Princi'> ,> 'Gaurav'> ,> 'Anuj'> ],> > 'Height'> : [> 5.1> ,> 6.2> ,> 5.1> ,> 5.2> ],> > 'Qualification'> : [> 'Msc'> ,> 'MA'> ,> 'Msc'> ,> 'Msc'> ]}> df> => pd.DataFrame(data)> # Create the list of new column values> address> => [> 'Delhi'> ,> 'Bangalore'> ,> 'Chennai'> ,> 'Patna'> ]> # Add the new column using loc> df.loc[:,> 'Address'> ]> => address> print> (df)> |
산출:
Name Height Qualification Address 0 Jai 5.1 Msc Delhi 1 Princi 6.2 MA Bangalore 2 Gaurav 5.1 Msc Chennai 3 Anuj 5.2 Msc Patna
기존 데이터 프레임에 둘 이상의 열 추가
이 예에서는 기존 Pandas DataFrame을 확장합니다. df> 각각의 데이터 목록을 사용하는 Age 및 State라는 두 개의 새로운 열이 있습니다.
파이썬3
import> pandas as pd> data> => {> 'Name'> : [> 'Jai'> ,> 'Princi'> ,> 'Gaurav'> ,> 'Anuj'> ],> > 'Height'> : [> 5.1> ,> 6.2> ,> 5.1> ,> 5.2> ],> > 'Qualification'> : [> 'Msc'> ,> 'MA'> ,> 'Msc'> ,> 'Msc'> ],> > 'Address'> : [> 'Delhi'> ,> 'Bangalore'> ,> 'Chennai'> ,> 'Patna'> ]}> df> => pd.DataFrame(data)> # Define new data for additional columns> age> => [> 22> ,> 25> ,> 23> ,> 24> ]> state> => [> 'NCT'> ,> 'Karnataka'> ,> 'Tamil Nadu'> ,> 'Bihar'> ]> # Add multiple columns using dictionary assignment> new_data> => {> 'Age'> : age,> 'State'> : state }> df> => df.assign(> *> *> new_data)> print> (df)> |
산출:
Name Height Qualification Address Age State 0 Jai 5.1 Msc Delhi 22 NCT 1 Princi 6.2 MA Bangalore 25 Karnataka 2 Gaurav 5.1 Msc Chennai 23 Tamil Nadu 3 Anuj 5.2 Msc Patna 24 Bihar
결론
Pandas에서 데이터를 탐색하고 조작하려면 DataFrames에 새 열을 추가하는 방법을 이해하는 것이 필수적입니다. 적절한 방법을 선택하는 것은 특정 상황과 원하는 결과에 따라 달라집니다. 이러한 기술을 익히면 데이터를 효과적으로 조작, 분석하고 귀중한 통찰력을 얻을 수 있습니다.