반응형

파이썬 데이터 분석 / pandas DataFrame 열 추가 및 삭제

DataFrame 데이터 가져오기

야후에서 제공하는 API를 사용해 데이터를 가져와 보겠습니다. 

아래는 삼성전자의 주식 정보를 가져오는 구문입니다. 

기간은 2020/07/01 이후의 데이터를 가져옵니다. 

 

아래의 samsung 변수는 dataframe 형식으로 반환됩니다. 

from pandas_datareader import data as pdr

samsung = pdr.get_data_yahoo('005930.KS', start='2020-07-01')

DataFrame 열 확인

데이터를 출력하는 것은 간단합니다. 

DataFrame의 열을 확인하기 위해서는 columns 속성을 이용합니다. 

아래를 보면 6개의 열을 가지고 있음을 볼 수 있습니다. 

print(samsung)
print(samsung.columns)

DataFrame 열 삭제

열을 삭제해 보겠습니다. 

del 명령어를 이용하여 DataFrame의 속성을 지정해주면 삭제됩니다. 

del samsung["High"]
print(samsung.columns)

DataFrame 열 추가

아래 구문은 NewOne 이라는 열을 추가하는데, 값은 모두 0으로 지정하여 값을 추가하였습니다. 

samsung['NewOne'] = 0
print(samsung.columns)
print(samsung)

 

이번에는 새로운 열을 추가할 때, 각 행의 값을 다른 열의 값을 이용하여 넣어보도록 하겠습니다. 

'Close'는 주가의 그 날의 종가 데이터입니다. 

새로운 열은 그 전날의 종가 데이터의 변동 차이에 대한 값을 넣도록 하였습니다. 

shift(1)을 하면 전체 데이터가 1행씩 뒤로 이동되는데, samsum['Close'].shift(1)을 하면 이전 날의 종가 데이터가 됩니다.

 

하여, 새로운 열인 'DailyChange'를 추가하여, 종가 변동차이 값을 지정하였습니다. 

samsung['DailyChange'] = samsung['Close']- samsung['Close'].shift(1)

print(samsung.columns)
print(samsung)
print(samsung['DailyChange'])

전체 코드

from pandas_datareader import data as pdr

samsung = pdr.get_data_yahoo('005930.KS', start='2020-07-01')

samsung['DailyChange'] = samsung['Close']- samsung['Close'].shift(1)

print(samsung.columns)
print(samsung)
print(samsung['DailyChange'])
반응형

+ Recent posts