반응형
파이썬 데이터 분석 / pandas DataFrame 열 추가 및 삭제
DataFrame 데이터 가져오기
야후에서 제공하는 API를 사용해 데이터를 가져와 보겠습니다.
아래는 삼성전자의 주식 정보를 가져오는 구문입니다.
기간은 2020/07/01 이후의 데이터를 가져옵니다.
아래의 samsung 변수는 dataframe 형식으로 반환됩니다.
from pandas_datareader import data as pdr
samsung = pdr.get_data_yahoo('005930.KS', start='2020-07-01')
DataFrame 열 확인
데이터를 출력하는 것은 간단합니다.
DataFrame의 열을 확인하기 위해서는 columns 속성을 이용합니다.
아래를 보면 6개의 열을 가지고 있음을 볼 수 있습니다.
print(samsung)
print(samsung.columns)
DataFrame 열 삭제
열을 삭제해 보겠습니다.
del 명령어를 이용하여 DataFrame의 속성을 지정해주면 삭제됩니다.
del samsung["High"]
print(samsung.columns)
DataFrame 열 추가
아래 구문은 NewOne 이라는 열을 추가하는데, 값은 모두 0으로 지정하여 값을 추가하였습니다.
samsung['NewOne'] = 0
print(samsung.columns)
print(samsung)
이번에는 새로운 열을 추가할 때, 각 행의 값을 다른 열의 값을 이용하여 넣어보도록 하겠습니다.
'Close'는 주가의 그 날의 종가 데이터입니다.
새로운 열은 그 전날의 종가 데이터의 변동 차이에 대한 값을 넣도록 하였습니다.
shift(1)을 하면 전체 데이터가 1행씩 뒤로 이동되는데, samsum['Close'].shift(1)을 하면 이전 날의 종가 데이터가 됩니다.
하여, 새로운 열인 'DailyChange'를 추가하여, 종가 변동차이 값을 지정하였습니다.
samsung['DailyChange'] = samsung['Close']- samsung['Close'].shift(1)
print(samsung.columns)
print(samsung)
print(samsung['DailyChange'])
전체 코드
from pandas_datareader import data as pdr
samsung = pdr.get_data_yahoo('005930.KS', start='2020-07-01')
samsung['DailyChange'] = samsung['Close']- samsung['Close'].shift(1)
print(samsung.columns)
print(samsung)
print(samsung['DailyChange'])
반응형
'파이썬 > 파이썬 데이터 분석' 카테고리의 다른 글
파이썬 데이터 분석 / DataFrame의 내용을 pyplot 모듈로 그래프 그리기 (0) | 2021.09.08 |
---|---|
파이썬 데이터 분석 / Numpy 2차원 배열 전체, 행별, 열별 sum, average 함수 사용하기 (0) | 2021.08.30 |
파이썬 데이터 분석 / numpy arrary 생성하기 (0) | 2021.08.30 |
파이썬 데이터 분석 / set 집합 함수 - 합집합, 차집합, 교집합, 대칭차 (0) | 2021.08.30 |
파이썬 데이터 분석 / pandas DataFrame 생성하기 (0) | 2020.08.24 |