반응형
파이썬 데이터 분석 / pandas DataFrame 생성하기
1) Numpy 배열 또는 딕셔너리를 이용한 data frame 생성
import numpy as np
import pandas as pd
# numpy 배열로 data frame 생성
my_darray = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9], [10,11,12]])
test1 = pd.DataFrame(my_darray)
print(test1)
print(test1.shape)
print(len(test1))
# 딕셔너리(list와 numpy 배열 포함)로 data frame 생성
my_darray2 = {
'col1': [1,2,3],
'col2': np.array([4,5,6]),
'col3' : [7,8,9],
'col4' : np.array([10,11,12])}
test2 = pd.DataFrame(my_darray2)
print(test2)
print(test2.shape)
print(len(test2))
2) index, columns 이용한 data frame 생성
import numpy as np
import pandas as pd
my_df = pd.DataFrame(data=[4,5,6,7], index=range(0,4), columns=['A'])
my_df['B'] = [1,2,3,4]
test3 = pd.DataFrame(my_df)
print(test3)
print(test3.shape)
print(len(test3))
3) series를 이용한 data frame 생성
import numpy as np
import pandas as pd
my_series = pd.Series({"One":"c++", "Two":"java", "Three":"python", "Four":"visual basic"})
test4 = pd.DataFrame(my_series)
print(test4)
print(test4.shape)
print(len(test4))
반응형
'파이썬 > 파이썬 데이터 분석' 카테고리의 다른 글
파이썬 데이터 분석 / DataFrame의 내용을 pyplot 모듈로 그래프 그리기 (0) | 2021.09.08 |
---|---|
파이썬 데이터 분석 / Numpy 2차원 배열 전체, 행별, 열별 sum, average 함수 사용하기 (0) | 2021.08.30 |
파이썬 데이터 분석 / numpy arrary 생성하기 (0) | 2021.08.30 |
파이썬 데이터 분석 / set 집합 함수 - 합집합, 차집합, 교집합, 대칭차 (0) | 2021.08.30 |
파이썬 데이터 분석 / pandas DataFrame 열 추가 및 삭제 (0) | 2020.08.15 |