반응형

파이썬 데이터 분석 / pandas DataFrame 생성하기

 

1) Numpy 배열 또는 딕셔너리를 이용한 data frame 생성

import numpy as np
import pandas as pd

# numpy 배열로 data frame 생성
my_darray = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9], [10,11,12]])
test1 = pd.DataFrame(my_darray)
print(test1)
print(test1.shape)
print(len(test1))

# 딕셔너리(list와 numpy 배열 포함)로 data frame 생성
my_darray2 = {
    'col1': [1,2,3],
    'col2': np.array([4,5,6]),
    'col3' : [7,8,9],
    'col4' : np.array([10,11,12])}

test2 = pd.DataFrame(my_darray2)
print(test2)
print(test2.shape)
print(len(test2))

2) index, columns 이용한 data frame 생성

import numpy as np
import pandas as pd

my_df = pd.DataFrame(data=[4,5,6,7], index=range(0,4), columns=['A'])
my_df['B'] = [1,2,3,4]
test3 = pd.DataFrame(my_df)
print(test3)
print(test3.shape)
print(len(test3))

3) series를 이용한 data frame 생성

import numpy as np
import pandas as pd

my_series = pd.Series({"One":"c++", "Two":"java", "Three":"python", "Four":"visual basic"})
test4 = pd.DataFrame(my_series)
print(test4)
print(test4.shape)
print(len(test4))

반응형

+ Recent posts