반응형
DataFrame은 Pandas 라이브러리에서 제공하는 테이블 형태의 데이터 구조입니다. 이러한 구조는 행과 열로 구성된 2차원 데이터를 처리하는데 유용합니다. DataFrame은 대규모 데이터 세트를 쉽게 조작하고 분석하는데 사용됩니다. 행은 관측치를 나타내며, 열은 해당 관측치의 특성을 나타냅니다.
DataFrame은 다양한 방법으로 생성될 수 있습니다. 가장 일반적인 방법은 파이썬의 딕셔너리를 사용하여 데이터를 입력하는 것입니다. 딕셔너리의 키는 열의 이름이 되고, 값은 해당 열에 대한 데이터가 됩니다. 이러한 방식으로 DataFrame을 생성하면 테이블 형태의 데이터를 구조적으로 보다 쉽게 다룰 수 있습니다.
아래는 DataFrame을 생성하고 조작하는 간단한 예시 코드입니다:
import pandas as pd
# 딕셔너리를 사용해 DataFrame 생성
data = {'이름': ['홍길동', '김철수', '박영희'],
'나이': [20, 25, 30],
'성별': ['남', '남', '여']}
df = pd.DataFrame(data)
# DataFrame 출력
print(df)
# DataFrame에서 특정 열 선택
print(df['이름'])
# DataFrame에서 특정 행 범위 선택
print(df[1:3])
위 코드에서는 판다스(`pd`)를 임포트하고, 딕셔너리로 데이터를 생성한 다음 이를 이용하여 DataFrame을 생성합니다. `print(df)`를 통해 DataFrame의 전체 내용을 확인할 수 있습니다. 또한 `df['이름']`을 사용하여 '이름' 열의 데이터만 선택하고, `df[1:3]`을 사용하여 두 번째와 세 번째 행을 선택합니다.
자세한 내용은 아래의 링크에서 Pandas DataFrame에 대한 파이썬 문서를 확인할 수 있습니다:
(https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.html)
반응형
댓글