(BigData Analysis 도전기) Kaggle Pandas Tutorial (5. Data Types and Missing Values)
by 줌코딩
Introduction
- 이번 tutorial을 통해서는 data의 형태를 조사하는 방법에 대해서 배울 것이다.
- 또 entry를 어떻게 찾고 바꿀 수 있는지도 배워볼 것이다.
Dtypes
- DataFrame과 Series에 들어있는 Column의 데이터 타입을 dtype이라고 한다.
dtype
을 통해 특정 column의 type이 뭔지 확인 할 수 있다.dtypes
를 통해 그냥 DataFrame 전체에 있는 column의 type을 확인할 수도 있다.- 여기서 특이한 점은 string을 가지고 있는 애들은 type이 object이다.
- 그리고
astype()
을 통해서 특정 column의 데이터형태를 변경할 수도 있다.
Missing data
- 값이 없는 곳은
NaN
이라는 값이 주어지게 된다.- 이런 값을 확인하는 함수로는
pd.isnull()
이 있다.
reviews[pd.isnull(reviews.country)]
- 이런 빈칸을 특정 값으로 채우는 함수인
fillna()
도 있다.
reviews.region_2.fillna("Unknown")
- 빈칸이 아닌 곳의 값을 바꾸고 싶을때는 어떻게 해야할까?
- 간단히
replace()
를 이용하면 된다.
reviews.taster_twitter_handle.replace("@kerinokeefe", "@kerino")
- 이번 튜토리얼은 간단하다!
이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다.
Subscribe via RSS