Introduction

  • 이번 tutorial을 통해서는 data의 형태를 조사하는 방법에 대해서 배울 것이다.
  • 또 entry를 어떻게 찾고 바꿀 수 있는지도 배워볼 것이다.

Dtypes

  • DataFrame과 Series에 들어있는 Column의 데이터 타입을 dtype이라고 한다.
  • dtype을 통해 특정 column의 type이 뭔지 확인 할 수 있다.
  • dtypes를 통해 그냥 DataFrame 전체에 있는 column의 type을 확인할 수도 있다.
  • 여기서 특이한 점은 string을 가지고 있는 애들은 type이 object이다.
  • 그리고 astype()을 통해서 특정 column의 데이터형태를 변경할 수도 있다.

Missing data

  • 값이 없는 곳은 NaN이라는 값이 주어지게 된다.
  • 이런 값을 확인하는 함수로는 pd.isnull()이 있다.
reviews[pd.isnull(reviews.country)]
  • 이런 빈칸을 특정 값으로 채우는 함수인 fillna()도 있다.
reviews.region_2.fillna("Unknown")
  • 빈칸이 아닌 곳의 값을 바꾸고 싶을때는 어떻게 해야할까?
  • 간단히 replace()를 이용하면 된다.
reviews.taster_twitter_handle.replace("@kerinokeefe", "@kerino")
  • 이번 튜토리얼은 간단하다!