결측치 처리
house9895@naver.com
2023-11-15 10:42

안녕하세요 팀 은지짱짱걸입니다

데이터분석을 하면서 전처리를 하다보면 결측치를 처리해야 하는 상황이 나옵니다.

이 결측치를 처리하는 코드를 공유합니다.

  1. 결측치 삭제

df_cleaned = df.dropna()
  1. 결측치 평균값으로 채우기

df_filled_mean = df.fillna(df.mean())
  1. 결측치 특정한 값으로 채우기(ex : 0)

df_filled_specific = df.fillna(value=0)
  1. 결측치 이전 값으로 채우기

df_ffill = df.fillna(method='ffill')
  1. 결측치 다음 값으로 채우기

df_bfill = df.fillna(method='bfill')
  1. 결측치 보간하기

df_interpolated = df.interpolate()

다양하게 결측치를 채우는 방법이 있어서, 먼저 데이터 EDA를 진행하고 어떤 방식으로 결측치를 처리할지 고민 한뒤에 실행하여합니다. 그리고 이후에 꼭 통계값등을 이용해 채운 결측치들이 실제 데이터와 적합한지 판단을 내려야합니다.