안녕하세요 팀 은지짱짱걸입니다
데이터분석을 하면서 전처리를 하다보면 결측치를 처리해야 하는 상황이 나옵니다.
이 결측치를 처리하는 코드를 공유합니다.
결측치 삭제
df_cleaned = df.dropna()
결측치 평균값으로 채우기
df_filled_mean = df.fillna(df.mean())
결측치 특정한 값으로 채우기(ex : 0)
df_filled_specific = df.fillna(value=0)
결측치 이전 값으로 채우기
df_ffill = df.fillna(method='ffill')
결측치 다음 값으로 채우기
df_bfill = df.fillna(method='bfill')
결측치 보간하기
df_interpolated = df.interpolate()
다양하게 결측치를 채우는 방법이 있어서, 먼저 데이터 EDA를 진행하고 어떤 방식으로 결측치를 처리할지 고민 한뒤에 실행하여합니다. 그리고 이후에 꼭 통계값등을 이용해 채운 결측치들이 실제 데이터와 적합한지 판단을 내려야합니다.