학생부 본선진출팀이 공고되었습니다.

자세히보기

차분(Differential)
house9895@naver.com
2023-11-15 09:43

안녕하세요 팀 은지짱짱걸입니다

제가 개인적으로 시계열 분석에가 제일 좋아하는 전처리 방법중에 하나인 차분을 하는 코드입니다.

차분이란 데이터 분석에서 주어진 시간 간격 동안 변수의 변화를 나타내는 과정입니다. 가장 간단한 방법은 현재 시점의 값에서 이전 시점의 값을 빼는 것입니다.

저희 팀은 이 방법을 활용하여 뜰개의 움직임을 위도, 경도가 변화하는 것으로 나타내어서 결과물을 도출했습니다.

먼저 main이라는 데이터 프레임에 longitude, latitude가 있으며 그 간격이 일정하게 있다고 가정 하겠습니다.

import pandas as pd

main['d_long'] = main['longitude'].diff().fillna(0)
main['d_lati'] = main['latitude'].diff().fillna(0)

이렇게 차분을 실행하고 나면 각 뜰개의 첫번째 행의 값에는 nan값 또는 이전의 뜰개 데이터를 가져와서 계산 되어지는 결과가 나타납니다.

그래서 차분한 값에서 각 뜰개별로 gruop을 지어주고 삭제 해줍니다.

main = main.groupby('drifter').apply(lambda group: group.iloc[1:]).reset_index(drop=True)