안녕하세요 팀 은지짱짱걸입니다.
저희가 머신러닝으로 값들을 예측할 때 많은 종류의 머신러닝 기법을 사용하곤 합니다.
많은 종류의 기법을 사용한 뒤에 지표를 비교하기엔 상당히 번거롭습니다.
그래서 한번에 여러가지 기법들을 모두 학습해준뒤, 평가 지표까지 알려주고, 최고의 모델까지 선정하는 코드를 간단히 설명 드리겠습니다.
먼저 파이썬 버전은 3.8로 맞춰 줘야합니다.
가상환경 설정을 위해서 annaconda prompt로 들어가서 가상환경을 파이썬 3.8로 설치를 해줍니다.
이후에 pycaret을 설치 해줍니다.
설치가 완료 되면 주피터 노트북에 가상환경이 나오게 설정한 뒤 주피터 노트북으로 접속 해서, 새로만은 가상환경을 커널로 새로운 파일을 만들어 줍니다.
이후에 만약에 제가 train이라는 데이터 셋에서 result라는 값을 회귀하는 모델을 만든 뒤에 test 데이터 셋에 적용 시킨다고 가정하면 코드는 다음과 같습니다.
import pycaret.regression import *
reg = setup(data = train, target = "result")
best_model = compare_model()
predictions = predict(best_model, data = test)
이렇게 하면 predictions 라는 데이터 프레임의 제일 마지막 열에 test데이터의 예측 값이 할당 된것을 확인 할 수 있습니다.
참고 : http://pycaret.org