본문 바로가기

개발 관련 기타/ML

ML) [scikit-learn] 서울 다세대 (연립) 빌라 실거래가 통해서 동 별 적정 월세 계산 - RandomForestRegressor (with data, jupyter notebook)

과정:

 

1. 데이터 준비

2. 데이터 전처리

3. 모델 학습

4. 모델 평가


1. 데이터 준비:

 

- 실거래가 공개시스템에서 다운로드 (http://rtdown.molit.go.kr/)

- 다세대(연립)

- 2022년도

- 2023년도 1월~6월

- 2023년도 7월, 8월 (26일까지)

 

2. 데이터 전처리:

 

- train: 2022년도, 2023년도 1월~6월

- validate: 2023년도 7월, 8월 (26일까지)

- train 데이터 합치기

- 데이터 중 전세 제거

- 보증금 column 에서 comma 제거

- 시군구 column 데이터는 labelencoder 로 값 부여

- drop nan data

- 월세 column 에서 str 골라내서 comma 제거 및 int로 type 변경

 

3. 모델 학습:

 

- model: RandomForestRegressor

 

4. 모델 평가:

 

- error: mean_absolute_error

- result: 13.58378536758879

 

5. 결론:

 

- 현재 모델로 월세 계산시 약 13만원 차이가 위 또는 아래로 발생함


data.zip
5.14MB


서울 다세대 (연립) 빌라 실거래가 통해서 동 별 적정 월세 계산