표 2 변수유형별 분석절차

유형 절차 정량변수 연속형 수치변수 정성변수 더미형 이항변수
전 처리 • 공매물건 자료 정규화• 경제환경 자료 정규화• RDB로저장※ 도구: MySQL • 감정평가서 이미지 변환• 감정평가서의 문장 추출• 물건번호별 문장 저장※ 도구: OCR, Excel
변수 추출 • 물건·집계별 변수 계산• 경제환경별 변수 계산※ 도구: MySQL • 토픽분석 및 용어사전정의• 군집 기반 정성 변수 추출※ 도구: Khcoder
변수 통합 • 물건별 수치변수와 정성변수를 통합하여 저장• 물건번호별 분석용 테이블 구성※ 도구: MySQL
전 처리 • 분포검정: 변수들의 정규성 검증 및 log 치환• 변수표준화: 독립변수의 표준화계수 도출• 주성분분석: 주요 변수 도출 및 차원 축소 ※ 도구: RStudio
분석 • IV, 2SLS: 낙찰가격의 인과 관계 분석
진단 • 모형진단: 다중공선성, 자기상관성, 이분산성, 이상치, 잔차분석
평가 • 성능평가: adj.R2, RMSE, MAE, MAPE
주 : IV, instrumental variable; 2SLS, two-stage least squares; RMSE, root mean square error; MAE, mean absolute error; MAPE, mean absolute percentage error.