Ⅰ. 서론
주거는 인간에게 필수불가결한 요소로, 경제 성장과 주거보급률 100% 초과 이후에는 단순한 거주의 기능을 넘어 삶의 질을 규정하는 공간적 자원으로 인식되기 시작했다(김호철, 2025). 그 결과 주거 선택 시 고려되는 요인들은 점차 다양화되고 세분화되는 양상을 보이고 있다. 이러한 변화 속에서 ‘몰세권’, ‘숲세권’, ‘슬세권’ 등 다양한 ‘~세권’이 등장하였다. ‘~세권’은 많은 사람의 주거 선호도가 집적된 결과로, 부동산시장의 수요 변화를 반영하는 신조어이다.
특히, 2020년 이후 한국 부동산시장에서 의료접근성을 의미하는 ‘병세권’이라는 단어가 등장하였다. 이는 코로나19 팬데믹을 계기로 의료시설 접근성에 대한 사회적 인식이 확대되었고, 초고령사회로의 진입과 맞물려 의료인프라가 치료 공간을 넘어 삶의 질을 지원하는 서비스 제공처로 재인식되었음을 시사한다(김보경 외, 2016). 국민건강보험공단의 의료이용지표에 따르면 한국의 1인당 연간 외래 내원일수는 2019년 18.38일에서 팬데믹의 영향으로 2020년 16.03일로 감소하였다. 그러나 이후 가파르게 반등하여 2022년에는 18.67일, 2023년에는 19.07일로 나타나, 전반적으로 높은 외래 이용 수준을 기록하고 있다(국민건강보험공단, 2025). 이렇듯 의료접근성은 지역 간 사회경제적 기회와 함께 지역의 질을 구성하는 핵심 요소 중 하나로 평가되며(Jeon and Woo, 2024), 이에 따라 주거 선택에서도 주요한 결정요인으로 작용할 가능성이 있다.
이러한 맥락에서 주택 가격은 다양한 입지 특성과 생활 편의 요인 등에 대한 시장 참여자의 선호가 반영된 결과이므로(장영길·유주연, 2019), 의료접근성이 가격에 유의미하게 반영된다면 이는 의료인프라의 가치가 주택 시장에서 자본화되고 있음을 의미한다. 따라서 해당 관계를 실증적으로 규명한다면 의료인프라가 주거 가치 형성에 어떠한 방식으로 작용하는지 확인할 수 있다.
한편, 해외에서는 의료접근성과 주택 가격 간의 관계를 분석한 연구가 비교적 활발하게 이루어져 왔다. 의료시설과의 접근성이 주택 가격에 비선형적으로 영향을 미친다는 결과가 보고되고 있는데(Gu et al., 2024; Peng and Chiang, 2015), 이러한 복합적인 영향은 한국에서도 유사하게 나타날 수 있다. 실제로 구급차 사이렌 소리나 경광등으로 인한 민원 및 갈등을 확인할 수 있으며(손수형, 2025), 인근에 대학병원이 위치함에 따라 교통혼잡이 발생한 사례도 존재한다(소봄이, 2025). 이는 주택 인근에 의료시설이 위치하면 의료 서비스를 가까이서 편리하게 이용할 수 있으면서도 소음이나 혼잡과 같은 부(‒)의 외부효과를 동반할 수 있기 때문이다(Peng and Chiang, 2015). 이와 같은 상반된 효과의 공존을 고려할 때, 의료접근성과 주택 가격 간의 관계가 단순한 선형 구조로 설명되기 어려움을 알 수 있다.
이에 본 연구는 의료접근성이 아파트 가격 형성에 미치는 영향을 실증적으로 분석하고자 한다. 특히, 의료시설을 공공의료시설, 병·의원, 종합병원으로 구분하여 유형별 접근성과 아파트 가격 간의 비선형적 관계를 규명하는 것을 목적으로 한다. 이러한 비선형적 관계 분석을 통해 가격 효과가 전환되는 지점, 즉 임계거리를 식별할 수 있으며, 의료접근성이 실제로 가격 프리미엄 또는 할인 요인으로 작용하는 구체적 범위를 제시할 수 있다. 이는 의료시설 입지 계획과 주거환경 정책 수립에 있어 보다 정밀한 근거를 제공한다는 점에서 중요한 의미를 갖는다. 이에 따른 본 연구 질문은 첫째, “공공의료시설, 병·의원, 종합병원으로 분류한 의료시설의 접근성이 아파트 가격에 유의미한 영향을 미치는가?”, 둘째, “아파트 가격 형성에 있어 유형별 의료시설의 방향성은 어떠한가?”, 셋째, “의료접근성과 아파트 가격 간의 관계는 비선형적 특성을 보이는가?”이다.
Ⅱ. 선행연구 고찰
다수의 국내외 연구에서 주택 가격은 다양한 요인에 의해 영향을 받는다는 것이 밝혀지고 있다. 그중에서도 주택 가격은 층, 건축연한, 세대수, 세대당 주차대수와 같은 주택의 물리적인 특성에 의해 영향을 받음이 확인되었다. 이러한 변수들은 대부분의 선행연구에서 통제변수로 활용하고 있으며, 전반적으로 유사한 결과가 나타나고 있다. 층이 높을수록 주택 가격은 상승하는 경향이 있었다(현동우, 2021; Jun, 2019). 건축연한은 적을수록 주택 가격이 상승하는 경향이 나타났으며(김보경 외, 2016; Ligus and Peternek, 2016), 국내에서는 건축연한과 주택 가격 간 비선형적인 관계도 확인되고 있다(서정석 외, 2020; Ko and Park, 2024). 이어서 대체로 세대수가 많을수록 세대당 주차대수가 많을수록 주택 가격이 상승하는 경향이 있었다(서경규 외, 2016; 허은진·최성원, 2023).
주택의 근린 환경과 주택 가격 간의 관계가 자주 탐색되고 있다. 예를 들어, 오지영·서원석(2023)은 서울시 노원구를 대상으로 학교 특성과 유형을 세분화하여 학교 접근성이 아파트 가격에 미치는 영향을 확인하였다. 분석 결과, 진학 비선호 유형 고등학교, 진학 선호 유형 고등학교, 지역 명문 고등학교와 인접한 것은 아파트 가격 상승요인으로 확인되었다. 또한, 비선호 학교 근접성 탄력도가 명문 고등학교보다 더 높게 나타났는데, 이에 대해 학업 성취도가 낮은 학교가 상대적으로 내신 성적 관리에 더 유리해서 나타난 결과라고 보고하였다.
녹지 혹은 하천과 같은 자연환경과 주택 가격 간의 연구도 진행되고 있다. 오현택·홍성조(2023)는 대전시를 대상으로 도시공원의 세부시설 및 면적이 아파트 시세가격에 미치는 영향을 확인했다. 분석 결과, 아파트와 가까운 공원에 운동시설이 있을수록 아파트 가격이 하락하는 경향이 나타났다. 이에 대해 운동시설이 있으면 소음 문제가 발생할 수 있어 사람들이 선호하지 않는다고 주장하였다. 그리고 나은지 외(2024)는 공간헤도닉모형을 활용하여 생활권 공원 유형에 따라 공원 접근성이 아파트 가격에 미치는 영향이 상이함을 확인했다. 더불어 배상영 외(2018)는 한강과 인접한 아파트 단지일수록 조망과 접근성이 우수하기에 때문에 가격이 더 높다고 하였다.
이 외에도 대중교통시설을 세분화하여 대중교통 접근성과 아파트 가격 간의 관계를 확인한 연구가 수행되고 있다. 동탄을 대상으로 한 최필성·현동우(2021)의 연구에서 시내버스정류장 접근성은 주택 가격에 통계적으로 유의미한 영향을 미치지 못한 반면, 광역버스 접근성은 주택 가격에 유의미한 영향을 미치는 것으로 나타났다. 아울러 강수진·서원석(2016)은 가장 가까운 지하철 노선에 따라 지하철역 접근성이 형성하는 아파트 가격 프리미엄의 크기가 다름을 확인하였다. 이처럼 한강, 공원, 학교, 대중교통 등의 근린시설 접근성은 주택 가격에 차별적인 영향을 미칠 수 있음을 알 수 있다.
의료접근성은 생활편의성(amenity)의 요소로 인식되며, 주택 가격을 설명하기 위한 변수 중 하나로 사용되어 왔다. 이성현·전경구(2012)는 대구를 대상으로 도시기반시설이 주택 가격에 미치는 영향을 분석하였으며, 이때 의료시설을 도시기반시설에 포함하였다. 분석 결과, 의료시설이 밀집해 있으나 이를 이용하는 서비스 인구가 상대적으로 적은 지역일수록 주택 가격이 높은 것으로 나타났다. 홍하연·이주형(2015)은 아파트 가격에 영향을 미치는 요인의 10년(2003~2013)간 시계열적 변화와 공간적 분포를 분석하였으며, 그 결과 의료시설의 영향력은 주로 강남권역에서 상대적으로 높게 나타나는 것으로 확인되었다.
이러한 연구들을 바탕으로, 의료접근성과 아파트 가격 간의 관계를 보다 면밀하게 확인하는 연구가 이루어지고 있다. 예를 들어, 김보경 외(2016)는 경기도의 아파트 단지를 대상으로 주택 가격과 의료접근성 간의 관계를 실증적으로 분석하였다. 거래량 상위 25%의 아파트 단지를 분석 대상으로 설정하고, 의료기관은 1차, 2차, 3차로 분류하여 접근성을 측정하였다. 그 결과, 1차 의료기관의 밀도가 유의한 영향을 미치는 것으로 나타났다. 이에 대해 1차 의료기관의 접근성은 진료과목의 수나 다양성을 함께 고려할 필요가 있다고 주장하였다. 또한, 2, 3차 의료기관이 아파트 가격에 미치는 영향이 작은 것에 관하여 접근의 형평성 측면에서 바라볼 필요가 있음을 주장하였다.
한편, 해외에서도 의료접근성이 주택 가격에 미치는 영향이 확인되고 있으며, 그 영향은 지역의 맥락에 따라 상이하게 나타나고 있다. Chen et al.(2022)은 중국의 푸저우(Fuzhou)시를 대상으로 병원 및 철도 접근성이 주택 가격에 미치는 영향을 종합적으로 분석하였다. 이 연구에서는 의료시설 접근성을 거리, 양, 밀도 세 가지 지표로 측정하였으며, 세 가지 변수 모두가 주택 가격 상승과 유의미하게 연관됨을 확인하였다. 또한 병원 접근성이 증가할수록 철도에 대한 의존도는 상호작용을 통해 감소하였다. 반면, 대만 타이페이(Taipei) 대도시권을 대상으로 한 Peng and Chiang(2015)의 연구에서는 선형 기반의 모형을 활용하였을 때 종합병원까지 근접은 주택 가격을 하락시키는 것으로 나타났다. 그러나 스플라인(spline) 분석 기법을 활용한 결과, 종합병원으로부터 약 500~1,000m 이상 떨어진 구간에서는 오히려 주택 가격이 상승하는 현상이 관찰되었다. 이는 종합병원과의 거리가 너무 가까우면 소음, 교통혼잡 등 부정적 영향이 발생할 수 있어 주택 가격이 오히려 낮아질 수 있으나, 일정 거리 이상 떨어지면 병원 근접의 편익이 주택가치를 상승시키는 긍정적 효과로 전환될 수 있음을 시사한다. 이와 유사하게, Peng(2021)은 대만 타이베이 대도시를 대상으로 노인의 의료접근성이 주택 가격에 미치는 영향을 분석하기 위해 공간 분위수 회귀(spatial quantile regression, SQR)를 사용하였다. 연구 결과, 구급차 대비 노인 비율의 효과는 주택 가격 수준에 따라 달랐는데, 낮은 가격대 지역에서는 주민들이 구급차의 경적 소음을 불쾌하게 느낀 반면, 높은 가격대의 지역에서는 주민들이 구급차가 제공하는 의료서비스의 편익을 긍정적으로 평가하는 것으로 나타났다. Gu et al.(2024) 역시 의료접근성은 주택 가격에 프리미엄과 패널티를 동시에 제공함을 확인하였다. 구체적으로 1차 및 2차 의료기관에 대해 도보 5~10분 거리, 3차 의료기관에 대해서는 도보 10~15분 거리가 주택 가격 상승과 관련된 반면, 3차 의료기관의 10분 이내 근접성은 오히려 주택 가격 하락과 연결되었다. 이러한 결과는 한국에서도 의료시설의 근접성이 주택시장에 복합적인 영향을 미칠 수 있음을 시사한다.
주택 가격 연구에서는 전통적으로 헤도닉 가격모형(hedonic price model)이 주로 활용되어왔다. 헤도닉 가격모형은 계수의 해석이 용이하지만, 변수의 선형성을 전제로 하고 있다는 특징이 있어 현실의 복잡한 비선형성 포착에 한계가 있다. 이에 최근에는 대규모 데이터를 효율적으로 처리하고 비선형성의 포착이 가능한 기계학습(machine learning) 기법이 주택 가격 연구에서 활용되고 있다. 다수의 연구는 헤도닉 가격모형과 머신러닝 모형을 비교하였는데, Li et al. (2021)은 중국 선전(Shenzhen)시를 대상으로 주택 가격에 영향을 미치는 요인을 분석하였다. 요인의 중요도 순위를 파악하고 그 정량적인 효과를 밝히기 위하여 머신러닝 기법 중 하나인 XGBoost(eXtreme gredient boosting)와 헤도닉 가격모형을 비교하여 XGBoost가 부동산 연구 분야에서 유용하게 활용될 수 있는 잠재력이 있음을 주장하였다. Hong et al.(2020)은 11년간의 강남 지역 아파트 거래를 활용하여 OLS (ordinary least squares)와 랜덤 포레스트(random forest)의 비교를 통한 주택 가격 예측모형을 개발하였다. 그 결과 성능과 정확도에서 랜덤 포레스트가 우수한 예측력을 나타냈으며, OLS 모델이 포착하지 못하는 가치결정 과정의 복잡성을 더 잘 추정할 수 있는 보완재가 될 수 있음을 제시하였다. 한편, 주택 가격에 영향을 미치는 요인에 관한 연구를 진행한 Xue et al.(2020)은 교통접근성이 주택 가격에 미치는 영향력에 대하여 헤도닉 가격모형과 랜덤 포레스트의 영향력을 비교 분석하였다. 그 결과 랜덤 포레스트의 모형 적합도가 더 높게 도출되었으며, 버스와 지하철 접근성 중요도가 각각 2, 3순위로 높게 나타나 교통환경의 중요도를 보다 명확하게 제시하였다.
머신러닝의 장점 중 하나인 비선형성 포착을 활용한 연구도 확인된다. Zou et al.(2022)은 GBDT(gradient boosting decision tree), 다중회귀, GWR(geographically weighted regression)을 활용하여 대기오염이 아파트 가격에 미치는 영향을 분석하였다. 세 모형 비교 시 GBDT가 비선형성을 더 잘 분석함을 입증하였다. 또한 PM2.5 및 NO2의 중요도가 일부 도시환경 변수보다 높게 산출됨을 밝히며 주택 가격 예측에서 머신러닝의 활용도를 강조하였다. 오지훈·김정섭(2018)은 다변량 적응회귀 스플라인(multivariate adaptive regression splines, MARS) 모형을 활용하여 주택특성과 주택 가격 사이의 비선형 관계를 분석하고 영향력의 변곡점을 파악하였다. 이를 통하여 기존 선행연구에서의 주택 특성의 조작적 정의의 적절성을 검토하고, 향후 헤도닉 가격모형 연구에서의 모형 설명력 개선 방안을 제시하였다. 이와 같은 선행연구를 통해 머신러닝 기법은 비선형적 구조 및 변수 간 복합적인 상호작용을 포착하는 데 우수한 기법임을 알 수 있다.
선행연구 검토 결과, 의료접근성이 부동산시장에 미치는 영향은 지역적 특성에 따라 다르게 나타나고 있음을 확인하였다. 이에 따라 국내에서도 의료접근성이 주택 가격에 미치는 영향을 보다 면밀하게 파악할 필요가 있으며, 본 연구의 차별성은 다음과 같다.
첫째, 기존 선행연구에서는 분석 대상 지역과 표본 구성의 제한으로 인해 의료접근성과 아파트 가격 간의 관계를 충분히 설명하지 못하였다. 의료접근성이 아파트 가격에 미치는 영향을 확인한 연구는 국내에도 일부 존재하나, 경기도 거래량 상위 25% 단지만을 대상으로 하였으며 2010년 4분기 데이터를 사용했다. 이에 본 연구는 2020년부터 2022년까지 서울시 아파트 매매 실거래가 전수자료를 활용하여 아파트 가격과 의료접근성 간의 관계를 정밀하게 분석한다.
둘째, 머신러닝 기반 해석 도구를 활용하여 의료접근성과 아파트 가격 간의 비선형적 관계를 규명하고자 한다. 국내 연구에서는 아직까지 의료시설과 아파트 가격 간의 선형적 관계만을 확인하였다. 이에 본 연구는 의료시설과의 거리에 따른 가격 예측 변화의 변곡점인 임계거리를 식별함으로써 보다 정교한 영향 메커니즘을 도출한다. 또한, 의료시설을 유형별로 분류하여 각 의료시설 별 임계거리를 제시하고, 기여도를 정량적으로 산출한다는 점에서 국내의 기존 연구와 차별성을 지닌다.
Ⅲ. 연구방법론
본 연구의 시간적 범위는 2020년에서 2022년까지이며, 공간적 범위는 서울시이다. 서울시는 상급종합병원이 집중적으로 입지해 있으나, 지역별로 의료시설과의 접근성 수준에는 차이가 존재한다. 이러한 특성은 의료접근성이 아파트 가격에 미치는 영향을 분석하는 데에 적합한 환경을 제공한다. 종속변수는 m2당 아파트 가격이며, 국토교통부에서 제공하는 2020년에서 2022년까지 발생한 서울시 아파트 매매 실거래가 140,243건 중 결측값을 제외한 126,078건을 사용하였다. 이때, 종속변수의 경우 시기별 가격 변동을 반영하기 위하여 2020년 1월을 기준으로 부동산원에서 제공하는 아파트 매매 실거래가격지수로 보정하였다. 시간적 범위는 2020년부터 2022년까지로 설정하였는데, 해당 기간은 팬데믹이라는 거시적 충격 속에서 저금리와 풍부한 유동성이 지속된 특수한 시장 환경에 해당한다(배종찬·정재호, 2021). 동시에 초고령 사회로의 진입을 앞둔 인구 구조 전환기로서 의료인프라의 중요성이 부각되던 시기이기도 하다(김호종·유원섭, 2022). 이러한 감염병 확산 경험과 인구 구조 변화가 중첩되면서 의료접근성이 주거 입지 선택에 반영될 가능성이 확대된 시기로 판단하였다. 또한, 아파트는 대표적인 주거 유형 중 하나로, 높은 시장 점유율을 지니고 부동산시장 상황에 민감하게 반응하기 때문에 연구 대상으로 설정하였다(고종완, 2014). 실제로 2022년 주택총조사에 따르면 전국의 주택 유형별 구성비 중 아파트는 64%를 차지하고 있으며, 서울에서는 59.5%로 과반 이상을 차지한 것을 확인할 수 있다(주택총조사, 2025). 독립변수는 아파트 특성, 근린 특성, 위치 특성, 의료접근성 특성으로 구분되며, 이에 따른 연구에 사용된 모든 변수의 정의와 출처는 <표 1>과 같다.
먼저, 아파트 특성은 전용면적, 층, 현관구조와 같은 구조 특성과 세대수, 세대 당 주차대수, 건축연한, 난방유형, 브랜드와 같은 단지 특성이 포함된다. 이와 같은 변수들은 아파트 자체의 특성이 가격에 미치는 영향을 포착하기 위해 포함되었다(김희호·박세운, 2013; 오지영·서원석, 2022; 이규호 외, 2024). 근린 특성으로는 한강, 공원, 중심업무지역, 지하철역, 버스정류장, 초등학교를 변수로 구성했다. 이러한 근린시설까지의 거리는 다수의 선행연구에서 아파트 가격에 영향을 미치는 것으로 확인되어 변수로 설정하였다. 그리고 중심업무지구는 양질의 일자리가 집중되고 교통이 편리하며 다양한 경제활동이 이루어지는 공간으로, 이러한 직주 접근성은 아파트 가격에 영향을 미칠 수 있기에 변수로 고려되었다. 또한, 위도와 경도는 공간적 위치에 따른 영향을 통제하기 위해 포함하였다(구본상·신병진, 2015; 이유리·박승훈, 2025; Caudill et al., 2024; Zhang, 2025). 구체적으로, 홍정의(2021)는 머신러닝 기반 주택 가격 모형에서 위도와 경도를 활용할 경우 입지 차이에 따른 가치 변동을 보다 효과적으로 포착할 수 있다고 제시한 바 있다.
본 연구의 관심 변수는 의료접근성 특성이다. 의료시설 유형은 공공의료시설, 병·의원, 종합병원으로 분류하였다. 선행연구에서는 의료시설을 1차, 2차, 3차로 구분한 사례도 있었으나, 본 연구에서는 일반적인 시각에서 종합병원과 상급종합병원의 구분이 명확하지 않다는 점을 고려하여 이를 통합하였다. 그리고 공공의료시설은 보건소, 보건지소, 보건분소로 한정하였다. 국립중앙의료원, 서울의료원, 서울대학교병원 등도 공공의료기관에 해당될 수 있으나, 이들은 진료 중심의 종합병원 또는 상급종합병원에 해당하므로 본 연구에서는 종합병원 범주로 구분하여 분석하였다. 병·의원의 경우에는 의료법상 필수 진료과목으로 규정되어 있는 내과, 외과, 산부인과, 소아청소년과만을 대상으로 선정하였다. 이는 강남권을 비롯한 특정 지역에 성형외과·피부과 등 비필수과목 중심의 의원이 과도하게 분포하는 경향을 고려하여 실제 의료접근성을 보다 정확하게 파악하기 위함이다.
한편, 의료시설은 개업과 폐업과 같은 변동이 잦아 해당 변수들은 아파트가 거래된 동일 연도를 기준으로 실제 운영 중인 의료시설만을 반영하였다. 의료시설 유형 중에서는 병·의원의 변동이 가장 크게 나타났으며, 2020년 4,828개에서 2022년 5,183개로 증가하였다. 또한, 2020년 대비 2022년 기준으로 병·의원은 강남구에서 가장 큰 증가 폭을 보였다.
이러한 의료시설의 접근성은 아파트 중심점으로부터 최단거리를 기준으로 측정하였다. 의료접근성이란 의료시설까지의 이동 거리와 소요 시간과 같은 물리적 요인뿐 아니라 경제적 여건, 의료보험 유무 등 사회적 요인까지 포괄하는 복합적인 개념으로 정의된다(이유진·김의준, 2015). 따라서 의료접근성은 시설과의 거리, 시설 수, 이동 시간 등 다양한 방식으로 측정될 수 있다. 하지만, 본 연구에서는 의료시설을 공공의료, 병·의원, 종합병원으로 유형별로 구분함에 따라 각 유형별 영향 범위에 대한 명확한 기준이 충분히 정립되어 있지 않아 시설 수나 밀도로 측정하는 데 한계가 있었다. 이러한 이유로 본 연구에서는 객관적 비교가 가능한 지표로서 최단거리를 활용하였다.
본 연구에서는 의료접근성과 아파트 가격 간의 관계를 분석하기 위해 단계적 접근을 수행하고자 하며, 헤도닉 가격모형을 기반으로 한 회귀분석과 머신러닝 기법을 활용한다. 분석의 첫 단계로 는 각 변수의 영향 방향과 통계적 유의성을 참고하기 위해 OLS를 통해 분석한다. 다음으로 랜덤 포레스트, XGBoost, LightGBM(light gredient boosting machine) 세 가지 모형의 예측 성능을 비교하고, 최적의 성능을 보이는 모형을 선정하여 설명 가능한 인공지능(eXplainable artificial intelligence, XAI)을 적용한다. 이를 통해 SHAP (shapley additive explanation) 값을 산출하여 변수의 상대적 중요도와 영향 방향을 해석한다. 또한 부분 의존도 플롯(partial dependence plot, PDP)을 생성하여 주요 변수와 예측값 간의 관계를 시각화한다.
Rosen(1974)이 제안한 헤도닉 가격모형은 전통적으로 부동산 가격 분석에 널리 활용되어 온 모형이다. 헤도닉 가격모형은 재화의 가치는 그 재화에 내재된 다양한 속성들, 즉 소비자가 효용을 느끼고 이에 따라 가격을 지불할 의향이 있는 특성들에 의해 형성된다고 본다(김우성 외, 2019). 헤도닉 가격 함수는 일반적으로 회귀분석을 통해 추정되며, 형태는 선형 모형, 세미로그 모형, 이중로그 모형 등 세 가지 주요 형태로 구분될 수 있다. 본 연구에서는 회귀계수의 직관적 해석이 가능하고 이분산성을 완화할 수 있는 세미로그 모형을 적용하였으며, 식은 (식 1)과 같다.
lnY: 아파트 가격의 자연로그값
α: 상수항
β: 독립변수들의 계수 값
χn: 독립변수
e: 잔차항
본 연구에서 사용한 머신러닝 모형들은 트리 기반 앙상블 알고리즘(tree-based ensembled algorithms)을 기반으로 하며, 다수의 의사결정나무(decision tree)를 조합하여 예측 성능을 향상시킬 수 있다. 여기에서 앙상블이란 여러 개의 약한 학습기(weak learners)를 결합하여 단일 모델보다 우수한 일반화 성능을 달성하는 머신러닝 기법으로 배깅(bagging), 부스팅(boosting) 등이 대표적이다. 그중에서 랜덤 포레스트는 배깅 기법을 이용해 여러 개의 의사결정나무를 독립적으로 학습시킨 후 결과를 집계한다. 이를 통해 과적합을 완화하고 다중공선성에 비교적 강건하다는 장점이 있다(Breiman, 2001). 반면, XGBoost와 LightGBM은 이전 모형의 예측 오류를 다음 단계에서 보완하는 부스팅 방식으로 약한 학습기를 순차적으로 결합한다. XGBoost는 그레디언트 부스팅(gredient boosting)을 기반으로 점진적으로 모델의 성능을 향상시켜 높은 예측 정확도를 제공하고, 훈련 중에 복잡한 모델에게 불이익을 주어 트리의 성장을 제한함으로써 과적합을 방지한다는 특징이 있다(이정선, 2024; Zhang et al., 2024). 그리고 LightGBM은 그레디언트 부스팅에 기반하나, GOSS(gradient-based one-side sampling)와 EFB(exclusive feature bundling) 기술이 추가되어 계산 시간과 메모리 사용량을 줄여 대규모 데이터와 고차원 변수 환경에서도 효과적으로 학습을 수행할 수 있다(Ke et al., 2017).
하지만, 머신러닝 기법은 모델이 복잡하고 비선형적인 의사결정을 수행할 때, 예측 결과에 대한 내부 작동 원리를 파악할 수 없는 한계를 지닌다(Petch et al., 2022). 따라서 예측 과정의 투명성을 확보하기 위해서는 XAI가 필요하다. XAI는 머신러닝 알고리즘이 도출한 예측 결과와 그 판단 근거를 인간이 이해할 수 있는 형태로 설명하는 방법론을 의미한다. 본 연구에서는 모델의 예측 결과를 해석하기 위해 XAI 중 SHAP와 PDP 플롯을 활용한다. SHAP는 협력적 게임 이론(cooperate game theory)에서 도출된 shapely value를 기반으로, 각 설명변수가 예측값에 기여한 상대적 중요도와 영향 방향을 정량적으로 파악할 수 있다(Lundberg and Lee, 2017). 다음으로 PDP는 머신러닝 모델의 특성이 예측에 미치는 평균적인 한계 효과(marginal effect)를 시각화할 수 있는 기법이다(Friedman, 2001). 여기에서 partial dependence 값은 특정 독립변수의 값이 주어졌을 때, 모델이 예측한 종속변수의 평균적 변화를 나타낸다. 다시 말해, 다른 변수들의 영향은 평균화된 상태에서 관심 변수 하나가 예측값에 어떤 방향과 크기로 영향을 주는지를 보여주는 값이다. 따라서 PDP 곡선의 모양과 기울기를 통해 관심 변수 값이 증가할 때 예측값이 평균적으로 어떻게 변하는지 확인할 수 있으며, 이를 통해 변수와 예측값 사이의 비선형적 관계를 이해할 수 있다.
이어서 세 가지 모형의 예측력을 비교한 후 가장 우수한 알고리즘을 선정한다. 머신러닝은 예측 성능의 최적화를 위해 하이퍼 파라미터(hyper parameter) 튜닝이 필수적이다. 본 연구에서는 하이퍼 파라미터 값을 탐색하기 위해 랜덤 서치(random search)를 적용하였으며, 그 결과는 <표 2>와 같다. 그리고 분석을 위해 트레이닝 데이터와 테스트 데이터를 8:2 비율로 무작위로 분할하였고, 모델 성능을 보다 안정적으로 평가하기 위해 5겹 교차 검증(5-fold cross validation)을 수행하였다.
그리고 예측 모형의 성능 평가를 위해 결정계수(R2), 평균제곱오차(mean squared error, MSE), 평균절대오차(mean absolute error, MAE)를 주요 지표로 사용하였다. R2로 모형의 설명력을 파악하고, MSE와 MAE를 통해 모델이 예측한 값과 실제 값 사이의 불일치 정도를 확인한다. 일반적으로 R2는 값이 클수록 모형의 설명력이 높은 것으로 해석되며, MSE와 MAE는 값이 작을수록 예측 오차가 적어 모형의 성능이 우수한 것으로 판단한다. <표 3>에 따르면 세 모형 중 랜덤 포레스트가 설명력이 가장 높고 예측 오차가 적은 것으로 나타났다. 따라서 최종 분석 모형으로 랜덤 포레스트를 채택하며, 랜덤 포레스트에 XAI를 적용하여 결과를 해석한다.
| 구분 | R2 | MSE | MAE |
|---|---|---|---|
| HPM | 0.546 | 0.0744 | 0.2125 |
| 랜덤 포레스트 | 0.9578 | 0.0071 | 0.0567 |
| XGBoost | 0.9207 | 0.0130 | 0.0823 |
| LGBM | 0.9558 | 0.0075 | 0.0601 |
Ⅳ. 분석 결과
실증적인 분석에 앞서, 변수들의 특성을 파악하기 위해 기초통계분석을 수행하였다(<표 4>). 종속변수인 m2당 아파트 가격은 최솟값 188만 원, 최댓값 5,579만 원이며 표준편차는 592만 원으로 확인된다. 이는 서울이라는 하나의 도시 안에서도 아파트 가격 수준의 편차가 상당히 크다는 점을 보여준다. 아파트 특성을 살펴보면, 전용면적은 평균 75.22m2이고, 평균 층수는 9층으로 나타났다. 건축연한은 평균 19년으로, 최솟값과 최댓값을 통해 신축 아파트부터 노후 아파트까지 다양하게 분포하고 있음을 확인할 수 있다. 세대수는 평균 약 1,000세대 수준이고, 세대당 주차대수는 평균은 1.08대이지만 최솟값은 0.01대이다. 최솟값의 경우, 과거에 건설된 소규모 나홀로 아파트일 가능성이 존재한다. 그리고 브랜드의 경우 상위 10위권 건설사가 시공한 아파트가 약 35%를 차지하였으며, 현관구조가 계단식인 아파트는 약 68%, 지역난방을 사용하는 아파트는 약 25%로 나타났다.
근린 특성 중 한강과 중심업무지역까지의 거리는 표준편차가 크게 나타났으며, 공원까지의 평균 거리는 100m이나, 공원에 인접한 아파트부터 최대 1,117m 떨어진 아파트까지 있어 아파트 별로 편차가 존재함을 알 수 있다. 지하철역까지의 평균 거리는 533m, 버스정류장까지의 평균 거리는 125m, 초등학교까지의 평균 거리는 334m로 나타나, 거래된 아파트들이 전반적으로 교통 및 교육시설 접근성이 양호한 입지에 분포하고 있음을 보여준다.
의료접근성 특성의 경우, 공공의료시설까지의 평균 거리는 1,160m였으며, 최솟값은 3m, 최댓값은 4,700m로 나타났다. 병·의원의 경우 평균 거리는 약 200m이지만 최솟값이 1m로 확인된 점은 단지 내 상가에 위치한 병원에 따른 결과로 해석된다. 또한, 표준편차가 의료접근성 특성 중 가장 작게 나타나 전반적으로 병·의원은 비교적 균질한 수준으로 분포하고 있다고 판단된다. 반면, 종합병원까지의 거리는 최솟값이 22m, 최댓값은 4,614m로 나타났으며, 표준편차가 가장 크게 확인된다. 이는 종합병원의 수가 상대적으로 제한적이기 때문으로 이해할 수 있다.
헤도닉 가격모형 분석 결과는 <표 5>와 같으며 모든 변수는 0.1% 유의수준(p〈0.001)에서 통계적으로 유의하였다. 분석 결과를 살펴보면, 전용면적, 위도, 한강, 공원, 중심업무지구, 지하철역, 초등학교, 병·의원 변수는 부(‒)의 영향을 보였다. 이는 해당 변수들은 변수 값이 감소할수록 아파트 가격이 상승하는 것으로 해석된다. 특히, 병·의원의 경우, 일상적인 의료서비스를 제공하므로 접근성이 높을수록 주거가치가 증가할 것이라는 기대와 일치한다. 반면, 나머지 변수들은 정(+)의 영향을 미치는 것으로 나타났다. 다만, 이러한 결과는 헤도닉 가격 모형이 전제하는 선형관계 하에서 도출된 것으로 변수 간의 비선형적 관계를 충분히 반영하지 못했을 가능성이 있다(Ko and Park, 2024). 주거용 토지 가격 영향요인의 비선형성과 공간적 이질성을 탐색한 강창덕(2025)의 유사한 연구에 따르면, 마포구와 영등포구를 제외한 대부분의 지역에서 주거용 토지는 종합병원과 가까울수록 예측가격이 상승하는 경향을 보였기 때문이다. 따라서 다음 장에서는 사전에 설정한 분석 절차에 따라, 비선형적 관계를 검토하기 위해 XAI를 적용한 머신러닝 분석을 수행한다.
<그림 1> 및 <그림 2>는 각각 특성 중요도(SHAP feature importance)와 요약도(SHAP summary plot) 분석 결과이다. 특성 중요도를 통해 변수 간 상대적 중요도를 확인할 수 있고, 요약도는 변수가 예측 과정에서 어떠한 방향으로 작용하는지를 나타낸다. 그런데 <그림 2>에서 일부 변수의 예측값 기여 양상이 헤도닉 가격모형의 결과와 차이를 보임을 확인할 수 있다. 그중에서도 관심 변수인 종합병원 변수는 예측 기여도가 한 방향으로만 증가하거나 감소하지 않는다는 점에서 비선형적 관계를 시사한다.
먼저, 의료접근성 관련 변수는 전체 중요도 순위에서 중·하위권에 위치하는 것으로 나타났다. 그러나 의료접근성은 공원까지의 거리 및 브랜드와 같은 아파트 프리미엄 요인보다 상대적으로 높은 중요도를 보이고 있다. 초등학교 접근성, 공원접근성은 다수의 선행연구에서 아파트 가격에 영향을 미치는 요인으로 확인되어 왔다(김태범·장희순, 2020; 이문숙 외, 2011). 이와 같은 결과를 고려할 때, 의료접근성은 가격 예측에 있어 핵심 변수로 작용한다고 보기는 어렵지만 일정 수준의 설명력을 갖는 보완적 요인으로 해석될 수 있다.
의료접근성 변수별로 살펴보면, 아파트에서 공공의료시설까지의 거리가 멀수록 아파트 가격은 높아지는 방향으로 예측되었다. 이는 공공의료시설의 입지가 지가 등 경제적 요인에 의해 단일하게 결정되는 것이 아니라, 입지 선정 과정에서 취약계층의 의료접근성을 포함한 다양한 정책적 고려가 복합적으로 작용한 결과임을 시사한다. 즉, 공공의료시설에 가깝다고 해서 그 자체가 가격을 낮추는 요인으로 작용하는 것은 아니며, 오히려 공공의료시설이 위치하는 지역의 특성이 가격 예측에 반영된 결과로 이해된다.
병·의원의 경우 가까울수록 아파트 가격이 높아지는 방향으로 예측되었으며, 이는 1차 진료를 담당하는 병·의원 특성상 거리가 가격에 직접적인 영향을 미치기 때문이라 할 수 있다. 의원은 소규모 편의시설인 제1종 근린생활시설에 해당하며, 다른 여러 편의시설과 밀집하여 위치하는 경향이 있다. 이러한 맥락에서 병·의원과의 거리가 멀다는 것은 다른 생활 편의시설과의 접근성 역시 낮다는 것을 의미한다. 따라서 병·의원과의 근접성은 아파트 가격을 상승시키는 요인으로 평가될 수 있다.
종합병원 접근성은 아파트 가격 예측에 있어 비선형적인 특성이 관찰되었다. <그림 3>에서는 유사한 접근성 수준에서도 가격 예측에 대한 기여 방향이 혼재되어 나타났는데, 이는 종합병원이 사이렌, 교통체증 등으로 인해 주거지 근처에 위치하는 것을 기피하는 비선호시설 성격과 높은 수준의 의료서비스를 편리하게 누릴 수 있는 편의시설 성격을 동시에 반영하고 있음을 시사한다.
한편, 한강, 세대수, 경도, 건축연한, 전용면적, 중심업무지구, 난방유형, 위도, 지하철역, 세대당주차대수가 상위 10개 변수로 확인됐다. 이 중 5개 변수는 아파트 자체 특성에 해당하는데, 이는 거주 과정에서 체감되는 직접적인 가치와 밀접하게 관련되어 가격 형성에서 높은 중요도를 보인 것으로 해석된다. 구체적으로 세대수가 많을수록 단지 내 조경과 커뮤니티 시설, 관리 등 다양한 편의성이 강화되며(이정주 외, 2024; 허송·정재호, 2022), 구조·마감·디자인 등 최신 기준 충족과 관련된 신축 아파트에 대한 선호와 지역난방의 효율성 및 관리비 절감 효과는 가격을 상승시키는 방향으로 기여할 수 있다(이고은·최열, 2016; 정인성 외, 2022). 또한, 1~2인 가구 비중의 지속적인 증가에 따른 소형 주택에 대한 수요 증가와 충분한 주차공간 확보 역시 가격을 높이는 방향으로 기여한 것으로 분석된다(서울연구데이터베이스, 2023; 이용각·최막중, 2012).
그럼에도 가장 높은 중요도를 보인 변수는 한강이었는데, 한강까지의 거리가 가까울수록 가격상승 예측에 기여하는 것으로 나타났다. 한강은 서울을 대표하는 수변공간으로, 한강변에는 11개의 공원이 조성되어 있다. 이러한 한강시민공원은 뛰어난 주거환경을 제공하면서도 인근 아파트에 대하여 환경적으로 긍정적인 외부효과를 미치는 것으로 알려져 있다(양성돈·최내영, 2003). 또한, 조망권이라는 경관 가치까지 결합되면서, 한강 접근성은 가격 형성에서 핵심 요인으로 작용한 것으로 해석된다.
본 장에서는 의료접근성 변수에 초점을 맞춰 공공의료시설, 종합병원, 병·의원 세 가지 측면에서 아파트 가격에 미치는 영향을 구체적으로 살펴보았다. <그림 3>은 공공의료시설, 병·의원, 종합병원 변수에 대한 PDP 분석 결과이며, 거리 증가에 따라 모델이 예측한 아파트 가격이 평균적으로 어떻게 변하는지를 나타낸다. 해당 변수들은 거리를 기반으로 구축되었기에 PDP의 그래프가 우상향하는 구간에서는 거리가 멀어질수록 예측 가격이 상승한다는 의미로 해석된다. 이를 통해 각 의료시설의 거리에 따른 아파트 가격의 변화를 직관적으로 파악할 수 있다.
아파트에서 공공의료시설까지 거리는 약 500m를 기준으로 상이한 방향성을 보였으며, 500m 이내에서는 거리 증가가 가격 하락 예측에, 이후에는 가격 상승 예측에 기여하는 것으로 확인되었다. 이는 공공의료시설과 근접한 주거지를 선호하지 않아서 나타난 결과이기보다 앞서 언급한 바와 같이 공공의료시설의 지자체 입지 선정 과정에서 나타난 패턴으로 추정된다. 이를 고려할 때 약 500m 이내의 범위는 가격이 낮게 형성되는 것으로 예측되었음에도 기능적 이점이 확보되는 구간이라 할 수 있다. 다만 팬데믹 이후 공공의료에 대한 사회적 인식은 강화되었지만(서수인 외, 2023), 이러한 입지 특성에 따른 생활 편의성은 충분히 확보되지 못했을 가능성이 있다. 따라서 공공의료시설을 중심으로 한 생활 SOC(social overhead capital) 복합화를 추진할 경우, 의료접근성과 주거 편의성을 동시에 제고하는 데 효과적인 전략으로 활용될 수 있을 것으로 판단된다.
아파트와 병·의원 간 거리는 전반적으로 거리가 증가할수록 가격 하락 예측에 기여하는 것으로 나타났다. 그런데 약 100m 부근에서 가격 하락 폭이 급격히 커지는 것으로 파악되는데. 이는 병·의원이 도보 접근을 기반으로 이용되는 대표적 근린생활시설이라는 점과 관련될 수 있다. 즉, 약 100m 내외의 거리가 주민들이 체감하는 병·의원의 실질적 접근 범위일 가능성이 존재한다. 이러한 결과는 병·의원이 지역 주민의 일상생활 편의성과 밀접하게 연관된 시설임을 보여주며, 노후 주거지 정비나 도시재생 사업 추진 과정에서 생활밀착형 의료시설을 적절히 배치하는 전략이 주민들의 의료접근성과 연계될 수 있음을 보여준다.
종합병원과의 거리에 따른 아파트 가격은 구간별로 단기적 상승과 하락을 반복하는 예측 패턴을 보였지만, 전반적으로 1,500m 부근까지는 거리가 증가할수록 가격 하락을 예측하는 데 기여하는 경향이 나타났다. 구체적으로 약 750m까지 구간에서 거리 증가에 따른 가격의 하락폭이 매우 급격하게 나타났으며, 이후 약 1,100m까지 완만한 형태를 나타내다 다시 급격히 하락하는 패턴이 나타났다. 약 750m까지는 병원의 근접지로서의 한계효용이 매우 크게 나타나나, 1,100m까지의 구간에서는 병원근접에 따른 효용이 비선호시설 성격에 의해 일부 상쇄되는 것으로 보인다. 일반적으로 종합병원이 주거지 근처에 위치하면 소음, 교통체증, 주차난 등과 같은 부정적 외부효과로 인해 주거 쾌적성이 저해될 수 있다. 그러나 분석 결과에 따르면 종합병원이 제공하는 의료접근성의 편익이 부정적 요인보다 상대적으로 더 크게 작용하는 것으로 나타났다. 이는 주거 환경의 일부 불편함보다 응급 상황 대응이나 전문 진료의 편리함에 더 높은 경제적 가치를 부여하고 있음을 시사한다.
한편, 병·의원이 종합병원에 비해 더 짧은 임계거리를 보이는 것은 의료시설의 유형에 따른 입지 차이가 존재하기 때문이다. 가령 종합병원은 세 개의 의료시설 유형 중 수가 가장 적고, 시군구별로 균등하게 분포하지 않기 때문에 주민들이 체감하는 접근성의 효용 가치가 상이할 수 있다. 그렇기에 종합병원은 더 넓은 범위의 임계거리를 지니는 것으로 해석된다.
Ⅴ. 결론
의료접근성은 일상적 생활 편의와 직결되는 주거 요소임에도 불구하고, 기존 연구에서는 그 역할이 체계적으로 검증되지 못했다. 이에 본 연구는 도시 내 의료인프라의 유형과 거리 조건에 따라 상이한 효용을 가질 수 있다는 점에 주목하여, XAI 기법을 적용한 랜덤 포레스트 모형을 활용하여 의료접근성이 주택 가격 형성에 미치는 영향을 실증적으로 분석하였다. 연구의 주요 결과는 다음과 같다.
첫째, 의료접근성은 아파트 가격에 유의미한 영향을 미치는 것으로 분석되었다. 헤도닉 가격모형에서 공공의료시설, 병·의원, 종합병원은 통계적 유의성을 나타냈으며, 머신러닝 분석 결과에서도 의료접근성은 전통적인 프리미엄 요인보다 높은 중요도를 보이는 것으로 나타났다. 이는 의료접근성이 주민의 일상적 건강관리와 의료 이용의 안정성을 보장하는 기반으로 작용함으로써 주거에 있어 편익을 제공할 수 있음을 시사한다. 특히. 한국은 2025년 65세 고령 인구 비율이 20%를 넘어서며(행정안전부 주민과, 2025), 초고령사회에 진입했기 때문에 의료접근성 중심의 주택 정책은 앞으로 더욱 중요해질 것으로 판단된다.
둘째, 의료접근성의 방향성은 의료시설의 유형에 따라 상이하게 나타났다. 머신러닝 분석 결과, 병·의원과 종합병원까지의 거리는 가까울수록 아파트 가격을 높이는 방향으로 예측한 반면, 공공의료시설과의 거리는 멀수록 가격 상승과 관련 있는 것으로 예측하였다. 이러한 결과는 의료시설이 수행하는 기능과 이용 방식의 차이에 대해 거주민이 형성하고 있는 직관적 인식이 시장에서 가격 형성 메커니즘으로 이미 작동하고 있음을 보여준다. 또한, 유형별 차이와 임계거리는 비모수 기반의 머신러닝 기법을 통해 보다 명확히 관측되었다.
셋째, 의료접근성에 대한 가치는 의료시설의 유형에 따라서 주거 가치에 반영되는 실질적인 효용의 범위가 달라질 수 있음이 확인되었다. 이와 같은 분석 결과는 의료인프라 유형에 따라 상이한 정책적 시사점을 도출할 수 있음을 보여준다. 예를 들어, 공공의료시설은 500m 내에서 생활 SOC와 연계한 복합개발을 통해 주민들의 의료접근성과 생활 편의성을 동시에 강화할 수 있다. 병·의원은 근린생활시설의 특성을 고려하여 약 100m 도보권 내에 배치함으로써 노후 주거지 정비나 도시재생 사업 시 주민들의 일상적 의료접근성과 생활 편의를 효과적으로 향상시킬 수 있다. 더불어 종합병원의 임계거리는 750m로 나타났다.
한편, 아파트의 물리적 요인은 그럼에도 가격 예측에서 중요하게 나타났다. 전용면적, 건축연한, 세대수, 난방구조 등과 같은 아파트 자체의 물리적 특성은 의료접근성보다 상대적으로 더 높은 중요도를 보이며, 주거 가치에 있어 여전히 핵심적인 요소임을 확인할 수 있었다. 이는 주거 선택에 있어 거주민이 체감하는 공간적 효율성, 구조적 안정성 등이 여전히 중요하게 고려되는 요인임을 시사한다.
마지막으로 본 연구는 몇 가지 한계점을 지닌다. 연구의 공간적 범위를 서울로 한정하였기 때문에 다른 도시에 일반화하는 데에는 제약이 있고, 2020년부터 2022년까지를 분석 대상으로 설정함에 따라, 코로나19 이전 및 이후 시기와의 비교를 포함하지 못한 한계가 있다. 따라서 향후 연구에서는 시기별 자료를 확장하여 코로나 전후의 의료접근성의 가격 효과가 정책 및 거시경제 환경 변화에 따라 어떻게 달라지는지를 비교·분석할 필요가 있다. 아울러 아파트만을 대상으로 분석을 진행하여 주거 형태의 다양성을 고려하지 못한 점도 존재한다.









