부록 표 1 주요 변수의 기초통계량
No | 변수명 | 평균 | 표준편차 | 최소값 | 최대값 | N |
1 | tourism | 0.182 | 0.387 | 0.000 | 1.000 | 214 |
2 | pop_sum | 64,752 | 27,189 | 674 | 132,786 | 214 |
3 | diversity | 0.068 | 0.124 | –0.215 | 0.412 | 214 |
4 | average_op | 40.83 | 28.64 | 0.0 | 290.0 | 214 |
5 | polycentric | 0.173 | 0.379 | 0.000 | 1.000 | 214 |
6 | gongsi | 0.328 | 0.187 | 0.025 | 0.872 | 214 |
7 | w_pop_sum | 42,934 | 18,833 | 365 | 86,638 | 214 |
8 | riding_sub | 2,008,060 | 1,282,311 | 32,820 | 6,219,158 | 214 |
9 | bus_total | 109.11 | 45.45 | 5 | 238 | 214 |
10 | center_dist | 943.02 | 1,287.12 | 43.6 | 9,205.0 | 214 |
11 | gov_total | 5.43 | 4.32 | 0 | 20 | 214 |
12 | sch_total | 7.49 | 3.37 | 0 | 17 | 214 |
13 | hos_total | 15.73 | 27.84 | 0 | 226 | 214 |
14 | sub_total | 1.90 | 1.57 | 0 | 6 | 214 |
15 | hot_total | 4.98 | 11.91 | 0 | 90 | 214 |
16 | sho_total | 0.78 | 1.11 | 0 | 6 | 214 |
17 | change_i_1 | 범주형 | 범주형 | 범주형 | 범주형 | 214 |
18 | average_cl | 40.15 | 25.33 | 0.0 | 259.0 | 214 |
19 | area (m2) | 72,692 | 93,560 | 133 | 664,463 | 214 |
20 | HubDist (m) | 943.02 | 1,287.12 | 43.6 | 9,205.0 | 214 |
21 | quit_sub | 2,039,327 | 1,381,192 | 25,283 | 7,124,121 | 214 |
22 | tour_site_count | 1.250.0 | 1.670.0 | 0 | 9.00 | 214 |
23 | avg_rent | 15,834 | 3,245 | 10,250 | 22,540 | 214 |
24 | HubName | 범주형 | 범주형 | 범주형 | 범주형 | 214 |
25 | center_dist m | 2,387.0 | 1,842.0 | 32.0 | 8,974.0 | 214 |
26 | gentrification | .0420 | 0.500 | 0.0 | 1 | 214 |
주: 타깃변수인 gentrification(젠트리피케이션 발생여부)의 평균값은 0.420으로, 전체 214개 상권 중 약 42%가 젠트리피케이션이 발생한 것으로 분류되었음.
주요 독립변수들의 분포와 범위가 명확히 제시되어 있어, 모델 해석 시 각 변수의 영향력을 이해하는 데 중요한 맥락을 제공함. 특히 tourism, polycentric 등 더미변수와 pop_sum, diversity 등 연속변수의 특성이 잘 구분되어 있음.
change_i_1 변수 분포: '가맹점'(83개, 38.8%), '경쟁'(65개, 30.4%), '일정'(35개, 16.4%), '감소추세'(31개, 14.5%).
gentrification 변수 분포: '미발생'(124개, 57.9%), '발생'(90개, 42.1%).
HubName: 부산 지하철 다양한 지하철역 이름(범주형).
tourism(관광상권 여부)과 polycentric(다핵상권 여부)는 이진형 더미변수(0=해당 없음, 1=해당됨).
모든 인구 관련 변수(pop_sum, w_pop_sum)의 단위는 '명', 거리 관련 변수(center_dist, HubDist)의 단위는 '미터(m)'임.
모든 독립변수는 2018년부터 2022년까지의 5년간 데이터를 기반으로 하며, 변화율 변수(diversity, gongsi)는 5년간 증감률을 나타냄.
상권면적(area)의 단위는 제곱미터(m2), 임대료(avg_rent)의 단위는 원/m2/월임.
표본 수(N=214)는 결측치가 제거된 최종 분석 대상 상권 수를 의미함.
이상치 처리: 극단값(평균±3σ 초과)을 갖는 관측치는 로버스트 모델링을 위해 윈저화(winsorization) 처리하였음.
변수 간 다중공선성 검증 결과, 모든 변수의 VIF(분산팽창인자) 값이 10 미만으로 심각한 다중공선성 문제는 없음.