부록 표 1 주요 변수의 기초통계량

No 변수명 평균 표준편차 최소값 최대값 N
1 tourism 0.182 0.387 0.000 1.000 214
2 pop_sum 64,752 27,189 674 132,786 214
3 diversity 0.068 0.124 –0.215 0.412 214
4 average_op 40.83 28.64 0.0 290.0 214
5 polycentric 0.173 0.379 0.000 1.000 214
6 gongsi 0.328 0.187 0.025 0.872 214
7 w_pop_sum 42,934 18,833 365 86,638 214
8 riding_sub 2,008,060 1,282,311 32,820 6,219,158 214
9 bus_total 109.11 45.45 5 238 214
10 center_dist 943.02 1,287.12 43.6 9,205.0 214
11 gov_total 5.43 4.32 0 20 214
12 sch_total 7.49 3.37 0 17 214
13 hos_total 15.73 27.84 0 226 214
14 sub_total 1.90 1.57 0 6 214
15 hot_total 4.98 11.91 0 90 214
16 sho_total 0.78 1.11 0 6 214
17 change_i_1 범주형 범주형 범주형 범주형 214
18 average_cl 40.15 25.33 0.0 259.0 214
19 area (m2) 72,692 93,560 133 664,463 214
20 HubDist (m) 943.02 1,287.12 43.6 9,205.0 214
21 quit_sub 2,039,327 1,381,192 25,283 7,124,121 214
22 tour_site_count 1.250.0 1.670.0 0 9.00 214
23 avg_rent 15,834 3,245 10,250 22,540 214
24 HubName 범주형 범주형 범주형 범주형 214
25 center_dist m 2,387.0 1,842.0 32.0 8,974.0 214
26 gentrification .0420 0.500 0.0 1 214
주: 타깃변수인 gentrification(젠트리피케이션 발생여부)의 평균값은 0.420으로, 전체 214개 상권 중 약 42%가 젠트리피케이션이 발생한 것으로 분류되었음.
주요 독립변수들의 분포와 범위가 명확히 제시되어 있어, 모델 해석 시 각 변수의 영향력을 이해하는 데 중요한 맥락을 제공함. 특히 tourism, polycentric 등 더미변수와 pop_sum, diversity 등 연속변수의 특성이 잘 구분되어 있음.
change_i_1 변수 분포: '가맹점'(83개, 38.8%), '경쟁'(65개, 30.4%), '일정'(35개, 16.4%), '감소추세'(31개, 14.5%).
gentrification 변수 분포: '미발생'(124개, 57.9%), '발생'(90개, 42.1%).
HubName: 부산 지하철 다양한 지하철역 이름(범주형).
tourism(관광상권 여부)과 polycentric(다핵상권 여부)는 이진형 더미변수(0=해당 없음, 1=해당됨).
모든 인구 관련 변수(pop_sum, w_pop_sum)의 단위는 '명', 거리 관련 변수(center_dist, HubDist)의 단위는 '미터(m)'임.
모든 독립변수는 2018년부터 2022년까지의 5년간 데이터를 기반으로 하며, 변화율 변수(diversity, gongsi)는 5년간 증감률을 나타냄.
상권면적(area)의 단위는 제곱미터(m2), 임대료(avg_rent)의 단위는 원/m2/월임.
표본 수(N=214)는 결측치가 제거된 최종 분석 대상 상권 수를 의미함.
이상치 처리: 극단값(평균±3σ 초과)을 갖는 관측치는 로버스트 모델링을 위해 윈저화(winsorization) 처리하였음.
변수 간 다중공선성 검증 결과, 모든 변수의 VIF(분산팽창인자) 값이 10 미만으로 심각한 다중공선성 문제는 없음.