-
전국 시도별 빈집 상황 알아보자 with PythonData Analysis/Social Issues 2021. 4. 11. 18:39
이번 포스팅에서는 국가 통계 포털에서 제공해주고 있는 빈집 데이터를 분석해보록 하겠다. 부동산에 관심을 갖기로 결심해서 오늘부터 하나씩 작은 것부터 분석해 나가도록 하겠다. 빈집 수치를 시작해서 최대한 재밌고 의미 있는 데이터를 찾아보겠다.
1. 데이터 가져오기
KOSIS 국가통계포털 데이터를 사용하도록 하겠다.
코드가 문제 없이 돌아간다면 아래와 같이 행정구역, 시점별 빈집 데이터를 확인할 수 있다.
import pandas as pd df=pd.read_csv('C:/Users/banad/Downloads/빈집.csv',encoding='cp949') df.columns=['행정구역','시점','빈집비율','빈집수','전체주택수'] si_do={'강원도':'Gangwon-do','경기도':'Gyeonggi-do', '경상남도':'Gyeongsangnam-do','경상북도':'Gyeongsangbuk-do', '광주광역시':'Gwangju','대구광역시':'Daegu','대전광역시':'Daejeon','부산광역시':'Busan', '서울특별시':'Seoul','세종특별자치시':'Sejongsi','울산광역시':'Ulsan','인천광역시':'Incheon', '전라남도':'Jeollanam-do','전라북도':'Jeollabuk-do','제주특별자치도':'Jeju-do','충청남도':'Chungcheongnam-do', '충청북도':'Chungcheongbuk-do'} df['eng']=df['행정구역'].apply(lambda x:si_do[x])
2. 2019년 전국 시도별 빈집 비율
19년 기준 시도별 빈집 비율에서는 확실히 전라남도, 제주도, 강원도 등 지방 지역이 높은 점을 확인할 수 있고, 인구가 가장 밀집되어 있는 서울이 가장 낮게 나타났다.
import plotly.express as px df_19=df[df['시점']==2019] df_19=df_19.sort_values(by='빈집비율',ascending=False) fig = px.bar(df_19, x="eng", y="빈집비율", title="시도별 빈집 비율") fig.show() f2=fig.to_json() for x,y in zip(list(si_do.keys()), list(si_do.values())): f2 = f2.replace(y, x)
3. 2019년 전국 빈집 수 비중
절대적인 수 기준으로 빈집 수를 볼 경우 경기도, 경상남도, 경상북도에서 빈집이 가장 많은 점을 볼 수 있다.
total=df_19['빈집수'].sum() df_19['비중']=df_19['빈집수'].apply(lambda x:x/total) fig = px.pie(df_19, values='비중', names='eng', title='빈집 비중') fig.show() f1=fig.to_json() for x,y in zip(list(si_do.keys()), list(si_do.values())): f1 = f1.replace(y, x)
4. 2015년 ~ 2019년 빈집 비율 추세
마지막으로 연도, 행정구역 별 빈집 비율 추세를 확인해보도록 하겠다.
특이한 점은 서울을 제외하고는 전반적으로 모든 지역에서 빈집 비율이 증가하고 있다는 것이다.
import seaborn as sns import matplotlib.pyplot as plt %matplotlib inline %config InlineBackend.figure_format='retina' sns.relplot(data=df,x='시점',y='빈집비율',kind='line',col='행정구역',col_wrap=4)
'Data Analysis > Social Issues' 카테고리의 다른 글
국내 목욕탕/사우나 폐업 수 데이터 분석 & 시각화 With Python (0) 2021.08.22 코로나19 예방접종센터 현황 확인 - 지도 시각화 With Python, Pydeck (1) 2021.06.09 외국인 입국 통계 데이터 분석 With Python (1) 2021.04.14 2010~2020년 국내 시도별 예금은행 예금액 분석 with Python (0) 2021.04.13 2015년 ~ 2019년 대한민국 인구 10만명당 자살 통계 데이터 분석 With Python (0) 2021.04.02