데이터 분석
-
국내 시중 은행(신한은행, 국민은행, etc) 통계 분석 #1 - 은행 종사 임직원 수Data Analysis/Investment 2021. 4. 3. 21:13
공공데이터에서 제공하고 있는 국내 시중 은행 통계 데이터를 활용해서 분석 시리즈를 가져보도록 하겠다. 첫 번째로는 간단하게 국내 시중 은행에 종사하고 있는 임직원 데이터를 분석하겠다. 신한지주 주식을 보유한 주주로서 이처럼 시중 은행별로 분석해보는 것도 의미 있을 것 같다. data.go.kr/iim/api/selectAPIAcountView.do 공공데이터 포털 국가에서 보유하고 있는 다양한 데이터를『공공데이터의 제공 및 이용 활성화에 관한 법률(제11956호)』에 따라 개방하여 국민들이 보다 쉽고 용이하게 공유•활용할 수 있도록 공공데이터(Datase www.data.go.kr 0. 데이터 가져오기 2020년 12월 기준으로 국내 시중 은행들의 직원별 수를 가져와봤다. 해당 API에서는 총 임직원 수..
-
2015년 ~ 2019년 대한민국 인구 10만명당 자살 통계 데이터 분석 With PythonData Analysis/Social Issues 2021. 4. 2. 17:39
이번 포스팅에서는 통계청에서 대한민국 자살률 통계 데이터를 가져와 시각화를 해보도록 하겠다. 당연히 이번에도 파이썬을 활용하도록 하겠다. Data Source: 2019년 시도별 인구 10만명당 자살 수 지도로 시각화해보면 충청남도, 강원도 지방 지역에서 수도권이나 광역시 대비 자살률이 높은 점을 확인할 수 있다. import pandas as pd df=pd.read_csv('C:/Users/banad/Downloads/자살.csv',encoding='cp949') from urllib.request import urlopen import json with urlopen('https://raw.githubusercontent.com/southkorea/southkorea-maps/master/kosta..
-
국내 신용카드사(신한카드, 삼성카드, 현대카드 etc) 데이터 분석 With Python #2 - 카드사별 검색량 & 주가Data Analysis/Investment 2021. 3. 31. 23:52
지난 포스팅에 이어서 국내 신용카드사 브랜드의 데이터를 분석하도록 하겠다. 신용카드 금융 기업이기는 하지만 어쨌든 소비자로부터 선택을 받아야 하는 B2C 기업이기 때문에 무엇보다 소비자의 관심을 이끌어 내는 것이 중요하다. 그래서 이번 포스팅에서는 국내 메이저 신용카드 기업 5개(국민, 신한, 삼성, 현대, 롯데)를 사람들이 주요 검색 사이트 구글이나 네이버에서 얼마나 검색하고 있는지 Google Trend와 네이버 데이터랩을 통해서 알아보도록 하겠다. 1. Google Trends로 신용카드사 검색량 확인하기 뚜렷하게 최하위를 기록하고 있는 롯데카드를 제외하고는 나머지 4개사 검색량은 전반적으로 유사한 점을 확인할 수 있다. 그나마 신한카드가 그래도 구글에서는 소비자들이 가장 많이 검색하는 신용카드인 ..
-
국내 대형마트(홈플러스, 이마트, 롯데마트) 위치 데이터 분석 & 시각화 With Python/MapboxData Analysis/Real Estate 2021. 3. 30. 18:47
카카오 지도 검색 API를 활용해서 국내 위치한 대형마트(홈플러스, 이마트, 롯데마트) 위치 데이터를 가져와서 파이썬으로 다루어보도록 하겠다. 1. Data Source 여기서 활용할 대형마트 위치 데이터는 카카오 API를 통해서 가져오도록 하겠다. 홈플러스, 이마트, 롯데마트 별로 전국에 위치한 위치 정보를 긁어오겠다. from bs4 import BeautifulSoup as bs import pandas as pd import requests link='https://inasie.github.io/%ED%94%84%EB%A1%9C%EA%B7%B8%EB%9E%98%EB%B0%8D/5/' gu=pd.read_html(link,encoding='utf-8')[0] gu['법정동코드']=gu['법정동코드'..
-
전국 도시 공원 데이터 지도로 시각화 With Python, MapboxData Analysis/Environment 2021. 3. 13. 21:51
오늘 포스팅에서는 공공데이터터에서 정국 도시 공원 위치 데이터를 가져와서 Mapbox를 이용해 지도에 시각화해보도록 하겠다. 여기서 사용되는 데이터는 다음 링크에서 가져올 수 있다. www.data.go.kr/data/15012890/standard.do 공공데이터 포털 국가에서 보유하고 있는 다양한 데이터를『공공데이터의 제공 및 이용 활성화에 관한 법률(제11956호)』에 따라 개방하여 국민들이 보다 쉽고 용이하게 공유•활용할 수 있도록 공공데이터(Datase www.data.go.kr 전국 공원 지도 시각화 아래 지도에서 마우스로 호버링하면 전국 공원별 위경도, 주소, 공원명, 공원 면적 데이터를 확인할 수 있다. 확실히 인구가 많은 수도권에 공원 수가 밀집되어 있는 점을 확인할 수 있다. 전국 공원..
-
지난 10년간 대한민국 시도별 온도/강수량 데이터 분석 & 시각화 With PythonData Analysis/Environment 2021. 3. 9. 23:10
0. Data Source KOSIS국가데이터통계포털에서 지난 10년간 시도별 온도 및 강수량 데이터를 가져와서 분석과 시각화를 시도해보도록 하겠다. (세종시는 20년 데이터만 존재하므로 이번 분서에서는 제외하도록 하겠다.) import pandas as pd a=pd.read_csv('C:/Users/banad/Downloads/기온.csv',encoding='cp949') b=pd.read_csv('C:/Users/banad/Downloads/강수량.csv',encoding='cp949') df=pd.merge(left=a,right=b,how='inner',left_on=['행정구역별(1)','시점'],right_on=['행정구역별','시점']) df=df.drop(['행정구역별(1)'],axis=..
-
20년 서울시 행정구역별 전세 값 데이터 분석 & 시각화 with Python/MapboxData Analysis/Real Estate 2021. 3. 4. 19:30
Data Source 공공데이터 국토교통부_아파트 전월세 자료 data.go.kr/tcs/dss/selectApiDataDetailView.do?publicDataPk=15058017 공공데이터 포털 국가에서 보유하고 있는 다양한 데이터를『공공데이터의 제공 및 이용 활성화에 관한 법률(제11956호)』에 따라 개방하여 국민들이 보다 쉽고 용이하게 공유•활용할 수 있도록 공공데이터(Datase www.data.go.kr 20년 서울시 행정구역별 평균 전세값 시각화 With Mapbox 20년 서울시 행정구역별 총 거래금액 Tree map 시각화 With Python 20년 총 거래금액(전세)을 기준으로 보았을때 확실히 강남 3구 전세 금액이 가장 큰 점을 확인 가능함 20년 서울시 행정구역별 평균 전세 금..
-
전국 시도별 총 가정생활 폐기물 데이터 분석 & 시각화 with Python, Mapbox, PlotlyData Analysis/Environment 2021. 3. 2. 18:39
Data Source 시도별 가정 생활 폐기물 지도 시각화 with Mapbox 가정 생활 폐기물 데이터 분석 with Plotly(인터렉티브 그래프) Python Code import pandas as pd # 1인당 가정생활폐기물(연간) 발생 현황 df=pd.read_csv('/18년 가정생활폐기물 데이터.csv',encoding='cp949',) df.rename(columns={'T10 주민1인당 생활폐기물배출량 (A÷B) (14STD02441 kg/일)':'Household Waste per person(kg/day)', 'T001 생활폐기물발생량 (A) (14STD06543 톤/일)':'Household Waste(ton/day)', 'T002 주민등록인구 (B) (14STD04547 명)':..