파이썬 분석
-
2012년 ~ 2019년 성별, 연령별 국내 주택 소유자 수 트렌드 분석 with PythonData Analysis/Real Estate 2021. 8. 17. 14:14
이번 포스팅에서는 2012년부터 2019년까지 국내 주택 보유자 수 데이터를 분석해보고자 한다. 데이터는 국가 통계청에서 가져왔고, 분석 및 시각화는 파이썬으로 하도록 하겠다. 시각화는 파이썬 기초 중에 기초라고 볼 수 있는 Matplotlib 패키지를 활용하도록 하겠다. 1. 2012년 ~ 2019년 국내 주택 보유자 수 트렌드 import pandas as pd import seaborn as sns import matplotlib.pyplot as plt import numpy as np %matplotlib inline %config InlineBackend.figure_format='retina' df=pd.read_csv('C:/Users/banad/Downloads/주택소유자수.csv',en..
-
서울 열린데이터광장을 통해 버스 정류장 합정역의 승하차 승객 수를 분석해보자~Data Analysis/LifeStyles 2021. 8. 8. 16:02
합정은 내가 지난 2년 간 매일 갔었던 내 출근지다. 합정은 강남, 영의도, 판교처럼 오피스 밀집 지역이 아니기 때문에 엄청나게 많은 사람이 출근하는 곳은 아니지만 그래도 항상 사람이 많다고 느껴져서 이번 분석을 진행하기로 결심했다. 지난 7월 한 달간 도대체 얼마나 많은 사람들이 합정역 정류장에서 버스를 승차했고, 하차했는지 데이터를 통해 알아보도록 하겠다. 데이터는 아래 링크와 같이 서울 열린데이터광장 사이트에서 가져왔다. http://data.seoul.go.kr/dataList/OA-12912/S/1/datasetView.do 서울시 버스노선별 정류장별 승하차 인원 정보 교통카드(선후불교통카드)를 이용한 서울버스 노선별/정류장별 승하차인원을 나타내는 정보입니다. 일별 버스노선마다 각 정류장에 승/..
-
2020년 ~ 2021년 시즌 NBA 선수 분석 with Python & Basketball Reference.comData Analysis/NBA 2021. 6. 15. 22:34
이번 포스팅에서는 2020년 ~ 2021년 NBA에서 뛴 선수들에 대해 간략히 파이썬으로 분석하고자 한다. NBA.com에서 데이터를 가져올 수는 있겠지만 해당 사이트에서는 크롤링을 차단하고 있어서 NBA 통계 정보를 제공하고 있는 Basketball Reference 내에 있는 데이터를 사용하도록 하겠다. pip install basketball_reference_web_scraper를 하면 Basketball Reference 사이트에서 NBA 선수들 관련된 데이터를 가져올 수 있다. 1. 20/21 NBA 시즌 선수 리스트 가져오기 20/21 NBA 시즌 총 540명의 NBA 선수가 코트를 밟았다. 아래 테이블과 같이 선수 이름뿐만 아니라 소속 팀, 포지션, 나이 그리고 이번 시즌 스텟까지 확인할 ..
-
2015년 ~ 2020년 국내 태양광 에너지 생산량 분석 With 파이썬Data Analysis/Environment 2021. 6. 6. 17:45
전 세계적으로 신재생 에너지가 열풍이다. 태양광, 풍력, 바이오, 지열, 수력 등 여러 신재생 에너지 연구와 생산이 일어나고 있는데 오늘 포스팅에서는 그중 가장 실생활에서도 가장 많이 사용되고 있고 이번 정부 들어서 가장 투자가 활발히 일어지고 있는 태양광 에너지 생산량을 한번 분석해보고자 한다. 데이터는 국가통계포털에서 가져왔다. 2015 ~ 2019년 태양광 에너지 생산량 추이 첫번째로 국내 태양광 에너지 생산량 추이를 확인해보도록 하겠다. import pandas as pd df=pd.read_csv('C:/Users/banad/Downloads/신재생에너지.csv',encoding='euc-kr') df_all=df[(df['에너지원별(2)']=='태양광') & (df['행정구역별(1)']=='전..
-
국내 상장 시중 은행 18년 ~ 20년 배당 내역 분석 With Python, Open Dart APIData Analysis/Investment 2021. 5. 18. 10:37
오늘 포스팅에서는 국내 시중 은행 종목들의 지난 3년 간 배당 내역을 전자공시 사이트 Dart API를 통해서 가져오고, Plotly를 활용해 시각화하도록 하겠다. 배당 데이터 추출 코드 프로세스는 다음과 같다. 1. 네이버 기준 은행 업종 종목들의 증시 코드를 가져온다 2. 해당 코드를 Dart 기준 코드로 변환한다. 3. Dart 코드를 가지고 은행별 배당 내역을 가져온다. 데이터 추출 코드 import pandas as pd import requests import datetime banks=['하나금융지주','제주은행','기업은행','KB금융','우리금융지주','JB금융지주','신한지주','BNK금융지주','DGB금융지주'] def get_code(corp_name): stock_code = pd..
-
국내 시중 은행 통계 데이터 분석 #1-1 - 인터넷 전문은행 카카오뱅크 임직원 수 현황Data Analysis/Investment 2021. 4. 4. 14:47
2021.04.03 - [Data Analysis/Investment] - 국내 시중 은행(신한은행, 국민은행, etc) 통계 분석 #1 - 은행 종사 임직원 수 국내 시중 은행(신한은행, 국민은행, etc) 통계 분석 #1 - 은행 종사 임직원 수 공공데이터에서 제공하고 있는 국내 시중 은행 통계 데이터를 활용해서 분석 시리즈를 가져보도록 하겠다. 첫 번째로는 간단하게 국내 시중 은행에 종사하고 있는 임직원 데이터를 분석하겠다. landshire.tistory.com 지난 포스팅에서 특이한 점을 꼽자면 바로 카카오뱅크 비정규직 비중이다. 우리가 생각했을 때 카카오뱅크는 굉장히 복지나 처우가 모두 기존 기업 대비 좋다고 봤는데 지난 분석에 따르면 생각보다 카카오뱅크 비정규직 비중이 높았다. 그래서 이번 ..
-
2015년 ~ 2019년 대한민국 인구 10만명당 자살 통계 데이터 분석 With PythonData Analysis/Social Issues 2021. 4. 2. 17:39
이번 포스팅에서는 통계청에서 대한민국 자살률 통계 데이터를 가져와 시각화를 해보도록 하겠다. 당연히 이번에도 파이썬을 활용하도록 하겠다. Data Source: 2019년 시도별 인구 10만명당 자살 수 지도로 시각화해보면 충청남도, 강원도 지방 지역에서 수도권이나 광역시 대비 자살률이 높은 점을 확인할 수 있다. import pandas as pd df=pd.read_csv('C:/Users/banad/Downloads/자살.csv',encoding='cp949') from urllib.request import urlopen import json with urlopen('https://raw.githubusercontent.com/southkorea/southkorea-maps/master/kosta..