파이썬
-
NBA Data Analysis - Top 10 포인트 가드의 어시스트/턴오버 분석Data Analysis/LifeStyles 2021. 5. 19. 21:20
이번 포스팅에서는 20-21 시즌 NBA 탑 포인트가드 선수들의 경기당 어시스트와 턴오버 데이터를 가져와서 비교해보도록 하겠다. 개인적으로 포인트가드를 평가하는 데 있어 가장 중요한 지표가 어시스트와 턴오버라고 생각하기 때문에 해당 데이터를 오늘 주제로 삼았다. 물론 릴라드나 커리와 같이 어시스트보다는 득점에 집중하는 포인트가드 선수도 있기 때문에 정확한 비교가 될 수 있을지 모르겠지만 여하튼 한번 해보도록 하겠다. 데이터는 NBA.COM에 있는 수치를 그대로 가져오는 NBA_API 라이브러리를 사용하도록 하겠다. 1. 포인트 가드 선수 ID 가져오기 NBA.COM에는 선수별 ID 값이 부여되어 있기 때문에 우선 해당 ID 값부터 가져오도록 하겠다. 이번 분석 대상 포인트 가드는 스테판 커리, 루카 돈치..
-
서울 주요 핫플레이스(홍대입구, 건대입구, 이태원, 명동) 방문객 분석 with 지하철역 하차 인원 수Data Analysis/Real Estate 2021. 5. 19. 11:50
코로나 여파로 이태원, 홍대, 명동을 비롯한 서울 핫플레이스 방문객이 감소하여 상권이 불황을 겪고 있다. 그래서 이번 포스팅에서는 서울 열린 데이터 광장에서 제공하고 있는 지하철역 하차 승객 수 데이터를 갖고 실제로 코로나 이전 대비해서 방문객이 얼마나 감소하였는지 분석해보도록 하겠다. Data Source: 오늘 분석에 활용한 데이터는 아래 링크와 같다. http://data.seoul.go.kr/dataList/OA-12914/S/1/datasetView.do 서울시 지하철호선별 역별 승하차 인원 정보 교통카드(선후불교통카드 및 1회용 교통카드)를 이용한 지하철호선별 역별(서울교통공사, 한국철도공사, 공항철도, 9호선) 승하차인원을 나타내는 정보입니다. (일단위) ※ Sheet 서비스는 마 data...
-
서울시 전통시장 현황 분석 With Python, Mapbox, PydeckData Analysis/Real Estate 2021. 4. 17. 17:21
아래 서울 열린데이터 서비스에서 제공해주고 있는 전통시장 현황 데이터를 사용해서 간략한 지도 시각화를 해보도록 하겠다. 대표적인 시각화 패키지 Mapbox와 Pydeck 라이브러리를 사용하도록 하겠다. data.seoul.go.kr/dataList/OA-1176/S/1/datasetView.do 서울시 전통시장 현황 서울시 전통시장별 현황정보입니다. 자치구별 전통시장의 주소와 상인회 연락처를 알려주고, 버스노선 및 시장 인근 지하철, 주차장 유무 정보 및 아케이드 지원내용을 알려줍니다. ※openAP data.seoul.go.kr 1. 데이터 가져오기 코드가 문제 없이 돌아간다면 아래와 같이 시장 이름, 주소 그리고 위경도 데이터를 확인할 수 있다. import requests import pandas ..
-
치폴레(Chipotle/CMG) 미국 주가 분석 With FinancialModelingPrep & PythonData Analysis/Investment 2021. 4. 15. 16:42
미국 주식 데이터 API FinancialModelingPrep를 활용해서 내가 미국 식음료 브랜드 중 가장 좋아하는 치폴레에 대해 간략히 분석해보도록 하겠다. 1. 치폴레 주가 치폴레에 본격적으로 살펴보기 전에 간략히 치폴레 주가 현황을 알아보도록 하겠다. 미국 소비 시장을 이끄는 밀레니얼 세대가 가장 좋아하는 브랜드인 만큼 치폴레 주가도 상장 이후 계속해서 증가하는 추세를 이어나가고 있다. 코로나 이슈도 치폴레 상승세를 막을 수 없었다. import FinanceDataReader as fdr cmg = fdr.DataReader('CMG', '2018-01-01', '2021-04-16').reset_index() import plotly.express as px fig = px.line(cmg, ..
-
외국인 입국 통계 데이터 분석 With PythonData Analysis/Social Issues 2021. 4. 14. 21:22
1. 데이터 가져오기 국가 통계 포털에서 2018년부터 2020년까지 월별 국적, 목적별 입구 데이터를 가져와서 분석하도록 하겠다. 코드에 문제가 없다면 아래와 같은 데이터를 확인할 수 있을 것이다. import pandas as pd df=pd.read_csv('C:/Users/banad/Downloads/입국.csv',encoding='cp949') df.columns=['Continent','Country','Purpose','Month','Visitors'] df['Year']=df['Month'].apply(lambda x:x.split('. ')[0]) df['Purpose']=df['Purpose'].str.replace('관광','Tour').replace('상용','Business').r..
-
2010~2020년 국내 시도별 예금은행 예금액 분석 with PythonData Analysis/Social Issues 2021. 4. 13. 16:15
이번 포스팅에서는 국가통계포털에서 제공하는 국내 시도별 예금은행 예금액 데이터를 갖고 분석하도록 하겠다. 역시 이번에도 파이썬을 통해서 만들도록 하겠다. 1. 2020년 시도별 1인당 예금은행 예금액(천원) 2020년 시도별 예금액을 시도별 인구수로 나눈 결과를 지도로 시각화해보았다. 역시나 서울시가 1인당 예금액이 가장 높게 나타났다. from urllib.request import urlopen import json with urlopen('https://raw.githubusercontent.com/southkorea/southkorea-maps/master/kostat/2018/json/skorea-provinces-2018-geo.json') as response: kor = json.load(..
-
전국 시도별 빈집 상황 알아보자 with PythonData Analysis/Social Issues 2021. 4. 11. 18:39
이번 포스팅에서는 국가 통계 포털에서 제공해주고 있는 빈집 데이터를 분석해보록 하겠다. 부동산에 관심을 갖기로 결심해서 오늘부터 하나씩 작은 것부터 분석해 나가도록 하겠다. 빈집 수치를 시작해서 최대한 재밌고 의미 있는 데이터를 찾아보겠다. 1. 데이터 가져오기 KOSIS 국가통계포털 데이터를 사용하도록 하겠다. 코드가 문제 없이 돌아간다면 아래와 같이 행정구역, 시점별 빈집 데이터를 확인할 수 있다. import pandas as pd df=pd.read_csv('C:/Users/banad/Downloads/빈집.csv',encoding='cp949') df.columns=['행정구역','시점','빈집비율','빈집수','전체주택수'] si_do={'강원도':'Gangwon-do','경기도':'Gyeon..
-
MAGA(Microsoft, APPLE, GOOGLE, AMAZON) 기업 주식 비교 분석 With PythonData Analysis/Investment 2021. 4. 10. 20:53
미국 증시는 MAGA 천하라고 해도 무방할 정도 MAGA 4개 기업이 주식 시장에서 차지하는 위엄은 엄청나다. 그래서 오늘 포스팅에서는 금융 데이터 API FinancialModelingPrep을 통해서 위 4개 종목 주식 정보를 비교해보도록 하겠다. 1. MAGA 시가총액 비교 시가총액에서는 애플이 무려 2조 2천억 달러로 MAGA에서도 1위를 달리고 있다. 예상보다 마이크로소프트가 시가총액이 1조 9천억 달러로 그다음을 기록했다. import pandas as pd import requests api='~' url=f'https://financialmodelingprep.com/api/v3/quote/MSFT,AAPL,GOOGL,AMZN?apikey={api}' res=requests.get(url)..