Data Analysis
-
국내 신용카드사 이용 실적 기준 시장 점유율 분석(신한카드, 삼성카드, KB국민카드, 현대카드, 롯데카드, 우리카드)Data Analysis/Investment 2021. 6. 4. 23:36
삼성카드 주식을 보유한 주주로서 국내 신용카드 관련된 여러 연관 데이터를 계속해서 분석해보고자 한다. 첫 번째 포스팅은 카드 이용실적 기준으로 국내 신용카드 기업의 시장 점유율을 확인해보고자 한다. 데이터는 역시나 아래 공공데이터를 가지고 왔다. https://data.go.kr/tcs/dss/selectApiDataDetailView.do?publicDataPk=15061308 금융위원회_금융통계신용카드사정보 타이틀 기준년월을 조회하여 신용카드사 일반현황, 재무현황, 주요경영지표, 주요영업활동 등의 정보를 제공하는 금융위원회_금융통계신용카드사정보 data.go.kr 데이터 가져오기 위 공공데이터 API를 통해 지난 15년부터 20년까지의 신용카드별 이용 실적 데이터를 가져오도록 하겠다. 쿼리는 다음과 ..
-
지난 5년간 국내 주요 시중은행 오프라인 지점 수 현황 분석 with Python, PlotlyData Analysis/Investment 2021. 6. 2. 14:40
신한지주 주식을 보유한 주주로서 은행 관련된 데이터 분석에 굉장히 많은 편이다. 그래서 이번 포스팅을 시작으로 은행 관련 데이터를 파이썬으로 분석해보고자 한다. 최근 들어 은행 관련해서 개인적으로 궁금한 게 있었다. 금융업계의 디지털 전환이 시작되면서 이제는 핸드폰 하나로 모든 금융 업무를 할 수 있게 되었다. 많은 분들도 마찬가지로 모바일 앱으로 많은 업무를 처리하고 있을 것이다. 최근에 은행 지점을 방문한 기억이 없을 정도 모바일 앱의 편의성이 좋아졌다. 모바일 앱의 기능이 발전하면서 당연히 오프라인 지점의 필요성은 감소할 수밖에 없다고 보는데 실제로 지난 5년간 국내 주요 은행들의 지점이 감소되었는지 데이터로 확인해보도록 하겠다. 데이터 소스 금융감독원에서 제공하고 있는 금융통계정보시스템 API를 ..
-
구글트렌드 & 네이버 데이터랩으로 지난 1년간 국내 메이저 카드사 검색량 트렌드 분석Data Analysis/Investment 2021. 6. 2. 11:02
삼성카드 주식을 보유한 주주로서 삼성카드에 대해 다양한 분석을 진행해보고자 한다. 우선 시작으로 사람들이 얼마나 카드를 검색하고 있으며 경쟁 카드사 대비해서 삼성카드를 얼마나 많이 검색하는지 확인해보도록 하겠다. 검색 데이터는 국내 주요 검색 포털인 네이버와 구글에서 가져오도록 하겠다. 네이버 데이터랩 검색량 import urllib.request import json import pandas as pd import re client_id = "~~" client_secret = "~~" url = "https://openapi.naver.com/v1/datalab/search" body = '''{"startDate":"2020-06-01","endDate":"2021-05-31","timeUnit":..
-
서울 크로스핏 박스 지도 시각화 with Python, Mapbox, 카카오 APIData Analysis/LifeStyles 2021. 5. 31. 22:31
요즘 크로스핏 매력에 완전히 빠져버렸다. 하루라도 젊었을 때 크로스핏을 시작했으면 어땠을까라는 생각이 들 정도로 너무 후회스럽다. 왜 재미없는 헬스에 그 많은 시간을 쏟아부었는지... 여하튼 강철부대 영향으로 크로스핏의 인기가 날날이 높아지고 있다. 이번 포스팅에서는 그래서 서울 내에 위치한 크로스핏 박스를 지도에 시각화해보도록 하겠다. 역시나 이번에도 파이썬, Mapbox, 카카오 지도 API를 사용하도록 하겠다. 서울 크로스핏 박스 위치 데이터 가져오기 카카오 Rest API 키 값만 받으면 아래 코드를 돌려서 데이터를 확보할 수 있을 것이다. from bs4 import BeautifulSoup as bs import pandas as pd import requests url='https://www..
-
NBA Data Analysis - Top 10 포인트 가드의 어시스트/턴오버 분석Data Analysis/LifeStyles 2021. 5. 19. 21:20
이번 포스팅에서는 20-21 시즌 NBA 탑 포인트가드 선수들의 경기당 어시스트와 턴오버 데이터를 가져와서 비교해보도록 하겠다. 개인적으로 포인트가드를 평가하는 데 있어 가장 중요한 지표가 어시스트와 턴오버라고 생각하기 때문에 해당 데이터를 오늘 주제로 삼았다. 물론 릴라드나 커리와 같이 어시스트보다는 득점에 집중하는 포인트가드 선수도 있기 때문에 정확한 비교가 될 수 있을지 모르겠지만 여하튼 한번 해보도록 하겠다. 데이터는 NBA.COM에 있는 수치를 그대로 가져오는 NBA_API 라이브러리를 사용하도록 하겠다. 1. 포인트 가드 선수 ID 가져오기 NBA.COM에는 선수별 ID 값이 부여되어 있기 때문에 우선 해당 ID 값부터 가져오도록 하겠다. 이번 분석 대상 포인트 가드는 스테판 커리, 루카 돈치..
-
서울 주요 핫플레이스(홍대입구, 건대입구, 이태원, 명동) 방문객 분석 with 지하철역 하차 인원 수Data Analysis/Real Estate 2021. 5. 19. 11:50
코로나 여파로 이태원, 홍대, 명동을 비롯한 서울 핫플레이스 방문객이 감소하여 상권이 불황을 겪고 있다. 그래서 이번 포스팅에서는 서울 열린 데이터 광장에서 제공하고 있는 지하철역 하차 승객 수 데이터를 갖고 실제로 코로나 이전 대비해서 방문객이 얼마나 감소하였는지 분석해보도록 하겠다. Data Source: 오늘 분석에 활용한 데이터는 아래 링크와 같다. http://data.seoul.go.kr/dataList/OA-12914/S/1/datasetView.do 서울시 지하철호선별 역별 승하차 인원 정보 교통카드(선후불교통카드 및 1회용 교통카드)를 이용한 지하철호선별 역별(서울교통공사, 한국철도공사, 공항철도, 9호선) 승하차인원을 나타내는 정보입니다. (일단위) ※ Sheet 서비스는 마 data...
-
국내 상장 시중 은행 18년 ~ 20년 배당 내역 분석 With Python, Open Dart APIData Analysis/Investment 2021. 5. 18. 10:37
오늘 포스팅에서는 국내 시중 은행 종목들의 지난 3년 간 배당 내역을 전자공시 사이트 Dart API를 통해서 가져오고, Plotly를 활용해 시각화하도록 하겠다. 배당 데이터 추출 코드 프로세스는 다음과 같다. 1. 네이버 기준 은행 업종 종목들의 증시 코드를 가져온다 2. 해당 코드를 Dart 기준 코드로 변환한다. 3. Dart 코드를 가지고 은행별 배당 내역을 가져온다. 데이터 추출 코드 import pandas as pd import requests import datetime banks=['하나금융지주','제주은행','기업은행','KB금융','우리금융지주','JB금융지주','신한지주','BNK금융지주','DGB금융지주'] def get_code(corp_name): stock_code = pd..
-
서울시 전통시장 현황 분석 With Python, Mapbox, PydeckData Analysis/Real Estate 2021. 4. 17. 17:21
아래 서울 열린데이터 서비스에서 제공해주고 있는 전통시장 현황 데이터를 사용해서 간략한 지도 시각화를 해보도록 하겠다. 대표적인 시각화 패키지 Mapbox와 Pydeck 라이브러리를 사용하도록 하겠다. data.seoul.go.kr/dataList/OA-1176/S/1/datasetView.do 서울시 전통시장 현황 서울시 전통시장별 현황정보입니다. 자치구별 전통시장의 주소와 상인회 연락처를 알려주고, 버스노선 및 시장 인근 지하철, 주차장 유무 정보 및 아케이드 지원내용을 알려줍니다. ※openAP data.seoul.go.kr 1. 데이터 가져오기 코드가 문제 없이 돌아간다면 아래와 같이 시장 이름, 주소 그리고 위경도 데이터를 확인할 수 있다. import requests import pandas ..