-
구글트렌드 & 네이버 데이터랩으로 지난 1년간 국내 메이저 카드사 검색량 트렌드 분석Data Analysis/Investment 2021. 6. 2. 11:02
삼성카드 주식을 보유한 주주로서 삼성카드에 대해 다양한 분석을 진행해보고자 한다. 우선 시작으로 사람들이 얼마나 카드를 검색하고 있으며 경쟁 카드사 대비해서 삼성카드를 얼마나 많이 검색하는지 확인해보도록 하겠다. 검색 데이터는 국내 주요 검색 포털인 네이버와 구글에서 가져오도록 하겠다.
네이버 데이터랩 검색량
import urllib.request import json import pandas as pd import re client_id = "~~" client_secret = "~~" url = "https://openapi.naver.com/v1/datalab/search" body = '''{"startDate":"2020-06-01","endDate":"2021-05-31","timeUnit":"week", "keywordGroups":[{"groupName":"삼성카드","keywords":["삼성카드"]}, {"groupName":"신한카드","keywords":["신한카드"]}, {"groupName":"국민카드","keywords":["국민카드"]}, {"groupName":"현대카드","keywords":["현대카드"]}, {"groupName":"롯데카드","keywords":["롯데카드"]} ]}''' request = urllib.request.Request(url) request.add_header("X-Naver-Client-Id",client_id) request.add_header("X-Naver-Client-Secret",client_secret) request.add_header("Content-Type","application/json") response = urllib.request.urlopen(request, data=body.encode("utf-8")) rescode = response.getcode() if(rescode==200): response_body = response.read() query=response_body.decode('utf-8') data_query=json.loads(query) else: print("Error Code:" + rescode) from datetime import datetime as dt ss = pd.DataFrame(data_query['results'][0]['data']) ss['period']=ss['period'].apply(lambda x: dt.strptime(x,'%Y-%m-%d')) ss = ss.set_index('period') sc = pd.DataFrame(data_query['results'][1]['data']) sc['period']=sc['period'].apply(lambda x: dt.strptime(x,'%Y-%m-%d')) sc = sc.set_index('period') kc = pd.DataFrame(data_query['results'][2]['data']) kc['period']=kc['period'].apply(lambda x: dt.strptime(x,'%Y-%m-%d')) kc = kc.set_index('period') hc = pd.DataFrame(data_query['results'][3]['data']) hc['period']=hc['period'].apply(lambda x: dt.strptime(x,'%Y-%m-%d')) hc = hc.set_index('period') lc = pd.DataFrame(data_query['results'][4]['data']) lc['period']=lc['period'].apply(lambda x: dt.strptime(x,'%Y-%m-%d')) lc = lc.set_index('period') naver_df=pd.concat([ss,sc,kc,hc,lc],axis=1) naver_df.columns=["삼성카드","신한카드","국민카드","현대카드",'롯데카드'] import matplotlib.pyplot as plt %matplotlib inline plt.figure(figsize=(15,8)) plt.rcParams["font.family"] = 'Malgun Gothic' plt.plot(naver_df.index,naver_df[['삼성카드','신한카드','국민카드','현대카드','롯데카드']]) plt.legend(['삼성카드','신한카드','국민카드','현대카드','롯데카드'],loc='upper left') plt.title('국내 메이저 카드사 네이버 검색량 추이') plt.show()
위 코드가 문제 없이 돌아간다면 아래와 같은 결과를 얻을 수 있을 것이다.
국내 1위 신용카드사 신한카드가 확실히 가장 많은 검색량을 보이고 있으며, 카드 순위로는 4위지만 왕성한 프로모션 활동으로 관심을 많이 받고 있는 현대카드가 그다음을 위치하고 있는 점이 주목할 만한 포인트라고 보인다. 삼성카드는 그래 3위로 선방하고 있지만 성장을 위해서는 좀 더 많은 노력이 필요할 듯싶다.
구글 트렌드 검색량
import pandas as pd from pytrends.request import TrendReq pytrends = TrendReq(hl='en-US', tz=360) kw_list = ["삼성카드","신한카드","국민카드","현대카드",'롯데카드'] pytrends.build_payload(kw_list, cat=0, timeframe='today 12-m', geo='KR', gprop='') df=pytrends.interest_over_time() df=df[['삼성카드','신한카드','국민카드','현대카드','롯데카드']] import matplotlib.pyplot as plt %matplotlib inline plt.figure(figsize=(15,8)) plt.rcParams["font.family"] = 'Malgun Gothic' plt.plot(df.index,df[['삼성카드','신한카드','국민카드','현대카드','롯데카드']]) plt.legend(['삼성카드','신한카드','국민카드','현대카드','롯데카드'],loc='upper left') plt.title('국내 메이저 카드사 구글 검색량 추이') plt.show()
네이버 데이터랩 대비해서는 코드가 굉장히 간단하다.
국내 신용카드 시장 5위를 기록하고 있는 롯데카드를 제외하고는 삼성, 신한, 현대, KB 카드는 전반적으로 유사한 검색 추이를 보이고 있는 중이다.
이번 포스팅을 시작으로 해서 삼성카드 주주로서 카드 시장 관련된 데이터 분석을 계속해서 진행해보도록 하겠다.
'Data Analysis > Investment' 카테고리의 다른 글
국내 신용카드사 이용 실적 기준 시장 점유율 분석(신한카드, 삼성카드, KB국민카드, 현대카드, 롯데카드, 우리카드) (0) 2021.06.04 지난 5년간 국내 주요 시중은행 오프라인 지점 수 현황 분석 with Python, Plotly (0) 2021.06.02 국내 상장 시중 은행 18년 ~ 20년 배당 내역 분석 With Python, Open Dart API (0) 2021.05.18 치폴레(Chipotle/CMG) 미국 주가 분석 With FinancialModelingPrep & Python (0) 2021.04.15 MAGA(Microsoft, APPLE, GOOGLE, AMAZON) 기업 주식 비교 분석 With Python (0) 2021.04.10