2020/03
-
Riot API를 활용한 리그오브레전드(lol) 데이터 셋 구축(kaggle dataset) - User League/ item / champion / Ranked Games(랭겜)ML, DL & Python/Riot API를 활용환 데이터 분석 2020. 3. 28. 16:41
안녕하세요. 요즘 푹 빠져서 하고 있는 내용이 있는데요. 바로 Riot api를 활용한 리그오브레전드 데이터 셋 구축입니다. API의 비용문제가 있어서(2분에 최대 100requests) 수집하는데 마냥 자유롭지가 않아 꾸준히 수집하고 있습니다. 현재 1. 리그오브레전드 item, champion 정보 2. 리그오브레전드 챌린저, 그랜드마스터, 마스터 티어의 전체 유저 정보 이렇게 두가지를 kaggle에 업로드한 상태이구요 데이터에 관심이 있으시거나 필요한 데이터가 있으신 분들은 다운로드 해주시면 될 것 같습니다. 1. League of Legends(lol) item, champion information League of Legends(LOL) CHAMPION and ITEM - 2020 riot g..
-
리그오브레전드 데이터 분석 - Match Data Analytics(3)ML, DL & Python/Riot API를 활용환 데이터 분석 2020. 3. 15. 17:20
이번 포스팅은 리그오브레전드의 경기기록(오브젝트 위주)이 승패에 얼만큼 영향을 미치는지 확인해보겠습니다. 저번 분석에서는 상관도를 파악하고, 승리와 패배에 따른 오브젝트 변수의 비율 차이를 EDA를 통해서 알아보았는데요. 실제로 우리가 게임을 하면서 말하는 얘기들에 일맥상통하는 인사이트들이 비교적 많이 도출되었습니다. 이처럼 게임 승패에 상관성이 있는 변수들은 "과연 승패에 얼만큼 영향을 미칠까?" 라는 고민까지 이어졌습니다. 따라서 이번에는 Logistic Regression 을 활용하여 오브젝트 변수들이 승패에 미치는 영향을 분석해보려고 합니다. 1. Logistic Regression 분석에 앞서 Logistic Regression에 대해서 간략하게 설명하고 넘어가도록 하겠습니다. 위의 그림은 Si..
-
리그오브레전드 데이터 분석 - match data EDA(2)ML, DL & Python/Riot API를 활용환 데이터 분석 2020. 3. 15. 17:13
안녕하세요. 이번 포스팅은 저번에 이어서 연속형 데이터에 관한 분석을 진행해보도록 하겠습니다. 저번 포스팅을 간략하게 요약하자면 범주형 변수(1/0)에 대한 시각화를 진행했엇는데요. 결과적으로 우리가 알고 있던 자명한 사실들을 데이터적으로 확인할 수 있엇습니다. 본격적으로 연속형 데이터 분석을 진행하도록 하겠습니다. 아 그리고 해당 포스팅을 읽기전에 처음 읽으시는 분들은 1번째 포스팅을 먼저 읽어주시면 감사하겠습니다.(데이터를 받으실 수 있거든요 ㅎㅎ) 1. 데이터 불러오고 처리하기 이 부분은 이전 포스팅에서 자세히 다루고 있으므로 코드 한개에 담겠습니다. import pandas as pd import pickle import matplotlib.pyplot as plt import numpy as n..
-
리그오브레전드 데이터 분석 - match data EDA(1)ML, DL & Python/Riot API를 활용환 데이터 분석 2020. 3. 8. 18:47
안녕하세요 포스팅이 너무 늦은 것 같습니다 ㅠㅠ 취준에다가 회사일에다가... 이것저것 핑계를 일삼아 블로그 포스팅에 굉장히 소홀했던 것 같습니다... 그래서! 저도 이전에 했던 분석 히스토리가 가물가물한데 여러분들은 더 가물가물하겠죠? 죄송한 의미로 메일을 남겨주시면 분석한 경기데이터를 보내드리도록 하겠습니다. (그랜드마스터의 경기 17500건의 데이터입니다. 데이터 변수에 대한 설명은 아래의 링크를 참고해주세요) 리그오브레전드 데이터를 활용한 승/패 예측 이전 포스팅에서 수집한 매치데이터를 이용하여 팀의 승/패를 예측해보겠습니다. 다들 teams 변수를 이용하여 데이터프레임화를 했던 것을 기억하시나요. teams데이터는 리스트안에 딕셔너리가 있는 구조로써 dict.. shinminyong.tistory..
-
MYSQL설치 및 DB생성부터 python과 연동까지SQL/MYSQL 2020. 3. 6. 00:24
1. DataBase의 중요성 이번 포스팅은 "나만의 DB"를 생성해서 불필요하게 로컬에 파일 형태로 데이터를 저장하는 것이 아닌, Database에 스키마를 정의하고 테이블로 구조화하여 데이터를 저장해서 데이터를 관리하고자 합니다. 아마 많은 분들은 "파일형태로 저장하여 쉽게 데이터를 관리하면 되지 굳이 복잡스럽게 DB를 연동하고 데이터를 추출했다가 저장하는 과정을 반복하느냐?" 라고 생각하시는 분들도 많으실겁니다. 저 역시 이에 많은 동의를 하고 이전에는 이런 생각을 많이 했던 것 같습니다. 하지만 로컬 저장소에 파일 형태로 데이터를 관리하게 되면 파일명도 "_ver1", "_ver2"....등의 최신 데이터를 저장하면서 간혹 기존의 데이터를 덮어 씌우게 되는 결과를 초래할수도 있을 것입니다. 그렇기..