R
-
유튜버 분석ML, DL & Python/Youtube 크롤링 & 분석 2019. 5. 25. 17:10
이번 포스팅은 문득 생각난 의문에서부터 시작한 분석입니다. "유튜버들은 왜 자극적인 제목으로만 사람들의 관심을 끄는 것인가?" 그래서 유튜버들에게 맞춤 키워드를 추천해줄 수 있으면 어떨까 라는 생각을 하게 되었습니다. 따라서 본 포스팅에서는 한 유튜버 "테스터 훈"을 선택해 영상정보들을 수집하여 분석을 시작해보도록 하겠습니다. 1. 테스터훈 영상정보를 수집하겠습니다. 제가 필요한 정보는 영상에 직접 들어가서 수집해야하는 데이터이기 때문에 먼저 각 영상별 url을 수집하도록 하겠습니다. html0 = browser.page_source html = BeautifulSoup(html0,'html.parser') video_ls=html.find_all('ytd-grid-video-renderer',{'cla..
-
R을 활용한 시각화 (ggplot)R/시각화 - ggplot 2019. 5. 14. 17:53
매번 시각화를 하며 시각화를 즐겨하지만 기억나지 않는 기능들이 있기 마련입니다. 이번 포스팅은 그런 저를 위한 포스팅이기도 하며 누구든지 이 내용을 보면 R로 시각화를 하는데 두려움이 없도록 하는 목적도 있습니다. 먼저 R Studio에서 모든 시각화를 할 수 있습니다. plot(), boxplot(), barplot(), histogram() 등 다양한 시각화 기능들이 있습니다. 하지만 데이터를 이용하여 그래프를 그리는데 있어서 ggplot만큼 세세한 부분까지 고려하는 기능을 가지고 있지 않습니다. 따라서 ggplot으로 하는 시각화, 그리고 ggplot내의 기능 중심으로 글을 써내려가겠습니다. 1. Scatter plot 보통 산점도라고 하는 그래프를 그려보겠습니다. scale_x_continous(..