네이버 특정 블로그에서 가장 많이 사용한 단어 알아보기!
·
활동/개인 프로젝트
이 프로젝트를 시작하게 된 이유는.. 현재 근로를 하고 있는 곳에서 블로그를 운영 중인데, 이 블로그가 좀 어마무시하게 글을 생산한다. 그래서 근로하는 곳의 선생님이 우리 블로그에 가장 많이 쓴 단어가 뭘까? 라고 하시면서, 이런 거 만들 수 있냐? 라고 하셔서 시작되었다. 나는 개발자라면 내가 생각하는 것을 스스로 만들 줄 알아야 한다고 생각한다. 또 나는 그런 사람이 되고 싶어서 한 번 도전해 보게 되었다. 제작기 🔥 우선 처음에 요구사항을 들었을 때는 Python 사용해서 네이버 API 가져다 크롤링해서 데이터 구하면 되겠다라고 생각했다. 하지만 네이버 Developer의 API나 네이버 광고의 API들 중 특정 블로그의 데이터를 조작할 수 있는 API는 없는 것 같아 Github를 둘러보았고 이미..
[Python] 크롤링 프로그램 및 API 관련 개념 정리
·
활동/멋쟁이 사자처럼
우선 크롤링에 대해서 알아보자. (아니 파싱은 뭐고 크롤링은 뭐고 스크랩핑은 뭐고..... 할 때마다 헷갈리는 개념들이 참..) 크롤링(Crawling)이란? [ 크롤러 / Crawler ] 영어 사전 정의로써는 1. 기는 것 / 2. 파충류 / 와 같은 의미를 지닌다. 이는 우리가 웹 사이트를 열심히 돌아다니면서 데이터를 모을 것이다..! 라는 의미로 해석하면 될 것 같다. 즉, Web Crawler는 웹 페이지의 데이터를 모아주는 소프트웨어 라고 정의된다. [ 크롤링 / Crawling ] 크롤러를 사용해 데이터를 추출해내는 행위 그 자체를 크롤링 이라 한다. 모듈(Module) 이란? [ 모듈 / Moduel ] 사전적 정의로는 모듈이란 함수나 변수 클래스를 모아 놓은 파일이라고 할 수 있다. 쉽게..