반응형

 

최근에 파이썬에 대한 관심이 증가 하면서 여러 분야에서 사용이 되고 있다.

다양한 분야중에 웹 크롤러도 주목을 받고 있다.

나도 관심을 갖고는 있었지만 그저 막연하게만 생각하고 있었다. 어떤 방법들이 있는지, 무엇을 먼저 해야 하는지 모르고 있었다.

그런 의미에서 이 책은 웹 크롤러에 대해서 기초부터 고급까지 차근차근 알아 볼수 있는 책이다.

 

읽으면서 몇가지 필요한 것들에 대해서 생각해 보았다.

 

1. 파이썬에 대한 기초적인 문법들은 알고 있어야 코드를 이해할 수 있다.

2. 웹 에 대해서도 기초적인 코드는 알고 있어야 한다. (html, javascript등)

3. 정규 표현식도 알고 있으면 도움이 된다.

4. 크롤러 라는건 생각보다 간단하지 않다. 인내력이 필요하다. 데이터 분석과 거의 동일한 작업이라는 생각이 든다.

 

그리고 책 마지막 부분에 있듯이 크롤러라는 것이 다른 웹 페이지에 있는 내용들을 수집하는 기술 이기 때문에 저작권 문제가 생길 수 있다. 정기적으로 크롤링 하는 것에 대해서는 반드시 원작자에 허락을 받아야 한다.

 

파이썬으로 웹 크롤러를 만들어 보려고 하는 분들이 많을 거라 생각이 든다. 이책은 그 분들에게 많은 도움이 될것이다.

 "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

728x90
반응형

+ Recent posts