관련 자료모음


본격적으로 튜토리얼을 시작하기 전에 아래 자료들을 한 번 공부해보길 추천합니다. 대부분 영어로된 사이트들이지만, 영어가 더 좋은(?) 사람들에게는 이게 익숙할 수도 있으니까 말입니다. Nokogiri로 Web Scraping하는 방법을 공부할 때 참고했던 사이트 목록입니다. 저는 반 강제적으로 한국 블로그 포스팅이 도움이 안되서 외국 자료를 볼 수 밖에 없었습니다.

1. Data Scraping and More with Ruby Nokogiri Sinatra and ...

Nokogiri gem을 이용해서 콘서트 티켓 예매 사이트를 크롤링하는 예제이며, Sinatra로 간단히 서버를 띄우고 자료를 확인하는 것 까지 자세히 나와있습니다. 저도 따라해 봤는데 예시로 사용하고 있는 사이트 구조가 조금 변해서 현재 상황에 맞게 대처하면서 활용했습니다.

(https://www.youtube.com/watch?v=PWI1PIvy4A8&list=PLnr-v0JC93835JNvgY6o-aXWNjEGpDqQo)

2. Parsing HTML with Nokogiri | The Bastard Book of Ruby

Nokogiri로 HTML 태그들을 분석하고 파싱하는 방법에 대해서 간략히 기술해 놓은 자료입니다.

(http://ruby.bastardsbook.com/chapters/html-parsing/)

3. Nokogiri Tutorial

노코기리 잼을 만든 팀이 직접 기술한 튜토리얼 자료입니다. 물론 모든 문법에 대해서 다루고 있지는 않습니다. 하지만 차근차근 따라가보면 XML, HTML을 파싱하는 방법과 .css/.xpath 메소드를 어떻게 사용하는지에 대해서 개념을 익힐 수 있을 겁니다. 이런 작업이 익숙한 분들은 이 사이트만 참고해도 노코기리를 잘 사용할 수 있을 겁니다. 원래는 노코기리가 지금 우리가 하려는 작업같은 곳에 사용하려고 만든 건 아닙니다. 여러 잼들과 레일즈 자체에서도 기본으로 취급하고 있는 라이브러리로 광범위하게 사용되고 있다는 점도 알아두시면 좋습니다.

(http://www.nokogiri.org)

4. Nokogiri를 이용한 게시판 파싱하기(쎄미의 티스토리 블로그)

이 블로그는 한국어로 된 블로그 포스팅인데, JSon 형태로 뽑는 것 까지 설명을 하고 있습니다. 글을 자세히 읽어야하지만 꽤나 도움이 됬던 포스팅입니다. 설치나 환경 설정을 마스터한 사람이라면 이 블로그를 참고하셔도 좋습니다.

(http://susemi99.tistory.com/1482)

그 이외의 사이트 목록

(http://www.58bits.com/blog/2012/06/13/getting-started-nokogiri-xml-ruby)
(https://www.distilled.net/resources/web-scraping-with-ruby-and-nokogiri-for-beginners/)

results matching ""

    No results matching ""