준비하기
에리카 캠퍼스에는 홈페이지에서 제공하고 있는 식당이 총 5곳입니다.
- 교직원식당
- 학생식당
- 창의인재원식당
- 푸드코트
- 창업보육센터
크롤링이라는 작업을 많이 해보신 분이라면 알겠지만, 같은 학교라도 구조가 다르게 만들어 놓은 곳이 많습니다. 그래서 결국은 공통적으로 적용해서 깔금하게 코드가 안나오는 경우가 있죠. 개발자를 탓해야할지... 식당 운영자를 탓해야할지... 하하하...
다음과 같은 구조로 설계하려고 합니다. 예를 들면, 값 하나가 다음과 같이 나옵니다.
[데이터베이스 스키마]
- 대학 코드 : Integer
- 식당 이름 : String
- 식당 위치 : String
- 날짜 : Date
- 조식/중식/석식 : String
- 식단내용 : Text(JSON)
- 그 이외 내용 : Text
[예상 개별 튜플 결과값]
- 대학 코드 : 01
- 식당 이름 : "학생식당"
- 식당 위치 : "복지관 2층"
- 날짜 : "2016-06-06"
- 조식/중식/석식 : "lunch"
- 식단내용 : "순대감자탕, 숙주맛살볶음, 연두부&오리엔탈드레싱, 배추김치", "3,000"
- 그 이외의 내용 : ""
위 내용을 모두 홈페이지에서 제공해줄까요? 그렇다면, 정말 좋겠죠. 하지만 원하는 내용을 전부 제공하지 않을 경우가 있습니다. 그럴 때는 뭐... 어쩔 수 없이 수기로 작성해야죠.
그럼 시작해볼까요?