웹사이트를 미러링하기 위한 가장 기본적인 툴은 wget 입니다.
그런데 naver, gmarket, 11st 등의 웹사이트를 로컬에 저장할 목적으로 wget을 이용시 잘 안되더라구요. 이건 매뉴얼을 잘 안보는 본인의 탓일 수도 있지만 보통 추천하는 다음의 명령어도 제대로 수행되지 않았지요.
'wget' is a basic tool to mirror a web site and I usually have used it.
But I failed to mirror web sites like naver, gmarkget, 11st to save pages as local cache. Maybe the reason of failure is my wrong use but the command that 'man page' gives won't work well.
wget -m -k -K -E -l 2 http://www.daum.net
그래서 다시 검색, 그 결과 찾은 툴은 httrack 입니다. 이것 아니었으면 몇 시간의 python 삽질 스크립트를 만들 뻔 했으나 다행이도 원하는 일을 잘 해준 고마운 툴입니다.
So I've tried to google, eventually found 'httrack'. Without this cool tool , I could have dig to implement python code. Thanks to httrack !
windows 툴도 제공하니 써있는 그대로 따라하면 됩니다~.
단, recursion depth를 1-2 정도로만 해서 쓰세요. 과한 트래픽 발생으로 귀찮은 문제가 생길지도 모르니~.
Httrack also supports windows version.
And you should be sure to use setting as 1-2 recursion depth. Without the setting, you'll see a some noisy problem ;)