XML 사이트 맵은 방문자들의 내비게이션 편의를 위한 HTML 사이트맵과는 달리, 구글 등 검색엔진들을위해 해당 웹사이트를 보다 정확하고 빠르게 크롤링될 수 있도록 해주는 XML포맷의 파일입니다.
XML사이트 맵에 관한 자세한 정보는 이곳에서 확인할 수 있습니다.(영문)

이번 포스팅에서는 간편하게 온라인으로 사이트맵 파일을 생성하여 구글에 제출하는법을 소개하겠습니다.
먼저 아래의 웹사이트에 접속하세요.
http://www.xml-sitemaps.com/

사용자 삽입 이미지

1. 위의 웹사이트에 접속한 후, 중간 쯤에 'Starting URL' 웹사이트 주소를 입력하는 란이 있는데 이곳에 사이트맵을 생성할 홈페이지 주소를 입력합니다.

2. 아랫부분에 있는 '업데이트 주기' 에서 '최종 수정일' 등 선택 옵션은 오른쪽 사이드바의 설명을 읽고 각자 사이트에 맞춰 옵션을 정합니다. 이해가 잘 안된다면 기본 옵션으로 그대로 두어도 상관은 없습니다.

3. 옵션을 선택했으면 아래에 있는 'Start'버튼을 클릭합니다.

시작 버튼을 누르면 사이트 규모에따라 몇초~ 몇분정도의 사이트 분석 시간이 지난 후 생성결과 페이지가 뜹니다.

여러개의 링크가 나올텐데 그 중에서 제일 위에있는 ..../sitemap.xml 링크에다가 오른쪽 마우스를 클릭 하고 '다른 이름으로 대상 저장'을 하여 다운로드합니다.

그리고 나서 웹사이트 ftp로 접속하여 다운받은 사이트 맵을 도메인의 루트 디렉토리에 업로드합니다.
http://www.domain.com/sitemap.xml
웹주소는 이렇게 나오겠죠.


사이트 맵을 업로드 하였으면 구글 웹마스터 도구로 접속하여 해당 도메인 계정으로 로그인합니다.
https://www.google.com/webmasters/tools/

사용자 삽입 이미지
사이트 맵 메뉴로 가서 "Add a Sitemap" 클릭 --> "Add General Web Sitemap" 선택 --> 입력란에 방금 업로드한 사이트맵 주소를 입력합니다.

사용자 삽입 이미지
사이트 맵이 성공적으로 제출되었습니다.

이렇게 사이트 맵을 제출 한다면 7일내로 구글봇이 내부 웹페이지를 포함해 웹사이트 전체가 크롤링될 가능성이 높아집니다.

블로그는 미국의 워드프레스같은 설치형 블로그의 경우, 사용자 기반이 엄청나 그런 XML 사이트 맵을 자동으로 생성해주는 플러그인이 있는데 국내 태터툴즈는 아직 플러그인이 나와 있지 않네요. 따라서 xml-sitemaps.com 온라인 사이트 맵 생성 서비스를 이용하는게 편리할듯합니다.

크리에이티브 커먼즈 라이센스
Creative Commons License
이올린에 북마크하기(0) 이올린에 추천하기(0)


추천 다운로드 강력한 사진 관리 프로그램, Picasa, 지능적인 검색, 즐겨찾기, 한글 번역 등 고급 기능을 갖춘, Google 툴바, 무료로 즐기는 인터넷 전화, Skype 이 모든 프로그램이 하나의 패키지에 포함되어 있습니다.
WZD | 구글 | 네이버 | 뉴스2.0 | 다음 | 델리셔스 | 마가린 | 북마커 | 야후 | 정보 | 한RSS
이 글의 관련글
http://www.delisweb.com/trackback/41
YOUR COMMENT IS THE CRITICAL SUCCESS FACTOR FOR THE QUALITY OF BLOG POST
  1. BlogIcon gomdori 2007년 10월 06일 14시 59분  댓글주소  수정/삭제  댓글쓰기

    아~~~ 그렇군요...모르는게 있으면 종종 들르겠습니다. 감사합니다.

  2. BlogIcon Magicboy 2007년 10월 31일 17시 08분  댓글주소  수정/삭제  댓글쓰기

    잘 읽었습니다..^^
    그런데 xml-sitemaps.com 이.. 접속이 안되네요.. 저만 그런가요?-_-a..

    그리고 블로그의 경우에 전체 포스트를 sitemap으로 다 등록시켜두는게 좋을까요??
    http://www.sitemapbuilder.net/Default.aspx 에서 sitemap 을 생성했는데, 최근글(?)들만 페이지 등록이 되는 듯 하더군요.

    • BlogIcon DelisWeb 2007년 10월 31일 22시 21분  댓글주소  수정/삭제

      방금 접속해 보니 저는 접속이 잘 되네요.^^

      사이트맵에 내부 웹페이지(포스팅) 전체가 등록되면 좋겠지만 무조건 전체 웹페이지를 등록 시킬 필요는 없습니다.
      일단 구글에 사이트맵을 등록하면 구글봇이 사이트맵이 제출되기 전보단 자주 사이트를 크롤링하게 되므로 크롤링을 하면서 사이트맵에 등록되지 않은 웹페이지들까지 크롱링할 가능성이 높아집니다.
      그래서 블로그를 새로 만들자마자 사이트맵을 구글에 올리는게 중요하죠.

      따라서, 중요한 페이지(메인 페이지, 카테고리 페이지, 공지사항, about 페이지, 최근 포스팅 50개)정도면 무방합니다.


  3. 싼타 2007년 11월 21일 18시 01분  댓글주소  수정/삭제  댓글쓰기

    질문있는데요.. 로그인 후에 사용가능한 컨텐츠도 크롤링 되나요? 예를 들면 마이페이지와 같은 개인정보가 담겨져 있는 정보도 크롤링되는지 궁금합니다.

    • BlogIcon DelisWeb 2007년 11월 23일 20시 03분  댓글주소  수정/삭제

      안녕하세요. 로그인 후에 출력되는 컨텐트는 포함되질 않습니다.
      웹사이트 구조를 따라서 메인 페이지, 서브 페이지 등 최대 500개 웹페이지까지 크롤링해서 사이트맵을 생성해줍니다.

      로그인 후 보이는 mypage 이런 제한된 페이지는 기술적으로 아이디와 패스워드를 입력해서 PHP세션을 통해 DB 자료를 호출해야 하기 때문에 원천적으로 불가능합니다.

  4. BlogIcon 배째 2008년 01월 09일 00시 05분  댓글주소  수정/삭제  댓글쓰기

    좋은 정보 고맙습니다 :D

    그리고 질문있습니다~

    sitemap.xml을 루트에 넣어놓고
    로봇들이 읽어가는 거라면
    주기적으로 sitemap.xml을 직접 갱신시켜줘야 하나요?
    아님 한 번만 sitemap.xml을 제출 하면 되는건가요?

    그리고 만들어진 xml을 열어보니 한글이 깨지네요;
    UTF-8 호스팅 받고 있는데 ; 에휴 =3

    • BlogIcon DelisWeb 2008년 01월 10일 10시 19분  댓글주소  수정/삭제

      일단 사이트맵이 등록되면 예전보다 로봇 재방문률이 높아집니다.
      따라서 사이트맵에 등록되지 않은 새 웹페이지도 결국 2주내에 크롤링 되므로 급한 컨텐트가 아니라면 일일이 사이트맵을 다시 갱신할 필요는 없습니다.

      특히 블로그처럼 rss 피드를 가진 웹사이트라면,
      검색엔진들이 사이트맵을 분석 후 다음 크롤링부터는 rss를 읽어서 새로운 컨텐트를 크롤링하지요.
      아마 네이버나 구글 같은데서 블로그 검색결과에 방금 업데이트한 포스트가 출력되는 경우를 많이 보실 수 있을겁니다.

      결국 검색엔진에 사이트맵을 제출하는 궁극적 목적은
      "내 웹사이트가 여기있고 이런 구조를 가지고 있다."라고 검색엔진들에 눈도장(?)찍히려는 것이지요.

      추후 새로 업데이트되는 포스트이나 웹페이지는
      해당 블로그/웹사이트의 업데이트 주기나 PageRank 수치에 따라 크롤링 주기가 결정되므로 꾸준한 업데이트와 백링크를 많이 구축하여 PR을 높이는게 중요합니다.

      그리고 한글은 어떤 사이트는 깨지고 어떤 사이트는 바로 읽히고.. 이상하네요.^^ UTF-8 혹은 euc-kr로 웹사이트 메타태그의 언어 부분도 한번 보시고, 일단 꺠지더라도 그대로 제출해보세요.
      봇이 검색결과페이지의 제목과 설명을 정하는건 좌표 역할을 하는 사이트맵이 아니라 웹페이지 본문을 직접 읽어서 하는것이니까요.

  5. BlogIcon 배째 2008년 01월 10일 10시 25분  댓글주소  수정/삭제  댓글쓰기

    친절하고 알기쉬운
    설명 정말 고맙습니다 :D

    좋은 하루 보내십시요 ^^