Sitemap.xml 의 개요
Sitemap 은 사이트의 웹페이지를 나열하는 파일로 사이트 콘텐츠의 구성을 google 및 다른 기타 검색 엔진에 알리는데 사용된다.
Sitemap은 웹마스터가 검색엔진 크롤링에 사용할 수 있는 사이트의 페이지에 대한 정보를 검색 엔진에게 쉽게 노출될수 있는 가장 편리한 방법이다.
또한 Sitemap 은 Sitemap 에 표시한 페이지와 관련이 있으며 가치 있는 메타데이터를 제공할수 있다.
메타데이터는 웹페이지에 관한 정보로 페이지가 마지막으로 업데이트된 날짜, 페이지변경빈도, 사이트이 다른 URL대비 페이지의 중요성등이 포함된다.
Sitemap 을 사용하여 페이지에 있는 동영상, 이미지, 모바일 콘텐츠등 특정 유형의 콘텐츠에 대한 메타데이터를 검색엔진에 제공한다.
Sitemap의 가장 간단한 형식은 검색엔진에서 크롤링 할수 있도록 각 URL 에 대한 추가 메타데이터와 함께 사이트에 대한 URL을 나열하는 XML 파일을 비롯한 여러 서비스로 제공되고 있다.
<Sitemap 사용 단계>
1.Google 에서 크롤링하도록 할 사이트의 페이지를 결정하고 각 페이지의 표준버전을 선택.
2.사이트맵 형식을 결정하여, 수동으로 사이트맵을 만들거나 다양한 타사도구 중 원하는 툴을 선택하여 사이트맵을 생성.
3.Search Console 사이트맵 테스트도구를 사용하여 사이트맵 테스트 진행.
4.사이트맵을 robots.txt 파일에 추가하고 Search Console 에 제출.
<Sitemap 지원 형식>
XML / RSS, mRSS, Atom / TEXT / Google 사이트도구
●
가이드라인
1.일관성 있는 정규화된 URL을 사용한다. Google은 표시된 그대로 URL을 크롤링 한다. 예를들어 사이트가 http://www.example.com/에 있는 경우 URL을 /http://example.com/(www 없음)
또는 ./mypage.html(상대 URL)로 지정해서는 안된다.
2.URL의 중복 크롤링을 줄이기 위해 사이트맵에 URL의 세션 ID가 포함되지 않아야 한다.
3.사이트맵 파일에 각 언어마다 표준 URL을 표시하고 hreflang 주석을 사용하여 Google에 크롤링 및 색인 생성할 URL 번역본을 지정한다.
4.사이트맵 파일은 UTF-8로 인코딩되어야 하며 적절하게 URL을 이스케이프 처리해야 한다.
5.대형 사이트맵을 분할하여 여러 개의 소형 사이트맵을 만들면 Google에서 사이트맵을 자주 요청할 때 서버에 과부하가 걸리지 않게 할 수 있다.
또한 하나의 사이트 맵 파일은 최대 50,000개의 URL을 포함할 수 있으며 압축하지 않은 파일 크기가 50MB 이하여야 한다.
6.사이트맵 색인 파일을 사용하여 모든 사이트맵을 표시하고 개별 사이트맵 대신 이 하나의 파일을 Google에 제출합니다.
7.도메인의 www 버전과 www가 없는 버전에서 모두 사이트에 액세스할 수 있는 경우 권장되는 표준화 방법을 사용하여 Google에 제출한다. 선호 도메인만을 위한 사이트맵을 제출해야 한다.