Sitemap 파일은 UTF-8로 인코딩 되어야 한다. 일반적으로 파일을 저장할때 인코딩을 지정할 수 있으며 모든 XML 파일과 마찬가지로 모든 데이터 값(URL포함)은 아래 표에 나와있는
문자에 대해 엔티티 이스케이프 코드를 사용해야 한다.
또한 Sitemap의 URL을 포함한 모든 URL은 해당 URL이 위치한 웹서버에서 쉽게 읽을 수 있도록 인코딩되어야 하며 URL-이스케이프(URL-escaped)가 되어 있어야 합니다.
URL을 직접 입력하여 작성하는 대신 어떤 종류이든 상관없이 스크립트, 도구 또는 로그파일을 사용하여 URL을 작성하면 보통 해당 작업이 알아서 완료 되며,
URL이 URI의 RFC-3986 표준, IRI의 RFC-3987 표준 및 XML 표준을 따르는지 확인 해야 한다.
문자 | 이스케이프 코드 | |
앰퍼샌드 | & | & |
작은 따옴표 | ' | ' |
큰 따옴표 | " | " |
보다 큼 | > | > |
보다 작음 | < | < |
※ 다음은 비ASCII 문자(ü) 및 엔티티 이스케이프(&)가 필요한 문자를 사용하는 URL의 예입니다.
http://www.example.com/ümlat.html&q=name
※ 다음은 ISO-8859-1로 인코딩되고(해당 인코딩을 사용하는 서버에서 호스팅하는 경우) URL이 이스케이프된 URL의 예입니다.
http://www.example.com/%FCmlat.html&q=name
※ 다음은 UTF-8로 인코딩되고(해당 인코딩을 사용하는 서버에서 호스팅하는 경우) URL이 이스케이프된 URL의 예입니다.
http://www.example.com/%C3%BCmlat.html&q=name
※ 아래에는 엔티티 이스케이프된 URL이 나와 있습니다.