Sitemap 파일은 UTF-8로 인코딩 되어야 한다. 일반적으로 파일을 저장할때 인코딩을 지정할 수 있으며 모든 XML 파일과 마찬가지로 모든 데이터 값(URL포함)은 아래 표에 나와있는

문자에 대해 엔티티 이스케이프 코드를 사용해야 한다.

또한 Sitemap의 URL을 포함한 모든 URL은 해당 URL이 위치한 웹서버에서 쉽게 읽을 수 있도록 인코딩되어야 하며 URL-이스케이프(URL-escaped)가 되어 있어야 합니다.

URL을 직접 입력하여 작성하는 대신 어떤 종류이든 상관없이 스크립트, 도구 또는 로그파일을 사용하여 URL을 작성하면 보통 해당 작업이 알아서 완료 되며,

URL이 URI의 RFC-3986 표준, IRI의 RFC-3987 표준 및 XML 표준을 따르는지 확인 해야 한다.

문자

이스케이프 코드

앰퍼샌드

&

&

작은 따옴표

'

'

큰 따옴표

"

"

보다 큼

>

>

보다 작음

<

&lt;

※ 다음은 비ASCII 문자(ü) 및 엔티티 이스케이프(&)가 필요한 문자를 사용하는 URL의 예입니다.

http://www.example.com/ümlat.html&q=name

※ 다음은 ISO-8859-1로 인코딩되고(해당 인코딩을 사용하는 서버에서 호스팅하는 경우) URL이 이스케이프된 URL의 예입니다.

http://www.example.com/%FCmlat.html&q=name

※ 다음은 UTF-8로 인코딩되고(해당 인코딩을 사용하는 서버에서 호스팅하는 경우) URL이 이스케이프된 URL의 예입니다.

http://www.example.com/%C3%BCmlat.html&q=name

※ 아래에는 엔티티 이스케이프된 URL이 나와 있습니다.

http://www.example.com/%C3%BCmlat.html&amp;q=name