Robots.txt 파일은 사이트의 루트에 위치하며 사이트에서 검색엔진 크롤러가 엑세스하지 않기를 바라는 부분을 표시할때 쓰인다.
| http://domain.com/robots.txt |
파일에서는 로봇 배제 표준 프로토콜의 명령을 사용하여 섹션별, 웹 크롤러 종류별(모바일,데스크톱)로 사이트에 대한 액세스 권한을 표시 한다.
사이트에 google 또는 다른 검색엔진이 색인을 생성하지 않기를 바라는 콘텐츠가 포함되어 있는 경우에 만 Robots.txt 파일이 필요하다.
Robots.txt를 작성하기 전에 이 URL차단 메소드의 위험에 대해 주의해야 하며 웹에서 내 URL이 검색되지 않도록 하는 다른 메커니즘을 고려 할 수도 있다.
|
다음은 robots.txt 파일의 샘플 이다.
User-agent: * Disallow: /order/ Disallow: /register/ Disallow: /cart/ Disallow: /remittance/ Disallow: /loyalty/ Disallow: /interest/ Disallow: /tns/ Disallow: /csagent/ Disallow: /community/ Disallow: /openapi/ Disallow: /commons/ Disallow: /jsp/ Disallow: /wingBanner/ Disallow: /chatping/ User-agent: Mediapartners-Google Allow: /order/ Allow: /cart/ Allow: /loyalty/ Allow: /interest/ Disallow: /register/ Disallow: /remittance/ Disallow: /tns/ Disallow: /csagent/ Disallow: /community/ Disallow: /openapi/ Disallow: /commons/ Disallow: /jsp/ Disallow: /wingBanner/ Disallow: /chatping/ |