디자인 가이드 라인

  • 계층 구조와 텍스트링크가 명확해야 하며 모든 페이지는 하나이상의 정적 텍스트 링크를 통해 연결되어 있어야 한다.
  • 사이트의 주요 섹션으로 이어지는 링크를 사이트맵을 통해 사용자에게 제공한다.
  • 한 페이지의 링크 수를 적절하게 유지한다.
  • 유용하고 정보가 풍부한 사이트를 만들고 페이지에서는 분명하고 정확하게 사이트 콘텐츠를 설명한다.
  • 내 페이지를 찾기 위해 사용자들이 어떤 단어를 입력할지 생각해보고 그 검색어가 실제로 사이트에 사용 되도록 한다.
  • 중요한 이름이나 콘텐츠, 링크를 표시할때는 이미지가 아닌 텍스트를 사용한다. 텍스트 대신 이미지를 사용해야 하는 경우 ALT 속성을 사용하여 몇 개의 단어로 된 설명 텍스트를 포함 시켜야 한다.
  • <Title> 요소 및 ALT 속성의 TEXT 가 구체적이고 정확한지 확인한다.
  • 깨진 링크가 있는지 확인한다.
  • 동적 페이지, 즉 ? 문자가 포함된 URL를 사용하는 경우, 정적인 페이지와 동적인 페이지를 모두 크롤링 하지 않는 검색엔진 스파이더로 있다, 그러므로 매개변수의 경우 길이는 짧게 개수는 작게 유지해야 한다.


기술 가이드 라인

  • Google 봇이 사이트의 콘텐츠를 완전히 이해할 수 있도록 CSS나 자바스크립트 파일과 같은 모든 사이트의 애셋에 대한 크롤링을 허용한다.
  • 세션 ID나 사이트를 통해 경로를 추적하는 인수가 없어도 검색봇이 사이트를 크롤링 할수 있도록 허용한다. 세션 ID나 경로 추적 인수를 사용하는 기술은 개별적인 사용자 동작을 추적할때는 유용하지만 봇의 액세스 패턴에는 전혀 유용하지 않는다.
  • 웹서버가 If-Modified-Since HTTP 헤더를 지원하는지 확인한다. 이 기능은 웹서버가 Google의 마지막 크롤링 작업 이후 콘텐츠가 변경되었는지를 Google에 알리게 된다. 이 기능을 지원하면 대역폭과 오버헤드를 줄일 수 있다.
  • 웹서버에서 robots.txt 파일을 사용한다. 이 파일은 크롤링할 디렉토리와 크롤링하지 않아야 할 디렉토리를 크롤러에 알려준다. 실수로 크롤러를 차단하지 않도록 최신 사이트정보로 파일을 업데이트 해야한다.
  • 광고가 검색엔진 순위에 영향을 미치지 않도록 적절한 조치를 취해야 한다. 이는 robots.txt 파일로서 크롤링이 되지 못하도록 차단해야 한다.
  • CDN 을 구입하는 경우 구입한 시스템이 검색엔진이 크롤링 할 수 있는 페이지와 링크를 생성하는지 확인해야 한다.
  • 검색결과 페이지나 자동생성되는 페이지 등 검색엔진을 통해 들어오는 방문자에게 그다지 도움이 되지 않는 내용은 robots.txt를 사용하여 크롤링을 차단하는 것이 좋다.
  • 크로스 브라우저가 재대로 동작 되는지 확인한다.


품질 가이드 라인

  • 자동으로 생성된 콘텐츠 사용금지 : 자동 생성 콘텐츠를 프로그래밍 방식으로 콘텐츠를 생성한다. 대개 말이 되지 않는 단락에 검색 키워드를 포함시켜 만든 무작위 텍스트 단락들로 구성.
  • 링크편법 : PageRank 또는 Google 검색결과의 사이트 순위를 조작할 의도가 있는 모든 링크는 링크 편법의 일부로서 Google의 웹마스터 가이드라인에 위배되는 것으로 간주.
  • 자체 제작 콘텐츠가 거의 또는 전혀 없음 : 단어만 많고 실제 콘텐츠는 거의 또는 전혀 없는 페이지를 만들어 페이지의 순위를 높이고 방문자 수를 늘리는 행위.
  • 클로킹 : 사용자와 검색엔진에 각각 다른 콘텐츠 또는 URL 을 제공하는 행위.
  • 부적절한 리디렉션 : 방문자가 원래 요청한 URL이 아닌 다른 URL로 방문자를 보내는 행위.
  • 숨겨진 텍스트 및 링크 : 검색순위를 조작히기 위해 콘텐츠에 텍스트나 링크를 숨겨서 노출하는 행위.
  • 도어웨어 페이지 : 특정 검색어에 대해 순위가 높게 나타나도록 만들어진 사이트 또는 페이지.
  • 스크랩한 콘텐츠 : 관련성 없는 콘텐츠를 무작위로 제공하여 웹페이지의 분량을 늘리는 것. 또한 다른 사이트에서 콘텐츠를 가져다 사용한 것.
  • 제휴 프로그램 : 고유한 가치가 있는 독창적인 웹사이트를 만들 것을 권장, 제휴 프로그램은 다른 웹사이트와 차별화되는 고유한 콘텐츠가 없기 때문에 검색순위가 하락될 우려.
  • 유인 키워드 반복 : 검색결과 순위를 조작하기 위한 페이지의 키워드나 숫자를 채워 넣는 행위.
  • 피싱 또는 바이러스, 트로이목마, 기타 악성 소프트웨어 설치 등 악의적 행위가 이루어지는 페이지 생성.
  • 리치스니펫 마크업 악용.
  • 자동화된 검색어 : 종류에 상관없이 자동화된 검색어를 명시적 사전 허가 없이 검색엔진 크롤링이 되는 행위.