이 가이드를 준수해 주시면 Google이 귀하의 웹사이트를 찾아 색인에 포함하고 순위를 지정하는데 도움이 됩니다. 이러한 제안을 따르지 않으시는 경우에도 '가이드라인'을 반드시 참조하시어 Google 색인에서 사이트가 완전히 제거되는 결과를 초래할 수 있는 몇 가지 불법 행위에 대해 읽어보실 것을 적극 권해 드립니다. 사이트가 삭제되면 Google.co.kr이나 Google의 파트너 사이트의 검색 결과에 더 이상 표시되지 않습니다.
디자인 및 콘텐츠 가이드:
- 계층 구조와 텍스트 링크가 명확한 사이트를 만드십시오. 최소한 하나의 고정 텍스트 링크에서 모든 페이지를 연결할 수 있어야 합니다.
- 사이트의 중요한 부분으로 연결되는 링크가 있는 사이트 맵을 사용자들에게 제공하십시오. 사이트 맵에 100개가 넘는 링크가 있으면 사이트 맵을 별도의 페이지로 분리해야 할 수도 있습니다.
- 유용하고 풍부한 정보를 제공하는 사이트를 만들고, 귀하의 콘텐츠를 확실하고 정확하게 설명해주는 페이지를 작성하십시오.
- 귀하의 페이지를 찾기 위해 사용자들이 과연 어떤 단어를 입력할지 생각해보고 실제로 사이트 내에 이러한 단어가 포함되도록 하십시오.
- 이미지가 아닌 텍스트를 사용해 중요한 이름, 콘텐츠 또는 링크를 표시하십시오. Google 크롤러는 이미지 안에 있는 텍스트를 인식하지 못합니다.
- TITLE 및 ALT 태그가 정확한지, 그리고 내용을 제대로 설명하고 있는지 확인하십시오.
- 깨진 링크가 있는지 확인하고 HTML을 수정하십시오.
- 동적 페이지(예: “?” 문자가 들어 있는 URL)를 사용하는 경우, 이 페이지는 물론 고정 페이지를 크롤링하지 않는 검색 엔진 스파이더도 있다는 점에 유의하십시오. 매개변수의 경우 길이는 짧게, 개수는 적게 유지하면 도움이 됩니다.
- 주어진 페이지에서 링크의 수를 적절하게 유지하십시오(100개 미만).
기술 가이드:
- 사이트가 대부분의 검색 엔진 스파이더와 Lynx에서 비슷하게 표시되므로 Lynx 같은 텍스트 브라우저를 사용하여 사이트를 검토하십시오. Javascript, 쿠키, 세션 ID, 프레임, DHTML 또는 Flash 같은 고급 기능으로 인해 텍스트 브라우저에 전체 사이트가 표시되지 않으면 검색 엔진 스파이더가 사이트를 제대로 크롤링하지 못할 수도 있습니다.
- 검색 로봇이 세션 ID나 사이트의 경로를 추적하는 인수 없이도 사이트를 크롤링할 수 있도록 허용하십시오. 이 기술은 개별적인 사용자 동작을 추적할 때에는 유용하지만, 로봇의 액세스 패턴의 경우는 전혀 다릅니다. 이러한 기술을 사용할 경우 로봇은 모양은 다르지만 실제로 같은 페이지로 연결되는 URL을 삭제하지 못하므로 사이트가 색인에 완전하게 올려지지 않을 수도 있습니다.
- 웹 서버가 If-Modified-Since HTTP 헤더를 지원하는지 확인하십시오. 이 기능을 사용하면 웹 서버가 귀하의 사이트가 마지막으로 크롤링된 이후에 콘텐츠가 변경된 적이 있는지 Google에게 알려줄 수 있습니다. 이 기능이 지원되면 대역폭과 오버헤드가 절약됩니다.
- 귀하의 웹 서버에서 robots.txt 파일을 사용하십시오. 이 파일은 크롤러에게 크롤링하거나 하지 말아야 할 디렉터리를 알려줍니다. 실수로 Googlebot 크롤러를 차단하지 않도록 이 파일을 귀하의 사이트에 지정하십시오. 로봇이 귀하의 사이트를 방문할 때 로봇에게 지시하는 방법을 배우시려면 http://www.robotstxt.org/wc/faq.html을 방문하시기 바랍니다.
- 회사에서 콘텐츠 관리 시스템을 구입하신 경우 검색 엔진 스파이더가 귀하의 사이트를 크롤링할 수 있도록 이 시스템에 콘텐츠를 내보내는 기능이 있어야 합니다.
- URL에 "&id="을 매개변수로 사용하지 마십시오. Google은 이런 페이지를 색인에 넣지 않습니다.
사이트가 준비된 경우:
- 다른 사이트가 귀하의 사이트를 링크하는지 확인하십시오.
- http://www.google.co.kr/addurl.html에서 사이트를 제출하십시오.
- 또는 Google 사이트 맵(베타) 프로젝트의 일부로 사이트 맵을 제출하십시오. Google 사이트 맵은 귀하의 사이트 맵을 이용하여 사이트의 구조를 확인하고 웹 페이지의 범위를 확대시켜 줍니다.
- 귀하의 페이지의 영향을 받는 모든 사이트에 귀하의 사이트가 온라인 상태가 되었음을 알려주십시오.
- Open Directory Project 및 Yahoo! 같은 관련 디렉터리뿐 아니라 기타 산업별 전문 사이트에 귀하의 사이트를 제출하십시오.
가이드라인 - 기본 원칙:
- 검색 엔진이 아닌 사용자를 위한 페이지를 만드십시오. 사용자를 속이거나, 사용자에게 표시되는 콘텐츠와 다른 콘텐츠를 검색 엔진에 제공하지 마십시오. 이런 행위는 흔히 “클로킹(cloaking)”이라고 불립니다.
- 검색 엔진 순위를 높이기 위한 변칙적인 행위는 피하십시오. 경험적으로 볼 때 귀하께서 하신 작업을 경쟁 웹사이트의 웹 마스터에게도 자신 있게 설명할 수 있다면 변칙적인 행위에 해당하지 않을 것입니다. 또한, 이 작업이 사용자에게 도움이 되는지, 검색 엔진이 없었다 하더라도 같은 작업을 했을지 되묻는 것도 유용한 판단 기준이 됩니다.
- 사이트의 순위나 PageRank를 높이기 위해 만들어진 링크 전략에 관여하지 마십시오. 특히 웹 스패머나 웹상의 "위험한 사이트"에 대한 링크가 있으면 귀하의 순위가 내려갈 수 있으므로 이러한 링크는 피하십시오.
- 페이지 제출, 순위 확인 등을 위해 허가되지 않은 컴퓨터 프로그램을 사용하지 마십시오. 이러한 프로그램을 사용할 경우 대량의 컴퓨팅 리소스가 소비될 뿐 아니라 Google 서비스 약관에도 어긋납니다. 자동 또는 프로그래밍 방식 검색어를 Google로 보내는 WebPosition Gold™ 같은 제품은 사용하지 않으시는 것이 좋습니다.
가이드라인 - 세부 권장 사항:
- 숨겨진 텍스트나 링크를 사용하지 마십시오.
- 연결되는 사이트에 대한 정보가 확실하지 않은 링크는 사용하지 마십시오.
- 자동화된 검색어를 Google에 보내지 마십시오.
- 관련이 없는 단어가 포함된 페이지는 로드하지 마십시오.
- 대부분이 중복 콘텐츠로 이루어진 다중 페이지, 하위 도메인 또는 도메인을 만들지 마십시오.
- 검색 엔진을 위한 용도로만 만든 대문 페이지나, 원본 콘텐츠가 거의 없거나 아예 없는 관련 프로그램과 같이 틀에 박힌 방식들을 피하십시오.
이 가이드라인을 통해 Google은 가장 일반적으로 볼 수 있는 허위 행위나 조작 행위에 대해 설명하고 있습니다. 그러나 여기에 나와 있지 않더라도 오해의 소지가 있는 기타 행동들(예: 사용자를 기만하거나 널리 알려진 웹 사이트의 철자를 오기하여 등록하는 행위) 또한 Google이 금지하는 대상이 될 수 있습니다. 특정한 허위 행위가 이 페이지에 나와 있지 않다고 해서 Google에서 이를 허용한다고 가정해서는 안 됩니다. 웹 마스터가 위에 설명한 기본 원칙을 준수하기 위해 노력하는 경우 이를 악용하는 웹 마스터에 비해 사용자들에게 더욱 만족스러운 서비스를 제공할 수 있으므로, 결국 이들의 사이트 게재 순위 또한 높아지게 됩니다.
다른 사이트에서 Google의 가이드라인을 악용하고 있다는 사실이 발견되면 http://www.google.co.kr/contact/spamreport.html에서 해당 사이트를 고발해 주시기 바랍니다. Google은 스팸 퇴치를 위해 직접 나서기보다는 포괄적이고 자동화된 방법으로 문제를 해결해 나가고자 합니다. 접수되는 스팸 리포트는 향후 스팸 시도를 인식하고 차단하는 포괄적인 알고리즘을 개발하는 데 사용됩니다.
출처: 구글