Поисковые системы по-своему интерпретируют содержание сайта. Веб-страница не всегда выглядит одинаково для пользователя и для поисковой системы. В этом разделе мы сосредоточимся на конкретных технических аспектах создания (или изменения) веб-страницы, чтобы они были структурированы для поисковых систем и людей.

Индексируемый контент

Для того, чтобы быть перечисленным в выдаче поисковых систем, содержание вашей страницы должно быть в текстовом формате HTML. Изображения, Flash, Java-апплеты, и другое не-текстовое содержание часто игнорируются или обесцениваются поисковыми роботами, несмотря на достижения технологии обхода страниц. Самый простой способ убедиться, что слова и фразы, что вы показываете вашим посетителям могут видеть поисковые системы - поместить его в HTML текст на странице. Однако, другое содержимое (не текстовое) требует некоторого форматирования:

  1. Изображениям в GIF, JPG, или в формате PNG должен быть назначен "Alt атрибут" в HTML, обеспечивая поисковым системам текстовое описание визуального контента.
  2. Блоки поиска могут быть дополнены навигацией и FOLLOW-ссылками.
  3. Flash и JAVA-плагины должны быть дополнены HTML описанием.
  4. Видео и аудио контент должен иметь сопроводительную стенограмму, если слова и фразы, используемые в ней будут использованы для продвижения.

Смотрим как поисковые системы

Многие веб-сайты имеют значительные проблемы с индексированием. С помощью таких инструментов, как кэш Google вы можете увидеть, какие элементы и их содержание могут видеть и открывать поисковые роботы. Взгляните в текстовом кэше Google страницу, которую вы сейчас читаете. Посмотрите, как она отличается:

 

Ух ты! Мы похожи?

С помощью функции Google кэш, мы можем видеть, как поисковая система, страница JugglingPandas.com не содержит ту богатую информацию, которую мы видим. Это затрудняет поисковую систему интерпретировать релевантность:

 

Важно оптимизировать не только контент, но и другое содержимое страницы. В противном случае, поисковые системы не увидят то, что вы хотите им показать.

Индексируемые ссылки.

Поисковые системы должны видеть не только содержание страниц, но и ссылки, которые на них ссылаются, иначе страница просто не будет видна поисковым роботам. Сканирование структуры ссылок – важный момент, который позволяет паукам проанализировать структуру, чтобы найти все страницы на сайте. Сотни тысяч сайтов делают критическую ошибку в навигации таким образом, чтобы поисковые системы не могли получить доступ к некоторым элементам, тем самым влияя на их способность получать доступ к страницам и их содержанию.

Ниже показано как эта проблема может произойти:

 

В приведенном выше примере, паук Google достиг страницы "A" и видит ссылки на страницы «В» и «Е». Тем не менее, несмотря на то, что С и D могут быть важными страницами на сайте, паук не имеет возможности для их достижения (или даже не знает, что они существуют). Это потому, что нет прямых, сканированных ссылок на эти страницы.

Анатомия ссылок

  

В приведенном выше рисунке, "<" тег указывает на начало ссылки. Тег ссылки может содержать изображения, текст или другие объекты, каждый из которых обозначают активную область на странице, чтобы пользователи могли перейти к другой странице. Это оригинальный навигационный элемент в Интернете - "гиперссылка". Символ “a” сообщает браузеру (и поисковым системам), где начинается ссылка. В этом примере: URL - http://www.jonwye.com – на него ссылается гиперссылка. Далее, видимая часть ссылки для посетителей, под названием “анкор” в SEO мире. </> - Тег закрывает ссылку , так что элементы, идущие далее на странице не будут ссылаться на данный в примере URL.

Это самый основной формат ссылки - и это в высшей степени понятно для поисковых систем. Пауки знают, что они должны добавить ссылку, использовать ее для расчета запросов - независимых переменных (как PageRank от Google), и проследовать по URL, чтобы проиндексировать содержимое страницы, на которую ссылается анкор.

Причины почему ссылки могут быть не проиндексированы.

  1. Если пользователям, чтобы зайти в определенную часть страницы, необходимо ввести данные в форму. Поисковые роботы не могут этого сделать.
  2. Если ссылки сделаны через JavaScript, то поисковые роботы могут проследовать по ссылке, а могут или нет, или, также, может быть, что ссылке передается меньший вес. Все ссылки, по которым, как вы предполагаете, должен пройти робот, обязательно должны быть в чистом HTML формате.
  3. Мета-теги и robots.txt позволяют владельцу сайта ограничить доступ поисковым роботам к странице. Просто имейте в виду, что многие веб-мастера нечаянно используют эти директивы как попытку блокировать доступ ботов-спамеров.
  4. Технически, ссылки в фреймах и I-фреймах являются сканируемыми, но оба представляют структурные вопросы к поисковым системам с точки зрения организации. Если вы не являетесь опытным пользователем с хорошим техническим пониманием того, как индексируют поисковые системы по ссылкам в фреймах, то лучше держаться от них подальше.
  5. Поисковые роботы не могут заполнять формы. Некоторые веб-мастера ошибочно полагают, что если разместят форму поиска у себя на сайте, то поисковые роботы могут найти то же, что и пользователи у себя на сайте. Не вводите себя в заблуждение.
  6. Поисковые системы не будут индексировать бесконечное количество ссылок на странице. Эта свободное ограничение необходимо, чтобы сократить спам и рейтинг. Страницы с более 100 ссылок рискуют не быть проиндексированными.

Rel=”nofollow”

rel="Nofollow" может использоваться со следующим синтаксисом :
<a href="http://artemblog.ru" rel="nofollow"> Класс! </>

Ссылки могут иметь много атрибутов, примененных к ним, но поисковые системы игнорируют почти все из них, с одним важным исключением - rel="NOFOLLOW". В приведенном выше примере, добавив rel=Nofollow атрибут к тегу ссылки, мы говорим поисковым системам, что мы, владельцы сайтов, не хотим интерпретировать ссылку как нормальную.

Nofollow, буквально, инструктирует поисковые системы не переходить по ссылке (хотя некоторые переходят). Nofollow тег возник как метод, чтобы помочь остановить автоматизированную систему комментариев, гостевую книгу от рассылки спама, но переросло со временем в то, что вес ссылки просто не передается. Ссылки с меткой NoFollow интерпретируются несколько иначе каждой из поисковых систем, но ясно, что они не передают вес, как обычно.

Использование ключевых слов (нацеливание).

Ключевые слова имеют основополагающее значение для процесса поиска - они являются строительными блоками языка. На самом деле, вся наука информационного поиска (в том числе веб-поисковых систем, как Google) основана на ключевых словах. Поисковые системы используют ключевые слова, чтобы понять, что находится на странице и в каких случаях показывать сайт в поисковой выдаче. Таким образом, вместо того, чтобы хранить 25 миллиардов веб-страниц все в одной базе данных, поисковые системы имеют миллионы и миллионы небольших баз данных, каждая сосредоточена на определенное ключевое слово или фразу. Это делает его гораздо быстрее двигатели для получения необходимых им данных в простом доли секунды.

Очевидно, что если вы хотите, чтобы ваш страницы имели шансы ранжирования в результатах поиска для ключевого слова "собака", то будет целесообразно убедиться, что слово "собака" является частью содержания индексируемого документа.

 

Доминирование ключевых слов.

Ключевые слова говорят о намерении и взаимодействием с поисковыми системами. Например, общий шаблон поиска запрос может пойти что-то вроде этого:

При выполнении поиска, поисковая система извлекает соответствующие страницы основываясь на словах, введенных в поле поиска. Другие данные, такие как порядка слов ( "Танки стреляют" против "стреляют танки" ), орфографии, пунктуации этих ключевых слов предоставляют дополнительную информацию о том, что использовать поисковым системам, чтобы помочь получить правильное ранжирование страниц.

Чтобы помочь достичь этого, поисковые системы измеряют вхождения ключевых слов, используемых на страницах, чтобы помочь определить «актуальность» того или иного документа в запросе. Один из лучших способов "оптимизации" страницы состоит в том, чтобы гарантировать, что ключевые слова, заметно используется в заголовках, тексте и мета-данных.

Как правило, чем более конкретны ключевые слова, тем выше ваши шансы быть выше в поисковой выдаче, основанную на меньшей конкуренции. Графический элемент ниже показывает актуальность широкого термина BOOK и конкретного названия, Tale of Two Cities. Обратите внимание на разницу двух множеств.

 

Злоупотребление ключевыми словами

С начала времен онлайн-поиска люди злоупотребляли вхождениями ключевых слов на странице. Они вставляли их неоднократно в тексты, URL, мета-теги, ссылки – тем самым, манипулируя поисковыми машинами. К сожалению, это очень аредит продвижению вашего сайта.


В начале поисковые системы полагались на использования ключевых слов в качестве сигнала релевантности, независимо от того где ключевые слова были фактически использованы. Сегодня, хотя поисковые системы все еще не могут читать и понимать текст, как человек, использование машинного обучения позволило им приблизиться к этому идеалу.

Лучше всего использовать ключевые слова, естественно. Если ваша страница ориентирована на ключевую фразу "Эйфелева башня", то вы можете естественно включают контент о Эйфелевой самой башни, истории башни или даже рекомендуемые отели Парижа. С другой стороны, если вы просто вставить слова "Эйфелева башня" на странице с неуместным содержанием, таких как страницы о разведении собак, то ваши усилия по повышению рейтинга "Эйфелева башня" будут долгими и тяжелыми.

Оптимизация страниц

Ключевые слова также влияют на факторы ранжирования, как и раньше. Мы можем использовать некоторые рекомендации по оптимизации страниц, для того, чтобы повышение рейтинга пошло намного эффективнее:

  • Используйте ключевые слова в теге title, по крайней мере один раз. Попытка держать ключевое слово как можно ближе к началу title-тега насколько это возможно.
  • Далее как можно ближе к верху страницы.
  • По крайней мере 2-3 раза, в том числе и измененное, в основном тексте на странице - иногда несколько больше, если есть много текстового содержания. Вы можете найти дополнительную пользу в том, чтобы использовать ключевое слово как можно больше, чем 2-3 раза, но по нашему опыту, это не влияет на ранжирование.
  • Хотя бы раз в атрибуте alt изображений на странице. Это не только помогает с веб-поиску, но и поиску изображений, которые могут иногда принести ценный трафик.
  • Один раз в URL.
  • Хотя бы раз в мета-теге description. Обратите внимание, что мета-тег description НЕ влияет на ранжирование, а скорее помогает привлечь клики из поисковиков на страницу результатов, так как это "фрагмент" текста, используемый в поисковых системах.
  • Ни в коем случае не использовать ключевое слово в качестве анкора ссылки на другую страницу. Это не даст веса релевантной странице.

Как должна выглядеть оптимальная плотность ключевого слова на странице? Оптимальная страница по фразе "кроссовки" выглядит примерно так:

 

Теги TITLE

Название страницы должно быть точным, кратким описанием контента. Это имеет решающее значение для пользователя и поисковой оптимизации.

Теги заголовков являются такой важной частью поисковой оптимизации. Приведенные ниже рекомендации охватывают важнейшие части оптимизации тега заголовков для поисковой системы и целей юзабилити.

Будьте внимательны к длине
Поисковые системы отображают только первые 65-75 символов в теге заголовка в результатах поиска (После этой длины, поисковые системы показывают многоточие - "...", чтобы указать, когда тег заголовка был отрезан). Это также общий допустимый предел большинства социальных сетей, поэтому придерживаться этого предела, как правило, разумно. Однако, если вы ориентируетесь на несколько ключевых слов (или особенно длинную ключевую фразу) и имеете их в теге заголовка – это имеет важное значение для рейтинга, и было бы целесообразно, сделать тег заголовка длинным.

Поместите важные слова, близкие к началу
Чем ближе к началу заголовка поместить ваши ключевые слова, тем более полезными они будут для ранжирования и более вероятно, что пользователь будет нажимать на них в результатах поиска.

 

Брендинг
В конце каждого текста мы любим добавлять в конец упоминание бренда, так как оно помогает повысить его узнаваемость и создать большое количество кликов людей, которые его любят и знакомы с ним. Иногда имеет смысл разместить свой бренд в начале тега заголовка, например, главной страницы. Поскольку слова в начале тег заголовка имеют больший вес.

Рассмотрим читаемость и эмоциональное воздействие
Название должно быть понятным и читаемым. Создание убедительного тега заголовка будет тянуть больше посещений из результатов поиска и может помочь привлечь посетителей на ваш сайт. Таким образом, важно учитывать не только оптимизацию и использования ключевых слов, но весь опыт пользователя. Тег заголовка является первым взаимодействием нового посетителя с вашим брендом и вы должны передать самые положительные впечатления.

Мета-теги

Мета-теги были первоначально предназначены для обеспечения получения информации о содержании веб-сайта. Некоторые из основных мета-тегов перечислены ниже, вместе с описанием их использования.

Мета-тег Robots

Тег Robots может быть использован для контроля деятельности поисковых роботов (для всех основных поисковых систем) на уровне страницы. Есть несколько способов его использования, чтобы влиять на восприятие страницы:

index/noindex – обычно говорит системам стоит ли индексировать страницу и хранить ее в результатах поиска. По умолчанию, системы индексируют все страницы, но, если вы хотите по какой-то причине запретить индексирование, то поставьте - noindex.

follow/nofollow – говорит поисковым роботам переходить ли по ссылкам на странице. По умолчанию – follow.

Пример:

<META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">

Noarchive – говорит, хранить ли страницу в кэше. По умолчанию все страницы, проиндексированные поисковой системой, хранятся в ее кэше. Это говорит о том, что, если ваш сайт не будет доступен во время поисковой выдачи, то можно будет загрузить страницу из кэша поисковой системы.

Nosnippet - сообщает поисковым системам, что они должны воздерживаться от отображения описательного блока текста рядом с названием страницы и URL в результатах поиска.

noodp/noydir – специализированные теги , рассказывающие поисковым системам не захватывать описательный фрагмент о странице из Open Directory Project (DMOZ) или Yahoo! Directory для отображения в результатах поиска.

Директива заголовка HTTP X-Robots-Tag также выполняет эти же цели. Этот метод особенно хорошо работает для содержания в не-HTML файлов, например, изображений.

Мета-тег Description

Мета -тег описания является кратким описанием контента страницы. Поисковые системы не используют ключевые слова или фразы в этом теге для определения рейтинга, но мета-описания являются основным источником фрагмента текста, отображаемого под листингом в результатах.

Мета -тег описания выполняет функцию рекламных текстов и, таким образом , является чрезвычайно важной частью поискового маркетинга.

Мета описания может быть любой длины, но поисковые системы в целом сократят фрагменты длиной более 160 символов, так что в целом он должен быть в этих пределах.

При отсутствии мета-описания, поисковые системы будут создавать сниппет из других элементов страницы. Для страниц, предназначенных для нескольких ключевых слов и темы, это вполне допустимая тактика.

Мета-тег Keywords

Мета-тег ключевых слов имел значение в одно время, но уже не ценно и не важно в поисковой оптимизации.

Остальные мета-теги могут иметь применения для поисковой оптимизации, но имеют менее решающее значение для процесса. Вы можете прочитать о них в Google Webmaster Tools.

Структуры URL

URL-адреса (веб-адреса) для конкретного документа имеют большое значение с поисковой точки зрения. Они появляются в нескольких важных местах.

 

Поскольку поисковые системы отображают URL-адреса в результатах поиска, они могут повлиять на количество кликов. URL-адреса также используются в рейтинге документов, и страницы, имена которых включают запрашиваемые поисковые фразы получают некоторую выгоду от правильного использования ключевых слов.

 

URL-адреса появляются в адресной строке веб-браузера, и, хотя это обычно имеет мало значения для поисковых систем, плохая структура URL может привести к негативному впечатлению пользователей.

 

URL выше, используется в качестве анкора ссылки, указывающую на страницу в этом блоге.

Рекомендации по построению URL

Первое впечатление.

Представьте себя пользователем: сможете ли вы сказать, что примерно находится на странице, глядя на URL страницы? Если можете, значит URL построен правильно.

Чем короче, тем лучше

Очень важно, свести количество слешей к минимуму. Это сделает ваши URL-адреса простыми к копированию и вставке (в электронные письма, сообщения в блоге, текстовые сообщения, и т.д.) и будет полностью виден в результатах поиска.

Использование ключевых слов очень важно (чрезмерное использование - опасно)

Если ваша страница ориентирована на определенный термин или фразу, не забудьте включить его в URL. Однако не переусердствуйте, пытаясь сделать вхождения нескольких ключевых слов для целей SEO – чрезмерное использование приведет к менее пригодным адресам и может сработать спам-фильтр.

Статические URL

Используйте человекопонятные URL (ЧПУ). Использование таких директив, как mod_rewrite для Apache и Isapi_Rewrite для Microsoft, вы можете легко преобразовать динамические URL, например, http://artemblog.ru/blog?id=123, в более удобный для чтения вариант, как этот: http://artemblog.ru/blog/google-fresh-factor. Даже отдельные динамические параметры в URL могут привести к снижению общего рейтинга и индексации.

Используйте дефис для разделения слов.

Не все веб-приложения точно интерпретируют разделители подчеркивания "_", плюс "+" или пространство "%20", так что используйте дефис "-" для разделения слов в URL, как и в google-fresh-factor для URL-адреса на примере выше.

Дубликаты страниц и канонизация

Дублированный контент является одной из самых неприятных и проблемных задач, с которой может столкнуться любой веб-сайт. За последние несколько лет поисковые системы начали штрафовать понижением позиции дублирование контента.

Канонизация происходит, когда два или более повторяющихся версии веб-страницы появляются на различных URL. Это очень распространенная проблема с современными системами управления контентом (CMS). Например, вам предлагают регулярные версию страницы и "оптимизированную для печати" версию одного и того же содержания. Дублированный контент может даже появиться на нескольких веб-сайтах. Для поисковых систем, это представляет большую проблему - какую версию этого содержания они должны показать в поисковой выдаче?

Канонизация – это процесс организации вашего контента таким образом, чтобы каждое уникальное произведение имело один и только один URL. Если вы оставите несколько версий контента на сайте (или сайтах), то в конечном итоге получится следующий сценарий, так как поисковая система в данном случае сама выбирает ту, которую она считает оригинальной: Какой алмаз является правильным?

 

Вместо этого, если владелец сайта взял эти три страницы и произвел перенаправление с помощью 301-redirect, то поисковые системы будут иметь только один вариант, более весомую страницу, чтобы показать ее в результатах поиска.

Canonical – тег в помощь!

Другой варианты для поисковых систем, можно с помощью тега canonical. Он также может быть использован в различных сайтах, с одного URL на одном домене в другой URL на другом домене.

Используйте канонический тег в пределах страницы, содержащей одинаковые содержания.

<link rel="canonical" href="http://artemblog.ru/blog"/>

Это говорит поисковым системам, что нужная страница должна рассматриваться так если бы это была копия URL http://artemblog.ru/blog и что все линии связи и контент-метрики поисковых систем должны применяться обратно к этому URL.

Атрибут Canonical URL тега похож во многом на 301 редирект с точки зрения SEO. По сути, вы хотите сказать поисковым системам, что несколько страниц должны быть рассмотрены как одна (как делает 301 редирект), но фактически не перенаправляет посетителей на новый URL, что бывает полезно.

Сниппеты

Вы когда-нибудь видели 5-звездочный рейтинг в результатах поиска? Скорее всего поисковая система получила эту информацию из сниппетов встроенных на веб-странице. Сниппеты представляют собой тип структурированных данных, которые позволяют веб-мастерам сделать разметку контента несколькими способами, которые предоставляют информацию в поисковые системы.

Хотя использование сниппетов и структурированных данных не является обязательным элементом SEO, их растущая популярность означает, что веб-мастера, которые ими пользуются могут получить преимущество в некоторых обстоятельствах.

Структурированные данные означает добавление дополнительной разметки на содержание вашего сайта, так что поисковые системы могут легко определить, какой это тип контента. Schema.org предоставляет несколько примеров типов данных, которые могут быть выгодными. К ним относятся люди, продукты, обзоры, бизнес, рецепты и события.

Часто поисковые системы включают структурированные данные в результатах поиска, такие как в нашем случае рейтинг (звезды) и авторы (аватар).

Защищаем честь вашего сайта.

К сожалению, Интернет наполнен сотнями тысяч (если не миллионами) недобросовестных веб-сайтов, чей бизнес и движение зависит от копирования содержание с других сайтов и их повторного использования (иногда в странно модифицированных способах) на своих собственных доменах.


При публикации контента в любой тип формата подачи - RSS / XML / и т.д. - не забудьте проверить связь с основными услугами blogging/tracking (как Google, Technorati , Yahoo! и др. ).

Далее, вы можете использовать лень недобросовестных против них. Большинство их в Интернете будет повторно публиковать контент без редактирования, и, таким образом, путем включения ссылки на ваш сайт, вы можете быть уверены, что поисковые системы увидят большинство копий ссылок обратно к вам (то, что ваш источник, вероятно, автор). Чтобы сделать это, вы должны будете использовать абсолютные, а не относительные ссылки во внутренней структуре контента. Таким образом, вместо ссылки к вашей главной странице с помощью:

<a href="../> Главная </>

Вместо этого использовать:

<a href="http://artemblog.ru"> Главная </>

Таким образом, когда человек подхватывает и копирует содержание, связь остается за счет ссылки на ваш сайт.

Есть более продвинутые способы защиты от копирования, но никакие из них не являются полностью надежными. Вы должны ожидать, что чем более популярным и видным ваш сайт становится, тем чаще вы найдете ваш контент повторно опубликованным. Много раз, вы можете игнорировать эту проблему, но, если она становится очень серьезной, и вы увидите как те, кто скопировал ваш контент, забирают ваш рейтинг и трафик, вы можете рассмотреть возможность использования судебного процесса.