Webmaster Notes

Мануал по поисковой оптимизации Гугла.

25 октября 2010, 10:11

Мануал по поисковой оптимизации Гугла.

Как всем нам хорошо известно, самая нужная и полезная работа обычно делается силами наименее профессионально подготовленной части коллектива. Потому как истинный мастер всякой фигнёй заниматься не станет, а вот деятельность в рамках «всякой фигни», доверенная ламеру, и будет в итоге наиболее востребованной самыми широкими массами.

Такая вот ухмылка обыденности над здравым смыслом.

Вот и Гугл, обретя под сводами крыши вчерашних студиозусов, не долго думая, взял, да и засадил их за написание всякой ненужной ерунды, типа Google Search Engine Optimization Starter Guide 2010, ибо пока что больше ничего им доверить нельзя. Книжка получилась славной - ещё немножко, и до классических комиксов дойдёт.

Кто знает инглиш, почитайте. Хуже не будет.

Всем же остальным прочим, вражеского языка не разумеющим, рекомендуется зачитать этот пост Мастера Ласто, дабы умудриться, и примкнуть к сонму постигших все тонкости вебмастеринга.

Только давайте договоримся, что ни о каком подстрочнике тут речи не идёт. Тупой копипаст с одного лэнгвича на другой Мастеру Ласто абсолютно не интересен. Просто конспективно выделим то, что в действительности имеет ввиду Гугл, желательно предварительно тщательно позабыв всякие домыслы, почерпнутые у толпы гур.

И, уж простите, сделаем это на сложившемся вебмастерском жаргоне, ибо смею предположить, что он всеми понимается. Только вчера бросивших сосать мамкину титьку тут быть по определению не должно.

О построении сниппетов:

Не очень важно, на какой именно позиции первой страницы серпа очутился Ваш сайт. Это пусть маркетологи одурачивают заказчиков SEO-шных контор сказками про то, что первая позиция лучше второй, но стоит вдесятеро дороже. Мы-то знаем, что изыскатель всё равно пройдётся по всем первым позициям, а иногда и по нескольким первым страницам серпа, если он ищет что-то особенно важное. Либо ткнётся в тот сниппет, из которого с очевидностью следует, что, собственно, в других местах уже можно и не искать.

Поэтому не стоит с настырностью идиота фаршировать тег тайтла и метатег дискрипшена ключевиками. Изыскатель прекрасно помнит, что он вбил в строку поиска, и заклинать его множеством повторов этих же слов не надо. Потому что такой заикастый сниппет ему не интересен (он, скорее всего, ведёт на дор), не информативен, и вряд ли будет выбран.

А вот чтобы получился правильный сниппет, гугл даёт ряд прямых рекомендаций:

  • Тег тайтла обычно участвует в построении сниппета, и в силу своей неимоверной важности обязан чётко и ёмко описывать суть и смысл своего документа. Причём по возможности лаконично, ибо сниппет совершенно точно не резиновый, и если Вы забудете, кто такая сестра таланта, содержимое тайтла будет представлено в сниппете фрагментарно. Что в ряде случаев лишает его смысла.

  • Метатег дискрипшена может (но не обязан) участвовать в построении сниппета. Гугл чётко в своём мануале оговаривает тот случай, когда это происходит: тогда, когда в теле страницы не найдены более релевантные запросу фрагменты текста. В этом случае предполагается, что вебмастер всё-таки чем-то подумал, а потому с ответственностью сформулировал дискрепшен, ввиду чего из дискрепшена можно позаимствовать некоторые кусочки для сниппета, или вообще сделать их эквивалентными.

В этом месте каждый, конечно же, представил, чего ушлые мастера в эти тег с метатегом станут писать. Гугл тоже в курсе местных традиций, поэтому организовал целую череду тщательно спланированных засад:

  • Тег тайтла и метатег дискрипшена обязаны быть релевантны самому документу.
    Будете в них писать чего попало не по теме документа- сам документ оштрафуют.

  • Формулируйте мысль там и там максимально коротко.

  • При этом для каждого документа мысль должна быть сформулирована уникальным образом, особенно для тега тайтла. Уж постарайтесь, ибо повтор тайтлов у большого числа документов сайта обернётся ёжиком под попою.

  • Гугл предупреждает о недопустимости ключевиков, нерелевантных контенту, в обоих рассматриваемых тегах, а также большой тошнотности ключевых слов. Тут Вам не Яндекс, баловаться таким образом не нужно.

Ну и два специальных правила для метатега дискрипшена:

  • Не является хорошей идеей перечислять тут ключевики хоть через запятую, хоть малосвязанным текстом. Переведите с инглиша, как по-русски будет «description», и помедитируйте над смыслом этого слова.

  • Так же не стоит вдаваться в другую крайность, и просто копировать в метатег какой-то удачный фрагмент документа, якобы целиком отражающий его смысл и суть.

    Гугл и без Вас распрекрасно увидит этот фрагмент.

Не хватает мозгов сделать нормальный тег описания- лучше вообще обойдитесь без него. Большинство движковых сайтов именно так и поступают- не генерируют автоматом метатег дискрипшена, а вообще его не создают.

О ЧПУ:

Много мифов ходит про ключевики в урлах. Естественно, речь про те из них, что на языке запроса (изыскатель в строку поиска вводит именно их), а не какие-нибудь русские слова, транслитерированные и засунутые в адрес. Вполне возможно, что ключевики в транслитерации тоже кто-нибудь когда-нибудь ищет, но это не широко распространённый обычай.

Понятно, что изощрённые вебмастера умеют кодировать ключевики так, что получившееся одновременно и разрешено в составе URL-а, и предстаёт потом в сниппете на русском языке в адресе страницы, ибо сниппет-то в UTF, и такое с ним проделать можно. Но вот в чём вопрос: а оно помогает продвижению?

Гугл своим мануалом оговаривает, что он много чего повидал в этой жизни, и поймёт абсолютно любую систему адресации к документам сайта. Можно извращаться в этом как угодно. Но нигде нет ни намёка на то, что ключевики в урлах хоть в малейшей степени помогают лезть сайту в топ серпа.

Отъявленно начинающие вебмастера тут начнут ругаться, ссылаясь на выделение ключевиков в сниппете поисковика. Однако Гугл ещё раз и особо терпеливо подчёркивает, что все выделения жирнилкой сделаны строго для удобства изыскателя, дабы тот сразу узрел то, чего искал.

И, ежели он искал сиськи, то, наверное, сайт сиськи.ком про то, что ему требуется для счастья. Человек это сразу увидит и поймёт. И именно для этого сиськи в домене (и других частях сниппета) и выделяются стронгом, а не потому, что так высока их значимость именно тут, и только поэтому сам сайт в серпе.

Это вовсе не означает, что данный сайт при прочих равных условиях обойдёт в серпе тот, у которого нету сисек в домене. А есть они, скажем, в имени директории.

Да, конечно, логика нам подсказывает, что целый домен про сиськи- это всё-таки круче, чем один раздел сайта. Впечатлите этой логикой Гугла, и вот когда он плюнет на релевантность и траст, а начнёт истово молиться только на ключевики в урлах, тогда и будете спамиться в адресе документов.

А пока за обилие кейвордов в урлах полагается штраф. И это постулировано.

Плюс упомянуто, что эти кейворды всё-таки еще и должны быть релевантны контенту. Насколько кусочек урла «stranica» родной поисковому запросу «страница», я не знаю. То, что вот такая ахинея:

25D1%2581%25D1%2582%25D1%2580%25D0%25B0%25D0%25BD%25D0%25B8%25D1%2586%25D0%25B0

родная, это совершенно точно. Но значит ли это, что теперь все адреса документов стоит строить именно так?

Нет, наверное.

Потому что Гугл говорит открытым текстом: «мне совершенно всё равно, как именно вы делаете адресацию. Старайтесь, чтобы пользователю она была понятна и удобна. А я за это никаких плюшек не выдаю».

Рассматривая вопросы ЧПУ, мануал по SEO-оптимизации от Гугла также намекает, что продуманная система построения сайта (структура директорий, наблюдаемая в адресе) и имена документов могут послужить добрую службу при простановке ссылок. Ибо очень часто никто не утруждает себя выдумыванием якоря ссылки, и анкором становится сам УРЛ. И чем он страшнее, тем меньше шансов визита по нему интересующихся.

Правда, местный автор с этим не очень согласен. Наоборот, чем ужаснее URL, тем с большей вероятностью у ссылающегося возникнет желание написать что-то осмысленное якорем ссылки, и эти слова скажут о прилинкованном документе на порядок больше, чем самый продуманный URL.

В целом же по данному разделу можно сформулировать список табу:

  • Выгоните из урлов необязательные параметры и идентификаторы сессий.

    Попутешествовав по поиску Гугла достаточно долго, Вы увидите в адресной строке браузера массу накопившихся там параметров- с какой страницы Вы перешли на данную, какие у Вас браузер и дефолтовый язык, и тьму прочей ахинеи.

    Так вот на Вашем сайте ничего такого быть не должно.

  • Будет лучше, если имя документа (в урле) как-то характеризует этот документ.
    Гугл табуировал вещи типа page1.html и тому подобную глупость.
    Вместе с тем он табуировал и излишнюю тошнотность ключевиков.
    Вот таких: key1-key2-key3-superkey.htm
    Грозится наказать.

  • Гугл однозначно высказался против глубокой вложенности директорий в урлах документов, а также насыщенность их ключевиками. Знаете, есть такие любители строить ЧПУ, из недр которых выползают URL вида …/key1/key2/key3/superkey.htm

    Вместе с тем запрещается давать директориям имена, никак не связанные с содержащимся в них контентом.

    Как одно совместить с другим, я не знаю.
    Видимо, не фигачить десять директорий вглубь.

  • Да, ещё настоятельно не рекомендуется забивать урлы капслоком.
    То, что карается банном на форумах, не вызывает радости и здесь.

  • И совершенно недозволительна ситуация, когда документы домена или субдомена доступны в составе сайта, в папке которого физически это всё и лежит на сервере.

    Ибо возникает такое вопиющее дублирование контента, что оба сайта выпадут с серпа на счёт раз.

    К примеру, если у Мастера Ласто сайт "Наны" лежит внутри "Сайта Провинциального Самурая", то обратиться к первому можно было бы так:

    lasto.com/nanocms.name/

    Если движки правильные, то должно произойти что угодно, приключиться любой редирект, или быть послан хедер любой ошибки, но только не случиться открытие морды Наны.

    Если же у Вас получается открыть документ одного домена в урле другого, то Вы нарушаете одно из табу Гугла. Какой-нибудь засранец обязательно сделает страничку на «Народе» с несколькими ссылками, после чего и приключится необратимая шйтан-байда.

Вы уже поняли, как велико влияние ЧПУ на индекс всеобщего счастья. Не творите с ЧПУ что попало, поначитавшись всякой дряни, но только не мануала Гугла. Не доверяйте управлять политикой ЧПУ своего сайта школоте. Блюдите табу Гугла. И да пребудет с нами ништяк.

Карта сайта:

Местный автор с большим пессимизмом смотрит на необходимость построения .xml карты сайта, целесообразной только тогда, когда отдельные фрагменты сайта вообще никак между собой не связаны, и не могут быть обнаружены при переходе по ссылкам.

Если Ваши руки и попу не совместили территориально ещё в далёком детстве, то как же может получиться такой сайт?

Другой случай уместности .xml карты сайта ограничен вариантом действительно большого ресурса, с сотнями тысяч страниц. Как только Вы решите проблему перехода бота с одной карты сайта на другую (ибо одной тут не обойтись), так сразу создадутся условия для скорейшей индексации всех документов этого монстра. Хотя сама по себе карта ничего не гарантирует.

Во всех остальных случаях (непрерывная навигация между всеми документами сайта, число страниц, не исчисляемых сотнями тысяч) ничего эта карта не даст. Будет у поисковой системы желание проиндексировать данный сайт- проиндексирует. А заставить насильно Вы её не сможете.

Именно поэтому Гугл своим мануалом постулирует, что карта сайта, оказывается, в первую очередь должна служить интересу посетителя, и быть представлена в html формате, примерно как-то так: все документы хрена.ру А версия для бота, в традиционном .xml формате, опциональна. И служит лишь для оповещения бота о появлении новых страниц (для индексации ему вполне достаточно как карты сайта для посетителя, так и обычной структуры сайта, с её взаимными ссылками документов друг на друга).

Ну и поскольку вебмастера по-прежнему думают про карту сайта всякую глупость, и шибко надеются на её магию, Гугл в своём текущем мануале маленько упорядочивает их мысли про структуру сайта в целом, в виде очередной порции табу:

  • Не нужно стараться все документы сайта связать с другими сквозными ссылками. Структурируйте разделы по смыслу.

    Так, если на Вашем сайте есть директория с шопом, а рядышком директория с блогом, то самой дурной идеей будет дать им общее оформление, и намертво прилинковать посредством сайдбара документы шопа к документам блога.

    Гораздо правильнее будет сослаться на шоп и на блог с морды сайта, ну и может быть, через дизайн магазина и блога на морды друг друга.

    А вот творить две боковых панели, через левую из которых с любого места сайта доступны все лоты шопа, а через правую- посты блога, Гугл считает плохой идеей.

    Он вообще на такую излишнюю перелинковку плохо смотрит.

  • Другая крайность, когда переход от одной смысловой части к другой занимает слишком уж много шагов, объявлена ещё большей глупостью.

    Это неудобно посетителю, а потому огребётся порицанием.

  • Любителям флаша, DHTML, джавы и прочего Аякса предлагается вспомнить: сначала Бог создал текстовую ссылку. И увидел, что это хорошо. И сказал: да будет так…

В целом Гугл не обязывает вебмастера непременно сотворять .xml карту сайта. Если вебмастер внимательно читал табуированные положения по структуре сайта, правильно их понял, и не нагородил такое переплетение связей, что бот пошёл на сайт, да и заблудился там, то и страдать не о чем.

В любом другом случае извращенцу положено предъявить боту карту сайта.

Определитесь со своей ориентацией.

Требования к контенту:

Очень странно, что речь вообще об этом зашла. Ибо прочесть-то мы прочтём, да только кто же когда будет соблюдать?

Но, тем не менее, очередная порция ай-яй-яй:

  • Не надо писать про всякую хрень и безграмотно.

  • Не пишите текст на картинках, которые затем размещаются на сайте.
    Пишите на сайте текст сразу текстом.

    Я тоже никогда не понимал людей, присылающих сто слов письма в Ворде по емайлу. Тем паче, что у меня и Ворда-то нет- я это как читать буду?

    Может, проще действительно писать письмо всё-таки сразу как письмо?

  • Форматируйте текст.
    Нет деления на заголовки и абзацы- люди не станут это читать.
    Бот вскорости тоже перестанет.

  • Копипаст и дублирование контента (пусть даже частичное и неявное) не то чтобы как-то карается, но вполне внятно табуируется.

  • Весь спектр методов насыщения текста ключевыми словами, с любыми изобретениями по приданию безобразию оттенка уместности этого безобразия («нашу страницу находят по запросам…», «Вам будет любопытно знать, какие опечатки люди допускают, когда ищут это…») повлечёт наказание.

  • Прочие методы поискового спама, сто лет как известные, в очередной раз объявлены по-прежнему не забытыми, и всё так же наказуемыми. К чему добавлено известие о чтении Гуглом .css файла и анализа его на предмет того, что у Вас на странице какого цвета и какого размера.

    Так что не задавайтесь проблематикой поиска самого умного- Гугл в анализе любимого цвета и любимого размера весьма искушён.

Ну и поскольку оформлять контент как-то нужно, в этом месте мануала есть абсолютно ожидаемые пожелания по применению тегов заголовков, которых по штату положено шесть размеров.

  • Они применяются в порядке очередности, начиная с первого, сообразно структуре документа. Правда, местный автор очень сомневается, что за рамками очень специфических документов, носящих, как правило, силу инструкции, мы действительно способны воспользоваться всей магией иерархии заголовков.

  • А поскольку это далеко не так, то у юзера может возникнуть мысль употребления заголовков там, где ему требуется разный размер букв.

    Так вот Гугл особо предупреждает: это структурирующий элемент, и он применяется только в определённых случаях и по определённым правилам. Все пионэры, этого не понимающие, будут слиты с серпа.

  • То же касается случаев, когда достаточно сил тегов B, EM, STRONG, но чего-то ради использованы заголовки.

  • Переизбыток заголовков в документе, либо включение в них непомерно и несуразно больших фрагментов текста, опять-таки не приведёт ни к чему хорошему.

Наши любимые упражнения со ссылками:

О, как мы любим спорить друг с другом об уместности нофаллова и особенностях формирования ссылочной массы…

Однако далее только факты, как это понимает Гугл:

  • Если Вы не сами размещаете на своём сайте ссылку, и не можете поручиться за её качество, повелите движку в этом месте добавить к ссылке атрибут rel="nofollow".

  • Если весь раздел сайта автонаполняется пользовательским контентом, либо закрывайте все ссылки пользователей атрибутом нофаллова, либо вообще на данной странице примените метатег аналогичного назначения, действующий на всю страницу целиком:



  • Помните, что и в любом другом случае, кроме оговоренных, как только возникает опасность сослаться на некачественный сайт, пользуйте волшебный атрибут нопасарана. Потому что ссылка на некачественный сайт может повредить Вашему. И сильно.

    Как говорит местный автор, нефиг ссылаться на всяких придурков.
    Ибо чревато.

Гугл однозначно даёт понять, что атрибут нопасарана служит для указания поисковому боту, куда не надо передавать вес, и какие сайты не стоит рассматривать как полноценные.

Никаких слов про то, что бот не видит эту ссылку, не учитывает её, или не ходит по ней, в документации нет.

Воспринимайте атрибут нофаллова в качестве маркера «там, за ссылкой, фигня какая-то». И используйте его именно в этом качестве.

При этом Мастер Ласто уверен, что существует некая критическая масса сайтов, по достижении которой некоторого значения (или, как вариант, совокупного ПиАра её ссылающихся страниц) тот сайт, на который вся эта масса ссылается ссылками в нофаллове, запросто может рухнуть в поиске.

Этакий траст наоборот.

Не любите такую мысль? Ваше право.

О пейджранке:

Практически о нём ничего не говорится, что заставляет предполагать очень слабую нуждаемость механизма поиска в подобном параметре.

Об отмене пейджранка речи нет, и, возможно, какие-то формальные размеры пиписек по-прежнему будут периодически рассчитываться, однако это вещь манипулятивная и оттого никому не интересная. В первую очередь самому Гуглу.

Используется практически только для того, чтобы предупредить вебмастера о его занятии какой-то хренью. Обычно в такой момент ПейджРанк его сайта ведёт себя так же, как флаг поверженного сёгуна- падает на землю. Иногда бесповоротно, а иногда (если вебмастер всё-таки одумался за приемлемо короткий срок) восстанавливает свои значения после похорон хрени за забором.

В подавляющем большинстве случаев к занятию хренью приравнивается торговля ссылками.

В общем и целом, концепцию пейджранка давно пора заменить концепцией траста. Только никакой цифровой пиписькомерки трастовости у нас, к сожалению, нет.

Заключение.

Несмотря на объёмность документа «Google Search Engine Optimization Starter Guide 2010» и многие буквы, никаких особых откровений он не содержит. Книжка, прочитанная папой ребёнку пятилетнего возраста про «что такое хорошо и что такое плохо», несёт примерно ту же воспитательную и познавательную ценность.

Но.

Если рядовому вебмастеру Раши, так и мечтающему что-то где-то накрутить хрен знает зачем и для чего, читать всё это гидство абсолютно бесполезно, ибо так и будет хренью заниматься разнообразной до самой пенсии, то вдумчивый вебмастер теперь сможет заниматься той же самой хренью правильно.

Точно зная, за что именно и каким образом он будет наказан.

Знать, где притаилась задница- это уже пол-дела.

Комментарии к этой заметке больше не принимаются.
Все заметки категории «Search Engine Optimization»