Архив метки: индексация

Уникальный контент

На примере нового (без входящих ссылок) блога наблюдаю следующую картину — уникальные записи (страницы) гуглом индексируются сразу, неуникальные — нет. Очередное наглядное подтверждение утверждения Контент — король :)

Другое наблюдение за гуглом — его сильные алгоритмы проверки уникальности. Точнее жестко настроенные, ведь шинглы и частотный анализ широкоизвестны, а вот умело применить их сможет не каждый гений силиконовой сиськи долины. Любопытно было бы узнать, как отсеиваются компиляции текстов и их частей при проверке на уникальность.

Отсечение копий это вообще интересная тема. Наблюдаю как копия текста на (трастовом?) сайте с (активной и не одной) ссылкой на оригинал показывается гуглом в выдаче, а настоящий оригинал — прячется в дополнительные результаты.

P.S. По запросу уникальный контент — 18 позиция в гугле. Просто так, за красивые глаза :)

SEO: Мутирующий серп и Уникальность рулит

Итак, начнем цикл статей SEO-подозрений, догадок и наблюдений.

«Мутирующий серп»

По самым странным запросам, Google иногда выдает этот блог в TOP-10-20 выдаче. Ключевое слово — иногда. При прочих равных (ссылки стоят как вкопанные), посетители переходят по самым странным, хотя и релевантным запросам, из чего делаем догадку: В выдаче Гугла есть фактор случайности и назовем этот фактор «мутирующий серп» :)

Аналогично тому, как происходят мутации в природе, давая возможность новым свойствам организмов пройти проверку на жизнеспособность, Гугл дает возможность не раскрученным сайтам получить внимание пользователей. Поднимая случайные, но релевантные сайты в выдаче до 10го-20го места Гугл дает возможность посетителям найти интересную информацию на не раскрученных сайтах. Если эта информация действительно интересна, высоковероятно что посетитель установит на нее ссылку и поднимет страницу/сайт в основной выдаче.

Хотя конечно-конечно это может быть просто глюк индекса или ссорящиеся дата-центры :)

«Уникальность рулит»

Фильтр уникальности (новизны) при индексации, который я назову «Уникальность рулит» уже описан как догадка у лаборанта из Сумасшедшей лаборатории. Поэтому с позволения копипастю:

Логично, что новые страницы с уникальным контентом более приоритетны к индексации чем новые страницы с контентом уже известным поисковым системам. И наверняка, если речь идет о миллионах новых страниц и очереди на их индексацию, то существуют факторы влияющие на положение новых страниц в этой очереди. Ведь вычислительные ресурсы не резиновые и приходится выбирать что индексировать в первую очередь.

Естественно новостной контент (уникальный) является самым приоритетным для индексации. Поэтому хорошо бы маскироваться под новостной контент даже не новостным сайтам. И здесь рулит RSS .

Кстати, часто замечаю, что дублирующийся контент отсекается прежде всего в пределах одного сайта. Даже на стадии вхождения новых страниц. Причем иногда отсекаются просто похожие страницы, даже со слегка разными заголовками и слегка разным контентом. Поэтому делайте ваш контент псевдо-уникальным.

Вот почему SEO это хорошо, но не стоит, перечисляя кейворды, делать посту абсолютно такой же заголовок как и у миллиона других страниц.

А тем временем земляк Bolverin наткнулся на то что вызывает (или по крайней мере должно вызывать) головную боль у большинства веб-дизайнеров на планете — кроссбраузерность. Разработчики IE, Файрфокс и Opera очевидно исторически не дружат со стандартами CSS и статья кроссбраузерный CSS описывает полезный хак позволяющий их помирить.

P.S. Кстати по относительные пиксели у меня уже что-то было.

Индексация в Яндексе

Морда блога быстро появилась в Яндексе. Быстрой индексацией в Яндексе я считаю появление сайта в выдаче через 5 дней (30-го) после добавления через форму (адурелку). А сохраненная копия в индексе датируется 27 числом. Тоесть робот зашел через два дня после моего запроса 25-го. Что очень не похоже на неповоротливого Яндекса.

Может виной тому добавление сайта через Яндекс.Вебмастер? Но:

Влияет ли добавление сайта в список моих сайтов на то, как быстро и качественно будет он проиндексирован?
Нет, не влияет.

Или просто совпадение?…

Впрочем не важно, в итоге это означает не более чем пара-тройка случайных посетителей по низкочастотке. Посмотрим когда на сайт зайдет полноценный робот, а не его быстрая версия.

Короче говоря — яндексация или яндыксация (с) в зависимости от контекста. В данном случае через «е».