Как Bing давит спам

Руководитель по созданию программ в Bing Index Quality Игорь Рондел на днях рассказал о том, как поисковик Bing выявляет и фильтрует спам.

Итак, первым делом следует определиться с тем, что поисковая система определяет как веб-спам

Bing без задней мысли выпиливает страницу, если уверен в том, что ее владелец пользуется методами «черного» SEO, дабы перехитрить систему и получить высокий рейтинг. Однако следует учитывать тот факт, что зачастую легитимные техники оптимизации граничат с незаконными, и не всегда бывает понятно было ли «черное» SEO использовано намеренно или это просто оплошность веб-мастера. Кроме всего прочего, даже заспамленные страницы могут быть полезны пользователю, так что, как видите, в деле выявления спама много нюансов, которые следует учитывать, дабы не обидеть честного продвиженца.

А теперь непосредственно о том, как же все-таки Bing выявляет вредоносные ресурсы

Первоочередной целью любого спаммера является заработок денег за счет привлечения максимального числа пользователей, ведь чем больше людей посетит его ресурс и увидит рекламу, размещенную там, тем больше он заработает.

  • Качество контента – спаммеры создают такой контент, который нацелен в первую очередь на поисковые алгоритмы, в то время как честные оптимизаторы работают на аудиторию. Таким образом, сайты, забитые спамом, не имеют практически никакой ценности для пользователя, и Bing использует этот факт для вычисления некачественных ресурсов. Существует великое множество условных сигналов, говорящих о низком уровне контента, начиная с подсчета числа слов на странице и заканчивая уникальностью и полезностью информации.
  • Наличие рекламных объявлений – ни для кого не секрет, что реклама приносит неплохую прибыль владельцу сайта и сегодня практически на каждой странице в сети можно встретить одно-два объявления, что не является показателем плохого сайта. Хуже, когда страница забита рекламой сверху донизу, причем объявления отличаются крайней навязчивостью. Собственно говоря, данный факт поисковик и  использует для определения спам-страниц.
  • Информация о позиции и расположении контента на страницах играет огромную роль в определении некачественных сайтов. Визуальное выделение рекламы и отведение ей главной роли говорит о многом.

Для того чтобы максимизировать выплаты, спаммер должен увеличить трафик на страницы, используя «черное» SEO. Как правило, добиться такого результата можно либо увеличением присутствия своих страниц в сети, либо повышением их рейтинга в поисковиках.

В первом случае имеется ряд маркеров, показывающих, что страница создана исключительно как спам-площадка:

  • Копирование чужого контента.
  • Использование специальных программ, автоматически генерирующих контент.
  • Использование внешних API с целью популяризации страниц с неуникальной информацией.

К счастью, технология Bing Index Quality может выявить такие страницы и использовать алгоритмы кластеризации, при помощи которых можно найти большие кластеры сайтов массового производства.

Если рассматривать стремление занять высокие позиции в выдачах поисковых систем, следует отметить наличие десятков способов «черного» SEO, которые помогают добиться данного результата – тут и наполнение страницы ключами, и манипуляция ссылками и многое другое.

В любом случае, для выявления спам-страниц, стремящихся выйти в топ, Bing использует алгоритмы, направленные на поиск именно техник «черного» SEO.  Так, к примеру, система может идентифицировать подозрительные выбросы (пусть это будет страница с большим числом ключей), проанализировать урл-ы и анкоры, исследовать веб-графику и рассмотреть еще множество других вариантов манипуляций со ссылочной массой. 

Конечно же, спаммеры тоже не спят и стараются скрыть использование «черного» SEO от поисковиков. Так, наиболее частыми техниками, используемыми для этого являются клоакинг, редиректы и работа с динамическим контентом.

Как Bing поступает со спамом?
 

Само собой разумеется, что первоочередной целью Bing Index Quality является обеспечение наиболее «чистых» и качественных результатов поисковой выдачи и для ее достижения необходимо минимизировать присутствие спам-страниц в SERP. Основным механизмом реализации этой задачи является понижение некачественной страницы в выдаче или же удаление сайта из индекса. То, как будет наказан ресурс, зависит от техники спама, используемой на его страницах и потенциальной ценности страницы для пользователей.

Также следует отметить, что в августе этого года сотрудниками поисковой системы был разработан список вредоносных веб-сайтов, и если в выдаче будет присутствовать такой ресурс, пользователя оповестят об этом.

Итак, подытожим -  в контексте проблемы борьбы со спамом, у Bing имеется несколько главных целей:

Предоставить пользователю наиболее качественные запросы поиска, релевантные запросу. 

  • Способствовать снижению количества вредоносного и спам-контента – такие страницы незаслуженно занимают высокие позиции, которые можно было бы отдать хорошим сайтам.
  • Улучшить экосистему интернета путем объединения сил всех поисковых систем в борьбе со спамом – если все поисковики создадут надежный фильтр спама, это позволит исключить некачественные сайты из результатов поиска, обрезать им трафик и вынудить выйти из бизнеса. В итоге весь интернет станет намного чище, и пользователь сможет пользоваться им без опаски.
  • Оптимизация ресурсов Bing – удаление спама даст больше места для качественных страниц.
31.08.2014