На конференции “WWW 2009” Яндекс рассказал о новом методе определения платных ссылок. Настоящее название которого - «Использование методов категоризации текстовых привязок и анализа графов для идентификации платных ссылок».
В докладе говорится, что основным методом оптимизации сайтов для поисковых машин, принятым в Рунете, является использование платных ссылок. «Платные ссылки действительно влияют на рейтинги в индексах поисковиков, но не считаются спамом, поскольку встречаются в основном на вполне приличных страницах наряду с другими полезными ссылками и часто указывают на ценные коммерческие сайты. Создание платных ссылок вручную — сложная и кропотливая работа, поэтому неудивительно, что в них действительно содержатся актуальные сведения о целевом сайте», - поясняет команда Яндекса. Тем не менее, поисковым системам важно уметь выявлять платные ссылки, т.к. это значительно повышает эффективность рейтингов поисковиков.
Процесс выявления Яндексом происходит в два этапа.
Анализ текста и классификация тематик; Формирование стартового множества страниц различной тематики и построение граф ссылок с использованием модифицированного алгоритма HITS, где «посредники» - это сайты, продающие ссылки, а «лидеры» - сайты, покупающие ссылки).
Основная задача алгоритма — выявление непосредственно платных ссылок, а не сайтов, их продающих и покупающих.
Проверка алгоритма на сформированных вручную тестовых выборках доказала его высокую точность (95%) и эффективность (93-96%).
23.05.2009 @ 14:15—
Метки:
Комментарии отсутствуют