В ноябре 2016 года анонсировано нововведение в самом популярном поисковике Рунета. Яндекс запустил новый алгоритм, получивший название «Палех» и базирующийся на нейронных сетях.
Пользователями в день задается огромное количество как одинаковых, так и уникальных, редких запросов. Сотрудники Яндекса сравнивают весь пул поисковых фраз с птицей: самые популярные — клюв, среднечастотные — туловище, редкие — хвост. Последние могут быть заданы всего лишь один раз за всю историю, однако в совокупности их много — около 40%. При поиске по таким запросам были обнаружены сложности, которые новый алгоритм «Палех» должен исключить. Метод машинного обучения «Матрикснет» для построения формулы ранжирования использует данные о поведении людей, преобразованные в факторы. Этот подход хорошо работает для популярных запросов, где таких данных много. При оценке же уникальных фраз подобных факторов у «Матрикснета» нет, что влияет на качество поиска. Более того, в запросах «хвоста» не всегда точным образом заданы ключевые слова. К примеру, во фразе «фильм где день повторялся снова и снова» никак не фигурирует слово «сурок».
На помощь Яндексу при ранжировании таких запросов и пришел поисковый алгоритм «Палех». Его название символизирует длинный хвост жар-птицы, зачастую изображаемой на миниатюрах этого поселка в Ивановской области.
Математической моделью нового алгоритма «Палех» в Яндексе послужили нейронные сети. Преимуществом такого подхода является возможность обучения, в процессе которого машиной могут быть обнаружены сложные взаимосвязи между данными. В случае с поисковым алгоритмом «Палех» запросы были представлены как множество чисел со своими координатами. Это позволяет расположить все фразы в одном пространстве и определить близость между ними. При создании поискового алгоритма также была использована информация о поведении пользователей Яндекса в качестве положительных и отрицательных примеров для нейронной сети. Благодаря новому методу поиска «Палех» теперь может определять, насколько по смыслу близки друг другу непохожие по семантике запросы.
Уже сейчас действие поискового алгоритма «Палех» в Яндексе может распространяться на все группы запросов, но на фразы «хвоста» оказывается более сильное влияние. Тем не менее, это всего лишь один из тысячи факторов ранжирования, который может быть использован «Матрикснетом» в случае необходимости.
Нейронные сети хорошо обучаемы и имеют большой потенциал для улучшения ранжирования в Яндексе. Сейчас поиск ведется только по заголовкам, которые, как правило, не содержат всей информации о документе. Поиск с использованием нового алгоритма «Палех» по всему контенту открывает Яндексу новые возможности для оценки релевантности текстов. По словам разработчиков, их цель — создание моделей, «понимающих» семантическое соответствие запросов и текстов на уровне мышления человека.
Пока это планы на будущее, но уже сейчас поисковик все большее внимание уделяет смыслу текстов. Для получения топовых позиций недостаточно «насытить» страницу ключевиками, она должна максимально подробно отвечать на запрос пользователя. Благодаря поисковому алгоритму «Палех» это позволит увеличить трафик по низкочастотным запросам в Яндексе, а значит, привлечь потенциальных клиентов.
Мы точно знаем, как привести на Ваш сайт клиентов!
Оставьте заявку и получите индивидуальное предложение с привлекательной ценой.