В чем разница между способами съемов позиций XML/HTML?
Текст ниже был взят со страницы https://help.seowork.ru/ru/articles/6510591-%D0%BF%D0%BE%D0%B7%D0%B8%D1%86%D0%B8%D0%B8-%D0%B2-%D1%8F%D0%BD%D0%B4%D0%B5%D0%BA%D1%81-xml-%D0%B8%D0%BB%D0%B8-%D0%BF%D0%B0%D1%80%D1%81%D0%B8%D0%BD%D0%B3-%D0%BF%D0%BE%D0%B8%D1%81%D0%BA%D0%BE%D0%B2%D0%BE%D0%B9-%D0%B2%D1%8B%D0%B4%D0%B0%D1%87%D0%B8, так как SEOWORK описал максимально подробно.
Собирать данные по позициям в Яндексе можно несколькими способами, основные ― XML и парсинг живой выдачи (HTML). Давайте разберемся, в чем разница, какие плюсы и минусы есть у каждого варианта.
Яндекс XML. Официальная позиция Яндекса: XML — возможность собирать данные о поисковых запросах к Яндексу и публиковать эту информацию в открытом доступе. Данные выдаются в едином формате, и зачастую они не совпадают с реальной выдачей на 100% (в официальных документах Яндекс не гарантирует точного соответствия результатов поиска, полученных с помощью сервиса Яндекс.XML, результатам, полученными с помощью поисковой системы Яндекса)
Парсинг выдачи (HTML) производится непосредственно по результатам выдачи по конкретному запросу. Этот способ технически сложнее, дольше и дороже. Тем не менее, данных полученных таким методом значительно больше, и они ценнее для аналитики ― это 100% повторение поведения пользователя с учетом множества факторов, которые не отдаются в XML.
Но вместе с тем, для этого метода требуется колоссальная техническая база: чтобы получать данные по большому объему семантики, требуется много парсеров. Они задействуют очень большой объем нагрузки на систему и нуждаются в постоянном мониторинге техническими специалистами. Иными словами, это все очень не просто!
Плюсы/Минусы в способах съема позиций
Основные и бесспорные плюсы XML ― простота, скорость и дешевизна получения данных.
Минусы серьезные:
- Достоверность информации. В XML, которую отдает Яндекс, есть расхождения с реальной выдачей. С точки зрения аналитики данных, это критично. Особенно это заметно сейчас: в ecommerce каждый день с рынка уходят бренды или компании, и поисковая выдача меняется каждую неделю.
- Скудность информации. По данным из XML нет возможности видеть полную картину в поисковой выдаче. А сейчас, как никогда, на CTR влияют и количество блоков рекламы, и наличие нулевой позиции, и наличие колдунщиков ― то есть, даже находясь на 1 позиции, можно получать довольно мало переходов.
Парсинг реальной выдачи позволяет оценить полную картину, а именно:
- получать максимальное свежие и “чистые” данные, на 100% совпадающие с реальной поисковой выдачей
- оперативно отслеживать динамику по каждому запросу в необходимой для бизнеса глубине
- использовать дополнительные данные: есть ли реклама в выдаче, сниппеты, title, нулевая позиция, используются ли какие-то еще сервисы Яндекса на странице результатов
- анализировать конкурентов в режиме realtime (практически)
Главные минусы парсинга ― высокая стоимость, потребность в больших мощностях для объемных сайтов и сложность их получения.
Отзывы пользователей (все отзывы)
Дмитрий Шахов
Основатель агентства REMARKAArsenkin Tools - простой, понятный и недорогой инструмент, который я много лет рекомендую всем оптимизаторам.
Андрей Буйлов
Руководитель в МуравейникХороший набор простых, но очень удобных инструментов. И постоянно появляются более продвинутые опции для анализа и парсинга. Успеха и развития сервису! Рекомендую! Обзор инструмента по проверке коммерциализации запроса.
Миндубаев Рамазан
Head of SEO, TRINET.GroupВ инструментах ARSENKIN TOOLS собраны решения рядовых SEO задач, которые использую в ежедневной работе как я, так и мои специалисты в TRINET.Group. Ключевое отличие ARSENKIN TOOLS - удобство, быстрота работы и стабильность. Ряд уникальных авторских решений, не имеющие прямых аналогов в других сервисах заслуживает отдельного уважения.