Добавить новость





160*600

Новости сегодня на DirectAdvert

Новости сегодня от Adwile

Актуальные новости сегодня от ValueImpression.com


Опубликовать свою новость бесплатно - сейчас


Группировщик ключевых слов для SEO/PPC

Если вы работаете в SEO/PPC, то ежедневно имеете дело с тысячами строк данных. Речь идет не только об аналитике и управлении рекламными кампаниями, в работе часто возникает необходимость в группировке ключевых слов.

Группировка ключевых слов

Чтобы создать рекламную кампанию или сгруппировать запросы по посадочным страницам, подготовить коммерческое предложение или прикинуть бюджет – нужно перебрать 1000-5000 ключевых слов.

Например, у нас есть список из таких ключевых слов:

  • отдых в турции
  • отдых в болгарии
  • отдых в греции
  • отдых в египте
  • отдых в черногории
  • отдых на кипре
  • туры в болгарию
  • туры в испанию
  • туры в таиланд
  • отдых на мальдивах
  • отдых в хорватии
  • виза в китай
  • отдых в оаэ
  • отдых на кубе
  • отдых в италии
  • туры на кубу
  • туры в хорватию

и еще несколько сотен/тысяч строк …

Нужно распределить ключевые слова по группам:

Сгруппировав слова – можно создать группы рекламных объявлений, подобрать общие посадочные страницы и многое другое. Не говоря о том, что такие слова как «туры болгария» и «болгария туры» попадут в одну группу – то есть, проще заметить такие «дубли».

Если у нас всего лишь 20-30 ключевых – их можно сгруппировать вручную. Сотня-две – с помощью Excel. Однако, ежедневно работая с тысячами ключевых слов - проще и удобнее использовать собственные инструменты автоматизации. Так я и поступил - подготовил ТЗ, обсудил детали с php-программистом, и через несколько дней скрипт был готов.

Как работает скрипт

У нас есть некий набор ключевых слов:

  • египет в мае
  • отели в турции кемер
  • туроператор турция
  • карта отелей египта
  • туроператор черногория
  • лучшие отели кемера
  • цены в турции
  • отели кемера 5
  • турправда египет
  • отель праги
  • самые лучшие отели турции
  • турция кемер отели
  • туризм в турции
  • отели египта 5 звезд
  • отели кипр
  • отели турции кемер 5
  • экскурсии египет
  • горячие путевки в египет
  • египет шарм эль шейх отели
  • египет путевки
  • события в египте
  • отель прага
  • египет хургада отели
  • отели в хургаде
  • шарм эль шейх египет
  • поездка в турцию
  • туроператор болгария
  • онлайн бронирование отелей
  • турция отели цены
  • отели алании
  • стоимость путевок в египет
  • фото отелей египта
  • отели египта хургада
  • лучшие отели турция
  • путевки египет
  • туроператор по болгарии
  • … и т.п.

Перед составлением индекса, скрипт нормализует все словоформы. Для этого применяется простой и эффективный инструмент - MyStem Яндекса.

Сразу скажу, что нормализация очень сильно выручает, так как избавляет нас от лишних групп состоящих из разных словоформ.

На следующем этапе скрипт группировки определяет частоты для всего индекса документа и выстраивает рейтинг. Частоты считаются для каждого слова (после нормализации). Если у нас есть «отдых в тунисе» то скрипт считает частоты для «отдых» и «тунис».

*Кстати, в настройках скрипта можно задавать минимальные значения частот для групп и подгрупп. Т.е. можно регулировать количество ключевых слов в группах и подгруппах. Если слово встречается редко (в документе), то оно не сможет создать «свою» группу или подгруппу.

На данном этапе – рейтинг слов выстраивается от наиболее частотных к менее частотным. Зачем это нужно? Чтобы создать основные группы. Скажем так, если слово «египет» встречается чаще чем слово «отель» то поисковый запрос (например, [недорогие отели египта]) включающий слово «отель» будет отнесен к группе «египет» а не наоборот.

Рейтинг слов образует названия групп. Ключевые слова «привязываются» к соответствующим группам:

В списке может быть обнаружено и слово с ошибкой. Сейчас поисковый запрос с ошибкой отнесен к группе «египет», но уже на следующем этапе – попадет с отдельную подгруппу, так что обнаружить такие запросы можно будет легко и просто (если одни и те же ошибки не встречаются слишком часто).

Итак, мы сгруппировали слова, но довольно примитивно. Далее – нам нужна более точная группировка.

*Кстати, все эти этапы существуют лишь на уровне работы скрипта. Пользователь просто добавляет ключевые слова и получает на выходе уже сгруппированный список.
Между прочим, если на входе подавать tsv содержащий не только ключевые слова, но и разные данные (например – частоты, оценочные ставки), на выходе мы получим сгруппированный список с тем же набором параметров.

Более точная группировка означает, что внутри каждой группы скрипт создаст подгруппы и распределит слова между ними.

На данном этапе точно также будет выстраиваться рейтинг слов по частоте. При этом рейтинг будет создаваться только внутри группы, основное слово группы (оно же – название группы) не будет принимать участие в рейтинге. Кроме того, рейтинг слов в группе выстраивается по обратной частотности. Т.е. слово с наименьшей частотностью – первым создаст «свою» подгруппу.

Конечно, создать свои подгруппы могут только те слова, которые встречаются не менее N-раз (задается в настройках скрипта, но обычно это не менее 4-5).

Именно такой подход работает очень эффективно, когда основные группы создаются на основе рейтинга от наиболее частотных слов к наименее частотным, а подгруппы – от наименее частотных к наиболее частотным.

На выходе получаем сгруппированный список:

К слову сказать, такие необычные названия подгрупп вроде «анталий» и подобное – результат работы MyStem. Стеммер не всегда корректно выбирает начальную словоформу.

Слова с неправильным написанием (если такие слова редко встречаются) и те слова, что встречаются в документе 1-2 раза – попадают в подгруппу «Прочее».

Эти слова тоже пригодны для работы, но с ними нужно будет разбираться отдельно. Некоторые можно перенести в подходящие подгруппы, от других – отказаться.

Вот и все. Скрипт использует довольно примитивный алгоритм, основная хитрость которого (не считая нормализации) состоит в выстраивании рейтинга для групп – от наиболее частотных слов к наименее частотным, а внутри подгрупп – наоборот.

Скрипт позволяет очень быстро справляться с солидными объемами данных. 5000-20000 ключевых слов группируются за несколько секунд, еще не более 5-10 минут уходит на то чтобы разобрать ключевые слова, попавшие в группу «Прочее».

Что дает использование скрипта? Дело ведь не просто в скорости обработки данных. Практическая выгода складывается из нескольких пунктов:

• Появляется возможность уже на этапе рассмотрения заявки или подготовки коммерческого предложения использовать полноценные выборки ключевых слов, а не «обзорные» списки из 50-100 строк.

• На подготовку базовых таблиц (бюджеты, группы поисковых запросов/посадочных страниц) затраты времени сократились с 2-6 часов до 1-1,5 часа. И это при значительном (в 5-10 раз) увеличении объема обрабатываемых данных.

• Автоматизация труда позитивно сказывается на отношении к работе.

• Уже на на этапе подготовки (рассмотрении заявки от клиента/подготовки коммерческого предложения) можно показать серьезный объем работ, без существенного увеличения затрат времени.

Автор: Андрей Шувалов, shuvaloff.com

Читайте на сайте

Другие проекты от 123ru.net








































Другие популярные новости дня сегодня


123ru.net — быстрее, чем Я..., самые свежие и актуальные новости Вашего города — каждый день, каждый час с ежеминутным обновлением! Мгновенная публикация на языке оригинала, без модерации и без купюр в разделе Пользователи сайта 123ru.net.

Как добавить свои новости в наши трансляции? Очень просто. Достаточно отправить заявку на наш электронный адрес mail@29ru.net с указанием адреса Вашей ленты новостей в формате RSS или подать заявку на включение Вашего сайта в наш каталог через форму. После модерации заявки в течении 24 часов Ваша лента новостей начнёт транслироваться в разделе Вашего города. Все новости в нашей ленте новостей отсортированы поминутно по времени публикации, которое указано напротив каждой новости справа также как и прямая ссылка на источник информации. Если у Вас есть интересные фото Вашего города или других населённых пунктов Вашего региона мы также готовы опубликовать их в разделе Вашего города в нашем каталоге региональных сайтов, который на сегодняшний день является самым большим региональным ресурсом, охватывающим все города не только России и Украины, но ещё и Белоруссии и Абхазии. Прислать фото можно здесь. Оперативно разместить свою новость в Вашем городе можно самостоятельно через форму.



Новости 24/7 Все города России




Загрузка...


Топ 10 новостей последнего часа






Персональные новости

123ru.net — ежедневник главных новостей Вашего города и Вашего региона. 123ru.net - новости в деталях, свежий, незамыленный образ событий дня, аналитика минувших событий, прогнозы на будущее и непредвзятый взгляд на настоящее, как всегда, оперативно, честно, без купюр и цензуры каждый час, семь дней в неделю, 24 часа в сутки. Ещё больше местных городских новостей Вашего города — на порталах News-Life.pro и News24.pro. Полная лента региональных новостей на этот час — здесь. Самые свежие и популярные публикации событий в России и в мире сегодня - в ТОП-100 и на сайте Russia24.pro. С 2017 года проект 123ru.net стал мультиязычным и расширил свою аудиторию в мировом пространстве. Теперь нас читает не только русскоязычная аудитория и жители бывшего СССР, но и весь современный мир. 123ru.net - мир новостей без границ и цензуры в режиме реального времени. Каждую минуту - 123 самые горячие новости из городов и регионов. С нами Вы никогда не пропустите главное. А самым главным во все века остаётся "время" - наше и Ваше (у каждого - оно своё). Время - бесценно! Берегите и цените время. Здесь и сейчас — знакомства на 123ru.net. . Разместить свою новость локально в любом городе (и даже, на любом языке мира) можно ежесекундно (совершенно бесплатно) с мгновенной публикацией (без цензуры и модерации) самостоятельно - здесь.



Загрузка...

Загрузка...

Экология в России и мире




Путин в России и мире

Лукашенко в Беларуси и мире



123ru.netмеждународная интерактивная информационная сеть (ежеминутные новости с ежедневным интелектуальным архивом). Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net.

Мы не навязываем Вам своё видение, мы даём Вам объективный срез событий дня без цензуры и без купюр. Новости, какие они есть — онлайн (с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии).

123ru.net — живые новости в прямом эфире!

В любую минуту Вы можете добавить свою новость мгновенно — здесь.






Здоровье в России и мире


Частные объявления в Вашем городе, в Вашем регионе и в России






Загрузка...

Загрузка...





Друзья 123ru.net


Информационные партнёры 123ru.net



Спонсоры 123ru.net