Извлечение пользы из тысяч лишних данных


Интернет технологии имеют очень разнообразное применение, поэтому, чтобы не рассуждать абстрактно имеет смысл обозначить цели. В контексте данного доклада результатом работы с интернет-статистикой будет принятие управленческого решения. Наиболее типичными и имеющими отношение к управлению работами по поисковой оптимизации являются следующие решения:

  1. Продолжение работ «в том же духе»

  2. Перераспределение бюджета с целью улучшения сложившейся ситуации

  3. Отказ от поисковой оптимизации

Для того, чтобы обоснованно принять одно из этих решений необходимо рассмотреть сложившуюся ситуацию с двух точек зрения:

А) «Все ли хорошо?»

Если результаты устраивают, то можно либо продолжить работу «в том же духе» (решение 1), либо постараться развить успех (решение 2). Если результаты неудовлетворительны, то в лучшем случае, предпринимается попытка их улучшения (решение 2), либо организация отказывается от работы с этим каналом (решение 3).

Б) «Что можно улучшить?»,

но главное, повлияет ли это улучшение на результат. Вторая часть вопроса имеет непосредственное отношение к интернет-статистике. Ответив на этот вопрос и оценив предстоящие затраты принимается решение о перераспределении бюджета. Сам же бюджет может быть скорректирован, как в сторону увеличения (при наличии нереализованного потенциала в работе с поисковым трафиком), так и в сторону уменьшения (когда налицо низкая эффективность использования средств).

Все ли хорошо, или оценка результатов

Две составляющих позволяют сделать вывод что «все хорошо»: факт проведения работ и получение хороших результатов. Что понимать под хорошими результатами зависит от изначальной постановки задачи перед работами по поисковой оптимизации. Кроме эмоциональных результатов, к которым я бы отнес удовольствие от общения с клиентской службой и достижения высоких позиций в поисковой выдаче, можно выделить следующие:

Посещаемость. Выражается в посетителях. В зависимости от поставленной задачи, для получения информации о посещаемости от системы интернет-статистики могут потребоваться следующие данные:

  1. Общий поисковый трафик (сколько человек всего пришло с поисковых систем)

  2. Трафик с каждой поисковой машины

  3. Общий трафик по ключевому запросу

  4. Трафик по ключевому запросу с конкретного поисковика

  5. Трафик по всем запросам включающим в себя желаемый поисковый запрос

Качественная посещаемость. Можно выражать в процентах (доля качественных от всех посетителей), но в большинстве случаев удобнее работать с данными, выраженными в количестве человек.

Показатель качества для каждого сайта уникален и может представляться группой или одним из следующих критериев: глубина просмотра, возвраты на сайт, целевые действия или просмотр определенных страниц (реже географическая принадлежность). От системы статистики необходимы те же данные, что и в предыдущем пункте, только за вычетом не качественной аудитории. К примеру, вместо «трафик с поисковой машины», будет показатель «качественный трафик с поисковой машины».

Показатели эффективности. Выражаются в деньгах. К примеру, себестоимость одного посетителя с Рамблера равна 2$.

Для того, чтобы автоматически получать эти данные от системы интернет-статистики необходимо интегрировать в нее данные по затратам на каждый канал. Наиболее удобно это делается при анализе эффективности рекламной кампании, где используются стандартизированные медиапланы и четко описаны временные рамки кампании. В случае с поисковой оптимизацией затраты в большинстве случаев приходится подгонять вручную.

Данные получены, настал черед поиска ответа на вопрос «Хорошо ли все сработало»? Для этого можно воспользоваться одним из следующих приемов:

  • Сам факт наличия результатов – это хорошо. Такой минимальный уровень оценки подходит для оптимистов и тех, кому надо хоть как то оправдать затраты.

  • Мы можем себе это позволить. Подобные суждения имеют место при проведении программ комплексного воздействия на аудиторию или при недостатке времени у ответственного менеджера.

  • Результаты лучше или сопоставимы с результатами прошлого периода. Для этого необходимо иметь статистику за прошлый период.

  • Результаты лучше или сопоставимы с другими каналами (например, с контекстной рекламой).

Что можно улучшить, или поиск возможностей развития

Для ответа на этот вопрос ситуацию необходимо разложить на составляющие и рассматривать их каждую в отдельности. Эффект поисковой оптимизации зависит от каждой из далее представленных составляющих:

  • набор приоритетных поисковых запросов

  • набор поисковых систем

  • позиция в поисковой выдаче

  • представление сайта в поисковой выдаче

  • страница входа на сайт

Набор приоритетных поисковых запросов всегда ограничен, т.к. невозможно попадать под все возможные запросы. Поэтому важно, чтобы в работу попали такие запросы, которые бы приводили на сайт как можно большее количество качественной аудитории, при этом затраты на их достижение соответствовали бы финансовым возможностям организации.

С помощью интернет-статистики можно получить данные о посещаемости и о качественной посещаемости по каждому запросу для нахождения оптимального рабочего набора слов и словосочетаний.

Набор поисковых систем. При оптимизации набора поисковых систем, находящихся в работе, очень важно иметь представление о потенциале каждой системы, для чего используется так называемая «Глобальная статистика».

К примеру, согласно проведенному исследованию специалистами «Артон» сайтов московских автосалонов и агентств недвижимости, доля Яндекса в их посещаемости с поисковых систем составила в среднем 61%, а доля Рамблера – 22%. Если в какой либо из схожих организаций картина сложится, к примеру, 80% Яндекса и 10% Рамблера, значит потенциал последнего не используется.

Позиция и представление сайта в поисковой выдаче должны сопоставляться с результирующей посещаемостью сайта. К примеру, если сайт попадает на выгодную позицию по запросу, но лишь малое количество людей приходят по нему на сайт, то следует скорректировать один из следующих моментов:

- выбрать более популярный запрос для работы

- повлиять и сделать более привлекательным представление сайта в поисковой выдаче

- признать запрос нецелевым и исключить из работы

- поднять рейтинг сайта в поисковой выдаче

Страница входа на сайт должна представлять интерес и/или соответствовать ожиданиям посетителей.

Очень часто возникают ситуации, когда на странице входа на сайт (к примеру, специфический топик на форуме, или устаревшая страница) находятся несоответствующая информация или неработающие ссылки. Иногда достаточно посмотреть на, казалось бы, нормальную страницу глазами человека, задавшего определенный запрос, чтобы понять как можно улучшить ее содержание.

Интернет-статистика позволяет косвенно определить качество страниц и выявить большинство очевидных ошибок.

Реалии современной интернет-статистики

По сути, весь предшествующий этому разделу текст являлся расширенной постановкой задачи перед системами интернет-статистики. Еще раз соберем все требования вместе. От систем интернет-статистики требуются следующие данные:

  1. Общий поисковый трафик

  2. Трафик с каждой поисковой машины

  3. Общий трафик по ключевому запросу

  4. Трафик по ключевому запросу с конкретного поисковика

  5. Трафик по всем запросам, включающим в себя желаемый поисковый запрос

  6. Страницы входа на сайт

    • все вышеперечисленное, выраженное в качественных посетителях

    • все вышеперечисленное, выраженное в динамике относительно прошлого периода

Далее следующие выводы сделаны на основе изучения возможностей 5-ти российских лог-анализаторов, 9-ти счетчиков и 2-х систем, интегрированных в CMS.

Общий поисковый трафик

Первый же тип данных вызывает затруднение у многих систем интернет-статистики. Предполагается, что пользователи должны самостоятельно сложить посещаемость с сайтов-поисковиков, что вызывает следующие проблемы:

- не учитываются случаи, когда один посетитель пользовался несколькими поисковиками (пересечение аудиторий)

- не отделяется поисковая реклама

- вручную приходится делать то, что могло бы быть легко автоматизировано

Трафик с каждой поисковой машины

С этими данными, как правило, проблем не возникает.

Общий трафик по ключевому запросу

С этими данными, как правило, проблем не возникает.

Трафик по ключевому запросу с конкретного поисковика

Эти данные уже могут вызывать затруднения, правда по большей части из-за не удобного представления данных.

Трафик по всем запросам, включающим в себя желаемый поисковый запрос

В то время, как поисковики обрабатывают морфологию, разные последовательности слов и умеют игнорировать «стоп-слова», подавляющее большинство систем интернет-статистики не могут сгруппировать даже такие слова, как «сайт», «Сайт», «сайты» и «_сайты_».

Получить информацию о количестве «всех запросов содержащих ключевое слово» - представляется сложной задачей.

Страницы входа на сайт

Как таковой, отчет присутствует во многих системах. Проблемы начинаются при детальном анализе, когда, к примеру, надо определить – какие конкретно запросы (и запросы ли это вообще) привели людей на эту страницу.

Качественные посетители

Задача определения качества посетителей (и, как следствие, качества поисковых запросов и страниц входа на сайт) ставит в тупик большинство систем интернет-статистики, присутствующих в Рунете. При чем даже у тех, кто справляется с этой задачей, существуют сложности с точностью данных. Далее следует несколько типовых примеров:

«Глубина просмотра»

Глубина просмотра традиционно считается, как отношение хитов к посетителям. Например, при 5000 посетителях и 10000 хитах глубина просмотра составит 2 хита на посетителя. При этом распределение аудитории внутри группы может быть различным. Это означает, что по критерию глубина просмотра два канала с одинаковыми показателями 10000хитов к 5000посетителей могут отличаться по качеству аудитории (в одном случае может быть 2000 человек, отвалившихся после первой страницы, а в другом случае – 3000 человек).

Вообще тема хитов очень болезненна для интернет-статистики. Хит определяется как поступление запроса на сервер (или реакция сервера на поступивший запрос). Для маркетингового анализа важно посчитать осведомленность аудитории в результате коммуникации. Поэтому, чтобы лог-анализатор правильно считал загрузки страниц, его надо детально настраивать под особенности сайта, отсекая загрузки большинства картинок, css, js, прочих инклюдов, страниц с неактуальными кодами возврата и всяких прочих, не имеющих отношения к анализу деталей. Счетчики более просты в этом плане, но и у них есть множество неточностей, как например одна страница по сути для счетчиков будет выглядеть как четыре разных, если она представлена следующими способами:

- http://www.arton.ru/about/

- http://www.arton.ru/about/index.html

- http://www.arton.ru/about/index.html?from=yandex

- http://www.arton.ru/cgi-bin/redirect.cgi?to=/about/

«Возвраты на сайт/повторные посещения»

Большинство систем интернет-статистики либо показывают постоянных посетителей, либо выражают возвраты в сессиях. Само определение сессий несет в себе сильный «программерский» смысл. Проблема заключается в том, что стандартом окончания сессии является бездействие человека на сайте в течение 15-30 минут. Можно ли при маркетинговом анализе вернувшегося через 15 минут на сайт человека считать «более лояльным» или утверждать, что он сознательно запомнил этот сайт и его сообщения? Ведь его могли просто отвлечь, а потом он вернулся к незакрытому окну браузера с загруженным в нем сайтом. Наиболее разумным в таком случае было бы считать человека вернувшимся на сайт через несколько часов, через полдня или на следующий день.

Чтобы не иметь дело со средними числами и отображать в показателе распределение аудитории в практике Артон используется как для глубины просмотра, так и для возвратов следующий формат представления данных: X человек смотрели Y и более страниц на сайте (или X человек посещали сайт как минимум Y раз с перерывом не менее дня), где Y – настраиваемая величина.

«Время, проведенное на сайте»

Показатель, который всеми считается с настолько большой погрешностью, что теряется смысл его использования. Время, проведенное человеком на сайте, является разницей между временем первого и последнего хитов в сессии. При этом:

- не считается время для сессий с 1 хитом

- не делается разница в скорости доступа к Интернету у разных пользователей

- первые страницы могут быть навигационными и проходиться быстро, а сколько человек читал последнюю «вожделенную» страницу – не известно

Комбинации свойств

Мизерное количество систем позволяют дать ответ на такие сложносоставленные вопросы, как: «сколько, пришедших с Яндекса человек, просмотрели на сайте более 3х страниц, выбрали одну из представленных в каталоге моделей и не заходили в раздел Вакансии».

В завершение, хочется рекомендовать ставить четкие и подробные задачи перед любыми исследованиями и анализом статистики. Это не только повысит качество получаемых выводов, но и выведет рынок интернет-статистики на новую ступень развития. При отсутствии же квалифицированного и настойчивого спроса, нам так и придется разгребать кучи дублирующихся, плохо организованных и малополезных данных.

Дмитрий Малявкин

«Поисковая оптимизация и

продвижение сайтов в Интернете»,

ноябрь 2005

 

2Поднять рейтингОпустить рейтингДобавить комментарийВерсия для печати
Руководитель направления исследований
Дмитрий Малявкин

Публикации автора
Личный форум