Вивчаємо відвідуваність сайту

3235
  • Що відстежувати і як ставити завдання для аналітики?
  • Основні варіанти збору статистики вашого сайту
  • Як працюють системи аналітики?
  • Здрастуйте, шановні читачі блогу . Не так давно я опублікував статтю «Як працює Google Analytics». Там ми познайомилися з цією безкоштовною системою аналітики як би зсередини, тобто дізналися, як збираються дані, як вони обробляються, зберігаються, і як на їх основі формуються потрібні нам звіти.

    Ці знання безумовно нам знадобляться надалі. Ну, а зараз я хочу вже безпосередньо перейти до розмови про аналітиці, як такої. Для чого вона потрібна? Які способи аналізу сайту існують і які критерії ефективності при цьому варто відстежувати.

    Вивчаємо відвідуваність сайту

    Також ми подивимося, яким чином здійснюється збір статистики сайту, які методи та інструменти при цьому найчастіше використовуються, а головне — яким чином ці самі дані знімаються. У зв’язку з цим ми докладно зупинимося на таких поняттях, як відвідувач, сесія і хіт, які є основою всієї веб-аналітики. Без розуміння цих речей вам дуже важко буде далі осягати всі тонкощі підвищення ефективності вашого сайту, про який ми будемо говорити в статтях цієї рубрики.

    Що відстежувати і як ставити завдання для аналітики?

    З наведеної трохи вище статті ми з вами дізналися, що, по суті, система Google Analytics складається з декількох блоків, основними з яких можна вважати:

  • Інструмент збору даних
  • Інструменти аналізу, обробки і відображення зібраних статистичних даних
  • Для чого ж нам можуть знадобитися подібні системи аналітики? Давайте подивимося:

  • Найочевидніше це, звичайно ж, оцінка поточної відвідуваності вашого сайту (трафіку, через нього проходить). Це може бути добова відвідуваність, джерела трафіку, показник відмов, час і глибина сесії, точки входу і виходу, пошукові запити, по яких користувачі заходили, і багато іншого, про що ми досить детально говорили в статті про те, як дізнатися відвідуваність свого або чужого сайту. У принципі, більшість власників сайтів на цьому і зупиняються, вважаючи, що в цьому якраз і полягає вся аналітика.
  • Вивчаємо відвідуваність сайтуВивчаємо відвідуваність сайту

  • Також ми зазвичай порівнюємо поточну відвідуваність сайту з тим, що було раніше. Якщо йде зростання трафіку, то добре, а якщо падіння, то ми починаємо гарячково шукати причини цього і часто знаходимо (як це, наприклад, було зі мною півтора року тому після потрапляння мого блогу під фільтр Яндекса). Спостереження за відвідуваністю, таким чином, дозволяє у загальних рисах зрозуміти, чи в правильному напрямку ви рухаєтеся, і вчасно забити на сполох, коли виникають проблеми з тим чи іншим причин.
  • Природно, що дивлячись на динаміку розвитку можна робити прогнози на майбутнє, хоча тут вже дуже багато форс-мажорів може втрутитися. Але загальну тенденцію розвитку все одно побачити можна.
  • Це в загальних рисах, а взагалі аналітика потрібна саме для поліпшення стану справ з вашим сайтом (і бізнесом). Завдяки їй ви зможете щось виміряти і відстежити вплив внесених вами змін на якісь важливі для вас характеристики (відвідуваність, конверсію тощо). Те, що не можна виміряти, також не вийде і осмислено поліпшити, тому так багато уваги останнім часом все SEO фахівці приділяють збору статистики, її обробці і аналізу. Справа ця не проста, але дуже перспективний.

    Що саме вам потрібно відстежувати за допомогою подібних систем Гугл Аналитикса, залежить від типу вашого сайту. В принципі, варіантів не так вже й багато, тому давайте просто перелічимо їх:

  • Продажу — актуально для онлайн-комерції
  • Збір лідов — наприклад, реєстрацій на сайті, підписок на новинну стрічку, заповнень форми замовлення і т. п. Актуально для багатьох видів ресурсів, які збирають колекції різних дій користувачів, щоб потім їх монетизувати тим чи іншим способом.
  • Залучення аудиторії і відвідуваність ресурсу — актуально для інформаційних і новинних ресурсів
  • Допомога користувачам в пошуку інформації — актуально для інформаційних ресурсів типи пошукових систем, каталогів, енциклопедій тощо
  • Підвищення впізнаваності торгової марки, а також лояльності аудиторії до неї — актуально при брендуванні, тобто розкрутки бренду
  • Відповідно, вам потрібно буде зрозуміти до якого типу відноситься ваш проект, і на основі цього ви вже будете вибирати ті показники його ефективності, які варто відстежувати за допомогою системи аналітики (Гугла або Яндекса — не важливо). В теорії процес постановки завдань, які покликана вирішувати, аналітика, виглядає досить-таки просто:

  • Визначаємо бізнес-цілі — швидше за все, це буде щось на кшталт підвищення попиту на ваш продукт
  • Розробляємо стратегії. Приміром, першою стратегією будуть власне продажу продукту, а другий — його брендування. Розробляємо методи реалізації стратегій, тобто тактику. Наприклад, для реалізації стратегії продажу продукту можна використовувати дві тактики — онлайн продажу в самому інтернет-магазині і оффлайн продажу в реальному магазині, куди ви будете залучати користувачів з сайту якими-небудь замануха у вигляді купонів, бонусів або акцій. Ну, а для реалізації стратегії підвищення лояльності (брендування) можна створити блог-супутник, де обговорювати щось актуальне і цікаве.
  • Вибираємо ключові показники ефективності (KPI). Наприклад, для онлайн-продажів продукту це будуть, швидше за все, прибутковість і середній чек, а для продажу оффлайн це може бути, наприклад, кількість роздрукованих купонів з вашого сайту, за якими користувачі отримають якусь знижку. У разі блогу-супутника KPI можуть служити, наприклад, число розшарювання постів у соціальні мережі і частота возрата користувачів на блозі (формування ядра відвідувачів). Серед найбільш часто використовуваних показників ефективності можна виділити:
    Вивчаємо відвідуваність сайтуВивчаємо відвідуваність сайту

  • ROI — коефіцієнт повернення інвестицій, який показує, який відсоток від витрачених грошей ви повернули. Вважається за формулою: (прибуток мінус витрати) поділена на витрати і помножене на сто відсотків. Від’ємне значення означає збитки, а позитивне — прибуток. Наприклад, отримавши прибуток у розмірі 1200 рублів, але витративши 1500, ви отримаєте ROI дорівнює «-20%» (на двадцять відсотків у мінус пішли).
  • ROAS — цей показник часто застосовується для наочного відображення витрат на рекламу. Він вважається за простою формулою: прибуток ділиться на витрати (найчастіше це саме рекламні бюджети) і множиться на сто відсотків. Замість нього іноді використовують коефіцієнт ДРР (частка рекламних витрат), який вираховується за зворотною формулою — витрати діляться на прибуток і все це множиться на сто відсотків. Він показує частку витрат на рекламу в загальному обсязі доходів і часто використовується рекламними агентствами в рунеті.
  • Розбиваємо (сегментируем) аудиторію з якимось важливим показникам. Напевно слід відстежувати ефективність різних каналів залучення користувачів на ваш сайт, що може служити одним з показників сегментації (з контекстної реклами, з пошукових систем, соціальних мереж тощо). Також може бути цікаво, наприклад, розподіл за географічною ознакою — звідки зайшов на сайт той чи інший відвідувач. Або за принципом — це новий відвідувач або повернувся.
  • Налаштовуємо мети в тій системі статистики, яку будемо використовувати
  • Саме неприємно полягає в тому, що все описане вище, по-хорошому, потрібно продумувати ще до того, як ви створюєте сайт. Часто вже готовий і працюючий інтернет-проект дуже складно буває привести до такого вигляду, що можна було б міряти потрібні показники ефективності. Без усього цього використання найпотужніших систем аналітики на зразок Google Analytics стає більш ефективним, ніж забивання цвяхів мікроскопом.

    Основні варіанти збору статистики вашого сайту

    Однак, абстрагуємося від цього і припустимо, що за всім вищезазначеним пунктам у вас з’явилися більш-менш осмислені відповіді. Після цього постає питання — а яким чином можна збирати потрібні нам для аналізу дані. Як я вже згадував у статті про статистику відвідуваності сайту, технічно збір даних можна реалізувати двома способами:

  • Збирати їх безпосередньо на веб-сервері, де знаходиться ваш сайт, фіксуючи всі запити до нього. Для цього використовуються дані журналів і логів сервера, а також спеціально призначені для цього скрипти. Даний спосіб має свої плюси і мінуси:
  • На своєму сервері доведеться крім сайту ще зберігати великі обсяги зібраних статистичних даних, що може вимагати додаткових витрат.
  • Вивчаємо відвідуваність сайтуВивчаємо відвідуваність сайту

  • Вбудовані серверні механізми не володіють широкими можливостями щодо збору статистики, в результаті чого серверна аналітика найчастіше поступається тому, що можна отримати другим способом (читайте про це трохи нижче).
  • Однак ті дані, які все-таки можливо зібрати, будуть дуже відрізнятися високою точністю, бо вони збираються на сервері у момент запиту, що призводить до мінімуму втрат.
  • Вся зібрана вами статистична інформація буде належати вам, і нікому більше. Ви не залежите в цьому випадку від правил зовнішніх систем аналітики, про яких піде мова трохи нижче.
  • У плані технічної реалізації такий метод являє собою програму, яка встановлюється безпосередньо на сервер, де, власне, ваш сайт і розташований. Найпопулярніші з серверних систем аналітики:

  • Awstat — вельми популярна система, яка найчастіше встановлюється хостерами на сервера за замовчуванням.
  • Piwik — дуже потужний інструмент, який по можливостях нічим не поступається, наприклад, такої популярної клієнтській системі збору статистики, як Яндекс Метрика (хоча вебвизора в пивике, звичайно ж, немає).
  • Loganalyzer — трохи більш просунута аналітика, ніж у Awstat.
  • Weblog Expert — теж схожий по суті на Awstat.
  • Але в той же час збирати потрібні дані можна і безпосередньо в браузерах користувачів, які ваш сайт відвідують. Є такий клієнтоорієнтований мова програмування під назвою JavaScript, команди якого можна включати в Html код веб-сторінки. Саме на цьому принципі і працює більшість лічильників відвідувань і систем аналітики начебто Гугл Аналитикса або Яндекс Метрики.

    Ви додаєте всі сторінки вашого сайту пропонований вам фрагмент коду, який выполняясь буде збирати всі необхідні дані з браузерів відвідувачів вашого сайту (і потім передає її на сервера системи аналітики, яку ви використовуєте). У цього способу теж є свої плюси і мінуси:

  • Зібрані дані будуть не такими влучними, як у випадку серверної статистики. Ступінь цієї неточності визначити досить складно, і залежить вона як від використовуваних методів, так і від випадкових обставин (в браузерах якихось користувачів може бути примусово відключено виконання команд, записаних на ДжаваСкрипте, або ж ви забули впровадити скрипт в якісь окремі сторінки свого сайту).
  • Всі дані будуть збиратися та зберігатися на серверах третьої сторони (системи аналітики, яку ви використовуєте). Правда, в цьому випадку буде обмежений термін їх зберігання, так і ваш доступ до даних у виняткових випадках (загублений пароль, порушені правила використання тощо) може бути обмежений. По суті, ці самі дані і є вашою платою за безкоштовність більшості з цих сервісів, які можуть використовувати цю величезну статистичну базу по величезній кількості сайтів як у своїх цілях, так і передавати, наприклад, зацікавленим гравцям ринку пошуку за гроші.
  • Те, що масиви з зібраних даних не потрібно буде зберігати на своєму сервері, є одночасно і позитивним моментом, бо це не потребує додаткових витрат, як у випадку з серверної статистикою.
  • Можливості аналітики клієнтських систем (тих, хто знімає дані в браузерах користувачів, тобто клієнтів), як правило, серйозно перевершують серверні аналоги.
  • Прикладами клієнтських систем збору статистики можуть служити:
    Вивчаємо відвідуваність сайтуВивчаємо відвідуваність сайту

  • Рамблер Топ 100 — ті ресурси, які розмістять у себе цей лічильник, автоматично потрапляють в даний рейтинговий каталог (досить-таки трастовий).
  • Hotlog — ще один лічильник статистики, на основі якої вибудовується рейтинг найбільш відвідуваних сайтів в тематиці.
  • Лайвинтернет — самий популярний в рунеті спосіб збору статистики свого сайту.
  • Top.mail.ru — досить популярний в рунеті рейтинг сайтів.
  • OpenStat — трохи більш просунута система збору статистики з рейтингом сайтів, які встановили їх лічильник.
  • Яндекс Метрика — це вже повноцінна система збору та аналізу статистичних даних сайту, що має досить великий діамант в своїй короні — вебвізор.
  • Google Analytics — найбільш просунута з усіх доступних безкоштовно систем аналітики. Взагалі, досить давно Аналітікс називався трохи інакше і був платною системою (кілька сотень доларів на місяць за те, щоб дізнатися відвідуваність і супутні їй параметри), але потім його купив великий і жахливий Google, після чого зробив доступним усім бажаючим. Однак, кілька років тому з’явилася платна версія Analytics для великих сайтів, яка має розширений функціонал.
  • Adobe SiteCatalyst — основний конкурент платній версії Гугл Аналитикса. Даний пакет теж платний, і має досить-таки високу популярність в буржунете.
  • WebTrends — теж досить потужний інструмент, який широко поширений в буржунете.
  • Ми з вами в продовженні цієї серії статей будемо розглядати саме клієнтські системи збору статистики, тож поговоримо про них детальніше.

    Як працюють системи аналітики при зборі статистики сайту?

    Отже, на практиці збір статистики сайту в клієнтській системі здійснюється з допомогою впровадження у всі його сторінки невеликого фрагмента коду, написаного на ДжаваСкрипте. Хоча, по суті, це не сам код, а лише спосіб його виклику. Сам же код збору статистики досить об’ємний, і завантажується він одночасно із завантаженням цієї вебсторінки з серверів Гугла або Яндекса (у разі використання Аналитикса і Метрики, відповідно), якщо, звичайно ж, раніше він не був закеширован в браузері користувача.

    Браузер цей код виконує, запускаючи його у своєму інтерпретаторі ДжаваСкрипта. У результаті збираються і відправляються на сервер Яндекса або Гугла різні дані (що сторінка, звідки на неї прийшов відвідувач, які куки зберігаються для нього в браузері, яке у нього дозвіл екрана, який браузер, яка ОС і багато іншого). А вже далі зібрана статистика зберігається в базі даних тієї системи аналітики, яку вирішили використовувати.

    До цих даних вже звертається система аналітики, коли ми через веб-інтерфейс намагаємося подивитися ті чи інші звіти по своєму сайту. На підставі цих звітів ми можемо вже проводити подальший аналіз. Ось і все, дуже просто. Якщо говорити про мобільних додатках, то, як я вже згадував у статті про роботу Google Analytics, там для відстеження використовується не ДжаваСкрипт код, а так званий пакет засобів розробника (SDK). Статистичні дані, зняті в мобільних додатках, відправляються не постійно, а пакетами через певну кількість часу.

    Всі зібрані кодом відстеження є статистичні дані, які пройшли обробку, будуть вам доступні у вигляді звітів у веб-інтерфейсі системи аналітики. У Google Analytics в основі всіх звітів лежать комбінації параметрів (показників) та показників (вимірювань).

    Вивчаємо відвідуваність сайтуВивчаємо відвідуваність сайту

    Однак для того, щоб надалі нам з вами розмовляти на одній мові, потрібно буде дати визначення тих основних понять (термінів), які ми будемо використовувати. Загалом-то я говорив про них у статті про Гугл Аналітікс (див. посилання в початку цієї публікації), але не заважає це повторити.

    При аналізі статистики сайту використовуються три основних поняття: хіти, сесії і користувачі. Всі зібрані статистичні дані в будь-якій системі аналітики організовані ієрархічно за трирівневої системи. У самому низу знаходяться хіти, трохи вище розташовані сесії, ну, а в самому верху — користувачі.

    Таким чином хіти є складовою частиною сесії (набір дій, вчинених за час візиту даного користувача на сайті), а набір сесій характеризує вже поведінку користувача на сайті (скільки разів він заходить на сайт і як довго тривали його візити). Давайте розглянемо все це більш детально і досконально:

  • Хіти (взаємодії) — це дії користувачів на сайті. У фізичному плані хітом називається будь-яка передача інформації з браузера користувача на сервер системи аналітики (у разі Гугл Аналитикса дані передаються в Get запиті на підвантаження прозорою гіф картинки розміром в один піксел). Відправка хіта відбувається після виконання ДжаваСкрипт коду лічильника, який ви вбудували у всі сторінки сайту. Якщо сторінка перезавантажиться, то буде відправлений ще один хіт.

    Саме хіт є маленькою цеглинкою, на якому будується вся будівля аналітики. Хітом може бути відкриття (оновлення) сторінки, подія (наприклад, натискання кнопки), яке відбувається без перезавантаження сторінки, а також багато іншого. Наприклад, оплата товару в інтернет-магазині, розшарювання сторінки в соціальні мережі або лайк, вимірювання інтервалу часу між якимись подіями і т. п.

  • Сесія (більш зрозумілим, на мій погляд, є термін сеанс або візит) — це час, проведений на сайті або в додатку. По суті, це колекція хітів (дій) одного відвідувача, які об’єднані разом. За яким принципом йде об’єднання? За принципом безперервності. Сесія вважається перерваною, якщо користувач протягом півгодини не робив жодних дій на сайті (це час називається тайм-аутом).

    В цьому випадку час сесії фіксується, як інтервал між першим і останнім хітом (дією), хоча користувач міг читати сторінку або дивитися відеоролик, ще якийсь час ніяких дій на сайті не роблячи. У зв’язку з цим робимо висновок, що час, проведений користувачем на сайті, виміряти точно поки не представляється можливим. На жаль, некоректна інтерпретація зібраних статистичних даних є ахилесовой п’ятої сучасної веб-аналітики.

    Однак, час таймауту (простою, після якого сесія вважається завершеною) та у Google Analytics і Яндекс Метриці можна змінити, якщо специфіка вашого сайту цього зажадає. Це дозволить дещо знизити похибку вимірювання. Наприклад, очевидно збільшення часу очікування для онлайн-кінотеатрів, бо під час перегляду фільму користувач ніяких дій на сайті, як правило, не робить (щоб не отримати час сесії в пару хвилин, коли насправді він просидів там півтори години).

  • Вивчаємо відвідуваність сайтуВивчаємо відвідуваність сайту

  • Користувач — це відвідувач вашого сайту або мобільного додатку. Не плутайте користувачів з різальними людьми, бо, по суті, це всього лише браузери, через які з сайтом спілкуються якісь люди, але ідентифікувати їх не представляється можливим. На одному комп’ютері та в одному браузері може працювати поперемінно кілька людей, і в той же час один і той же людина може відвідувати ваш сайт з різних пристроїв протягом дня (з комп’ютера, планшета, смартфона, робочого комп’ютера, ноутбука тощо). Системи аналітики намагаються почати ідентифікувати саме людей, але поки це ще повною мірою не реалізовано.

    Як визначається те, що дії на сайті виробляє один і той же користувач, а не інший? Досить просто. При фіксації першого хіта даному користувачеві привласнюється унікальний ID (ідентифікаційний номер), який зберігається в куках його браузера (в кеші). Ну, а всі інші хіти, вчинені цим користувачем, будуть ідентифікуватися з цього ID, зчитаного з кукісів. Саме тому я поставив трохи вище знак рівності для систем аналітики між реальним користувачем (людиною) і його браузером. Таке припущення робиться, і піти від усіх пов’язаних з цим похибок вимірювань поки що не виходить.

  • Трохи докладніше зупинимося на кукіси. Це невеликі фрагменти даних в текстовому форматі, які зберігаються в кеші браузера. Їх досить часто використовують як механізм, що дозволяє запам’ятовувати відвідувача і його переваги — зберігати зроблені ним на сайті параметри, параметри авторизації і щось ще. При повторному відвідування цього сайту браузер прочитує записані для нього куки і відвідувач потрапить у звичний йому інтерфейс, йому не потрібно при кожному оновленні сторінки заново авторизовуватись на цьому сайті.

    Куки можна розділити на два типи — основні (куки того сайту, куди зайшов відвідувач) і сторонні (вони не відносяться до цього сайту, але присутні на відкритій сторінці). Прикладом джерела сторонніх кукісів може служити банер, який відображається на сторінці, але загружающийся зі стороннього сервера. У налаштуваннях браузерах прийом сторонніх куків можна відключити, що, власне, багато хто і робить.

    Тим не менш ліміт, відведений для однієї статті, вичерпано, тому продовжимо розмову про кукіси і все інше, що дозволить нам освоїти науку осмисленого збору статистики сайту і роботи з побудованими на її основі звітами, в наступних публікаціях рубрики «Статистика сайту».

    Продовження >>> (Тут можна підписатися на поштову розсилку з анонсами нових статей)

    Удачі вам! До зустрічей на сторінках блогу