Здрастуйте, шановні читачі блогу . Не так давно я опублікував статтю «Як працює Google Analytics». Там ми познайомилися з цією безкоштовною системою аналітики як би зсередини, тобто дізналися, як збираються дані, як вони обробляються, зберігаються, і як на їх основі формуються потрібні нам звіти.
Ці знання безумовно нам знадобляться надалі. Ну, а зараз я хочу вже безпосередньо перейти до розмови про аналітиці, як такої. Для чого вона потрібна? Які способи аналізу сайту існують і які критерії ефективності при цьому варто відстежувати.
Також ми подивимося, яким чином здійснюється збір статистики сайту, які методи та інструменти при цьому найчастіше використовуються, а головне — яким чином ці самі дані знімаються. У зв’язку з цим ми докладно зупинимося на таких поняттях, як відвідувач, сесія і хіт, які є основою всієї веб-аналітики. Без розуміння цих речей вам дуже важко буде далі осягати всі тонкощі підвищення ефективності вашого сайту, про який ми будемо говорити в статтях цієї рубрики.
Що відстежувати і як ставити завдання для аналітики?
З наведеної трохи вище статті ми з вами дізналися, що, по суті, система Google Analytics складається з декількох блоків, основними з яких можна вважати:
Для чого ж нам можуть знадобитися подібні системи аналітики? Давайте подивимося:
Це в загальних рисах, а взагалі аналітика потрібна саме для поліпшення стану справ з вашим сайтом (і бізнесом). Завдяки їй ви зможете щось виміряти і відстежити вплив внесених вами змін на якісь важливі для вас характеристики (відвідуваність, конверсію тощо). Те, що не можна виміряти, також не вийде і осмислено поліпшити, тому так багато уваги останнім часом все SEO фахівці приділяють збору статистики, її обробці і аналізу. Справа ця не проста, але дуже перспективний.
Що саме вам потрібно відстежувати за допомогою подібних систем Гугл Аналитикса, залежить від типу вашого сайту. В принципі, варіантів не так вже й багато, тому давайте просто перелічимо їх:
Відповідно, вам потрібно буде зрозуміти до якого типу відноситься ваш проект, і на основі цього ви вже будете вибирати ті показники його ефективності, які варто відстежувати за допомогою системи аналітики (Гугла або Яндекса — не важливо). В теорії процес постановки завдань, які покликана вирішувати, аналітика, виглядає досить-таки просто:
Саме неприємно полягає в тому, що все описане вище, по-хорошому, потрібно продумувати ще до того, як ви створюєте сайт. Часто вже готовий і працюючий інтернет-проект дуже складно буває привести до такого вигляду, що можна було б міряти потрібні показники ефективності. Без усього цього використання найпотужніших систем аналітики на зразок Google Analytics стає більш ефективним, ніж забивання цвяхів мікроскопом.
Основні варіанти збору статистики вашого сайту
Однак, абстрагуємося від цього і припустимо, що за всім вищезазначеним пунктам у вас з’явилися більш-менш осмислені відповіді. Після цього постає питання — а яким чином можна збирати потрібні нам для аналізу дані. Як я вже згадував у статті про статистику відвідуваності сайту, технічно збір даних можна реалізувати двома способами:
У плані технічної реалізації такий метод являє собою програму, яка встановлюється безпосередньо на сервер, де, власне, ваш сайт і розташований. Найпопулярніші з серверних систем аналітики:
Ви додаєте всі сторінки вашого сайту пропонований вам фрагмент коду, який выполняясь буде збирати всі необхідні дані з браузерів відвідувачів вашого сайту (і потім передає її на сервера системи аналітики, яку ви використовуєте). У цього способу теж є свої плюси і мінуси:
Прикладами клієнтських систем збору статистики можуть служити:
Ми з вами в продовженні цієї серії статей будемо розглядати саме клієнтські системи збору статистики, тож поговоримо про них детальніше.
Як працюють системи аналітики при зборі статистики сайту?
Отже, на практиці збір статистики сайту в клієнтській системі здійснюється з допомогою впровадження у всі його сторінки невеликого фрагмента коду, написаного на ДжаваСкрипте. Хоча, по суті, це не сам код, а лише спосіб його виклику. Сам же код збору статистики досить об’ємний, і завантажується він одночасно із завантаженням цієї вебсторінки з серверів Гугла або Яндекса (у разі використання Аналитикса і Метрики, відповідно), якщо, звичайно ж, раніше він не був закеширован в браузері користувача.
Браузер цей код виконує, запускаючи його у своєму інтерпретаторі ДжаваСкрипта. У результаті збираються і відправляються на сервер Яндекса або Гугла різні дані (що сторінка, звідки на неї прийшов відвідувач, які куки зберігаються для нього в браузері, яке у нього дозвіл екрана, який браузер, яка ОС і багато іншого). А вже далі зібрана статистика зберігається в базі даних тієї системи аналітики, яку вирішили використовувати.
До цих даних вже звертається система аналітики, коли ми через веб-інтерфейс намагаємося подивитися ті чи інші звіти по своєму сайту. На підставі цих звітів ми можемо вже проводити подальший аналіз. Ось і все, дуже просто. Якщо говорити про мобільних додатках, то, як я вже згадував у статті про роботу Google Analytics, там для відстеження використовується не ДжаваСкрипт код, а так званий пакет засобів розробника (SDK). Статистичні дані, зняті в мобільних додатках, відправляються не постійно, а пакетами через певну кількість часу.
Всі зібрані кодом відстеження є статистичні дані, які пройшли обробку, будуть вам доступні у вигляді звітів у веб-інтерфейсі системи аналітики. У Google Analytics в основі всіх звітів лежать комбінації параметрів (показників) та показників (вимірювань).
Однак для того, щоб надалі нам з вами розмовляти на одній мові, потрібно буде дати визначення тих основних понять (термінів), які ми будемо використовувати. Загалом-то я говорив про них у статті про Гугл Аналітікс (див. посилання в початку цієї публікації), але не заважає це повторити.
При аналізі статистики сайту використовуються три основних поняття: хіти, сесії і користувачі. Всі зібрані статистичні дані в будь-якій системі аналітики організовані ієрархічно за трирівневої системи. У самому низу знаходяться хіти, трохи вище розташовані сесії, ну, а в самому верху — користувачі.
Таким чином хіти є складовою частиною сесії (набір дій, вчинених за час візиту даного користувача на сайті), а набір сесій характеризує вже поведінку користувача на сайті (скільки разів він заходить на сайт і як довго тривали його візити). Давайте розглянемо все це більш детально і досконально:
Саме хіт є маленькою цеглинкою, на якому будується вся будівля аналітики. Хітом може бути відкриття (оновлення) сторінки, подія (наприклад, натискання кнопки), яке відбувається без перезавантаження сторінки, а також багато іншого. Наприклад, оплата товару в інтернет-магазині, розшарювання сторінки в соціальні мережі або лайк, вимірювання інтервалу часу між якимись подіями і т. п.
В цьому випадку час сесії фіксується, як інтервал між першим і останнім хітом (дією), хоча користувач міг читати сторінку або дивитися відеоролик, ще якийсь час ніяких дій на сайті не роблячи. У зв’язку з цим робимо висновок, що час, проведений користувачем на сайті, виміряти точно поки не представляється можливим. На жаль, некоректна інтерпретація зібраних статистичних даних є ахилесовой п’ятої сучасної веб-аналітики.
Однак, час таймауту (простою, після якого сесія вважається завершеною) та у Google Analytics і Яндекс Метриці можна змінити, якщо специфіка вашого сайту цього зажадає. Це дозволить дещо знизити похибку вимірювання. Наприклад, очевидно збільшення часу очікування для онлайн-кінотеатрів, бо під час перегляду фільму користувач ніяких дій на сайті, як правило, не робить (щоб не отримати час сесії в пару хвилин, коли насправді він просидів там півтори години).
Користувач — це відвідувач вашого сайту або мобільного додатку. Не плутайте користувачів з різальними людьми, бо, по суті, це всього лише браузери, через які з сайтом спілкуються якісь люди, але ідентифікувати їх не представляється можливим. На одному комп’ютері та в одному браузері може працювати поперемінно кілька людей, і в той же час один і той же людина може відвідувати ваш сайт з різних пристроїв протягом дня (з комп’ютера, планшета, смартфона, робочого комп’ютера, ноутбука тощо). Системи аналітики намагаються почати ідентифікувати саме людей, але поки це ще повною мірою не реалізовано.
Як визначається те, що дії на сайті виробляє один і той же користувач, а не інший? Досить просто. При фіксації першого хіта даному користувачеві привласнюється унікальний ID (ідентифікаційний номер), який зберігається в куках його браузера (в кеші). Ну, а всі інші хіти, вчинені цим користувачем, будуть ідентифікуватися з цього ID, зчитаного з кукісів. Саме тому я поставив трохи вище знак рівності для систем аналітики між реальним користувачем (людиною) і його браузером. Таке припущення робиться, і піти від усіх пов’язаних з цим похибок вимірювань поки що не виходить.
Трохи докладніше зупинимося на кукіси. Це невеликі фрагменти даних в текстовому форматі, які зберігаються в кеші браузера. Їх досить часто використовують як механізм, що дозволяє запам’ятовувати відвідувача і його переваги — зберігати зроблені ним на сайті параметри, параметри авторизації і щось ще. При повторному відвідування цього сайту браузер прочитує записані для нього куки і відвідувач потрапить у звичний йому інтерфейс, йому не потрібно при кожному оновленні сторінки заново авторизовуватись на цьому сайті.
Куки можна розділити на два типи — основні (куки того сайту, куди зайшов відвідувач) і сторонні (вони не відносяться до цього сайту, але присутні на відкритій сторінці). Прикладом джерела сторонніх кукісів може служити банер, який відображається на сторінці, але загружающийся зі стороннього сервера. У налаштуваннях браузерах прийом сторонніх куків можна відключити, що, власне, багато хто і робить.
Тим не менш ліміт, відведений для однієї статті, вичерпано, тому продовжимо розмову про кукіси і все інше, що дозволить нам освоїти науку осмисленого збору статистики сайту і роботи з побудованими на її основі звітами, в наступних публікаціях рубрики «Статистика сайту».
Продовження >>> (Тут можна підписатися на поштову розсилку з анонсами нових статей)
Удачі вам! До зустрічей на сторінках блогу