Raw data что это
Raw Data: 7 причин иметь под рукой «сырые» данные
Шани Розенфельдер, ведущий менеджер по маркетингу AppsFlyer, делится советами по использованию «сырых» данных для оптимизации рекламных кампаний, выявлению махинаций с трафиком и выбору партнеров.
Когда мы говорим о данных, то обычно ссылаемся на две категории: агрегированные и «сырые». Агрегированные отчеты представляют неоспоримую ценность – все данные уже собраны в дэшборде, а измеренные показатели представляют результаты основных KPI.
Для чего же эти, на первый взгляд, бесконечные строки и колонки с цифрами «сырых» данных, если агрегированные отчеты уже связали все метрики и показатели? В конце концов, инсайты формируются на закономерностях, а не на данных отдельных пользователей. И в этом случае агрегированные отчеты действительно представляют большую ценность – они понятны, их легко использовать в работе и, опираясь на выведенные закономерности, совершать почти мгновенные действия, оптимизируя или изменяя рекламных кампаний.
Но какую бы неоспоримую ценность не представляли отчеты в дэшбордах, их явно недостаточно. Почти каждому маркетологу и аналитику нужны данные в своем первоначальном, т.е. «сыром» виде. Более того, у вас должен быть постоянный доступ к собственным «сырым» данным, даже если пока вы не можете самостоятельно управлять их передачей через Push или Pull API в реальном времени.
Рассказываем, как мошенники убивают рекламные бюджеты и как защитить ваше приложение.
Итак, зачем нам «сырые» данные?
1) Кампании с прицельным таргетингом
Возможность проводить прицельные, узкотаргетированные кампании – это, пожалуй, самая важная причина получить доступ к «сырым» данным. Тщательный анализ таких данных поможет вам составить максимально точные пользовательские списки и когорты, формирующие ядро целевой аудитории для ретаргетинговых или даже шаблонных кампаний.
Например, мы говорим о ритейл-приложении: на основе IDFA вы можете выделить аудиторию и составить список пользователей, которые просмотрели определенный товар, но не совершили покупку. А если у вас игра, и вы работаете с ретаргетинговой сетью, которая способна собирать данные о комплексных событиях внутри приложения с многочисленными параметрами (rich-in app events), вы с легкостью составите список игроков, которые дошли до 25 уровня, совершили хотя бы одну покупку, но за последние четыре недели не провели ни одной игровой сессии.
2) Собственная кастомная аналитика
В большинстве своем агрегированные отчеты достаточно подробны, но вам может потребоваться собственный анализ, сформированный под конкретные нужды. С полноценным доступом к «сырым» данным вы или ваша команда аналитиков сможет использовать их как угодно: копайте так глубоко, как нужно вам! И, вполне возможно, вы сможете открыть для себя новые инсайты по разным срезам пользователей, их поведению и жизненному циклу.
3) Регулировать расхождения
В сложной и пока еще разрозненной мобильной экосистеме расхождения в показателях установочных кампаний – данность, с которой приходиться мириться. Причин для появления таких расхождений тысячи, будь то несостыковки с цифрами апсторов или рекламных сетей.
Вот несколько примеров спорных ситуаций по установочным кампаниям в рекламных сетях. Эти «разночтения» возникают по очень распространенным причинам, таким как:
Разные методы подсчета : сеть А выставляет рекламодателю счет за 10 000 установок, а трэкинг-провайдер приписывает этому источнику только 8 000. Если у рекламодателя есть доступ к «сырым» данным, он просто выгружает отчет из дэшборда и видит, что трэкинг-провайдер распределилспорные 2 000 инсталлов между другими сетями, которые обеспечили последний клик.
Основная причина таких расхождений – разные методы подсчета. Сеть А приписывает себе установки, фиксируя совпадение «клик-инсталл». Но! Рекламная сеть не может знать, что происходило после атрибутированного клика, у нее нет доступа к данным других сетей, она попросту не может отследить всю воронку конверсии.
Технические неполадки: рекламодатель видит установки в дэшборде, но их не видит рекламная сеть, так как не получает постбэков, а это чревато заморозкой кампании. В таких ситуациях рекламодатель может отфильтровать «сырые» данные по логам и выявить проблему (будь то ошибки в настройках или конфигурации), исправить ее или оперативно поделиться информацией о сбое с партнёрами и расследовать причины позже.
Расхождения в данных случаются и с апсторами, и вот почему:
Данные магазинов нельзя оспорить. Единственное, что можно сделать в такой ситуации – понять, что привело к расхождениям и решить, какой метод подсчета будете использовать вы.
Вот несколько способов выявить мошеннические действия при помощи «сырых» данных. Предположим, что речь идет о продвинутых мошенниках, способных создать новый идентификатор устройства. Наличие «сырых» данных поможет вам отследить подозрительную активность. В таких случаях надо искать определенные закономерности: множество установок или уникальных идентификаторов, которые приходят с одного IP, нелогичные временные промежутки инсталлов (каждую секунду, каждые пять секунд и т.д.) или обратить внимание на то, что большое число IDFA привязано к одному IDFV (идентификатор производителя).
5) Повторное вовлечение пользователя через сети, которые их привели
Вы можете связать «сырые» атрибуционные данные трэкинг-провайдера с собственными шаблонами и бизнес-моделями. Такие связки помогут вам проводить кампании по повторному вовлечению (re-engagement) через рекламные сети или каналы, которые привели этих пользователей. Например, мотивировать пользователей, приобретенных через кампанию в Tвиттере, писать твиты про ваш продукт.
Настройка передачи данных в режиме реального времени через push API имеет кучу преимуществ, так что вас не должно удивлять, что этой функцией пользуются даже самые продвинутые маркетологи. Но что произойдет, если вы получаете данные от трэкинг-провайдера только в режиме реального времени, а у вас сбои со связью? Ответ прост – вы потеряет все данные за период сбоя. Опция выгрузки «сырых» данных за определенный период из дэшборда застрахует от любых потерь.
7) Меняйте вендоров когда угодно
Наличие всего массива многоуровневых данных дает вам полную свободу. Имея под рукой «сырые» данные, вы всегда можете забрать их с собой и начать работать с другим поставщиком, тогда как без них вы фактически привязаны к одному вендору, который распоряжается вашими данными. Очевидная вещь, но многие даже не задумываются об этом. Все данные по вашим кампаниям и приложениям принадлежат вам и только вам и это ваш самый ценный актив.
БЕЗ «СЫРЫХ» ДАННЫХ ВЫ ПРАКТИЧЕСКИ ПРИВЯЗАНЫ К ЕДИНСТВЕННОМУ ПОСТАВЩИКУ
Для того, чтобы выжать максимум пользы из своих данных, нужно получить все логи, в идеале через API-трансфер (если вы поддерживаете эту функцию), либо через прямой доступ из дэшборда. Ведь для того, чтобы двигаться вперед, ваши тылы должны быть надежно прикрыты в любой ситуации.
AppsFlyer– аналитическая маркетинговая платформа для продвижения мобильных приложений и атрибуции мобильного трафика. Встроенный в мобильное приложение SDK AppsFlyer предоставляет рекламодателям комплексные данные об установках, конверсии и других показателях эффективности рекламных кампаний. Официальный партнер Facebook и Twitter по мобильному маркетингу. Список интегрированных партнеров AppsFlyer насчитывает более 1000 рекламных сетей, включая Yahoo!, Google, Bing, iAd и Criteo.
Авторы: Шани Розенфельдер, Александра Шпакова
Raw Data: 7 причин иметь под рукой «сырые» данные
Когда мы говорим о данных, то обычно ссылаемся на две категории: агрегированные и “сырые”. Агрегированные отчеты представляют неоспоримую ценность – все данные уже собраны в дэшборде, а измеренные показатели представляют результаты основных KPI.
Для чего же эти, на первый взгляд, бесконечные строки и колонки с цифрами “сырых” данных, если агрегированные отчеты уже связали все метрики и показатели? В конце концов, инсайты формируются на закономерностях, а не на данных отдельных пользователей. И в этом случае агрегированные отчеты действительно представляют большую ценность – они понятны, их легко использовать в работе и, опираясь на выведенные закономерности, совершать почти мгновенные действия, оптимизируя или изменяя рекламных кампаний.
Но какую бы неоспоримую ценность не представляли отчеты в дэшбордах, их явно недостаточно. Почти каждому маркетологу и аналитику нужны данные в своем первоначальном, т.е. “сыром” виде. Более того, у вас должен быть постоянный доступ к собственным “сырым” данным, даже если пока вы не можете самостоятельно управлять их передачей через Push или Pull API в реальном времени.
Итак, зачем нам “сырые” данные?
1) Кампании с прицельным таргетингом
Возможность проводить прицельные, узкотаргетированные кампании – это, пожалуй, самая важная причина получить доступ к “сырым” данным. Тщательный анализ таких данных поможет вам составить максимально точные пользовательские списки и когорты, формирующие ядро целевой аудитории для ретаргетинговых или даже шаблонных кампаний.
Например, мы говорим о ритейл-приложении: на основе IDFA вы можете выделить аудиторию и составить список пользователей, которые просмотрели определенный товар, но не совершили покупку. А если у вас игра, и вы работаете с ретаргетинговой сетью, которая способна собирать данные о комплексных событиях внутри приложения с многочисленными параметрами (rich-in app events), вы с легкостью составите список игроков, которые дошли до 25 уровня, совершили хотя бы одну покупку, но за последние четыре недели не провели ни одной игровой сессии.
2) Собственная кастомная аналитика
В большинстве своем агрегированные отчеты достаточно подробны, но вам может потребоваться собственный анализ, сформированный под конкретные нужды. С полноценным доступом к “сырым” данным вы или ваша команда аналитиков сможет использовать их как угодно: копайте так глубоко, как нужно вам! И, вполне возможно, вы сможете открыть для себя новые инсайты по разным срезам пользователей, их поведению и жизненному циклу.
3) Регулировать расхождения
В сложной и пока еще разрозненной мобильной экосистеме расхождения в показателях установочных кампаний – данность, с которой приходиться мириться. Причин для появления таких расхождений тысячи, будь то несостыковки с цифрами апсторов или рекламных сетей.
Вот несколько примеров спорных ситуаций по установочным кампаниям в рекламных сетях. Эти “разночтения” возникают по очень распространенным причинам, таким как:
Разные методы подсчета: сеть А выставляет рекламодателю счет за 10 000 установок, а трэкинг-провайдер приписывает этому источнику только 8 000. Если у рекламодателя есть доступ к “сырым” данным, он просто выгружает отчет из дэшборда и видит, что трэкинг-провайдер распределилспорные 2 000 инсталлов между другими сетями, которые обеспечили последний клик.
Основная причина таких расхождений – разные методы подсчета. Сеть А приписывает себе установки, фиксируя совпадение “клик-инсталл”. Но! Рекламная сеть не может знать, что происходило после атрибутированного клика, у нее нет доступа к данным других сетей, она попросту не может отследить всю воронку конверсии.
Технические неполадки: рекламодатель видит установки в дэшборде, но их не видит рекламная сеть, так как не получает постбэков, а это чревато заморозкой кампании. В таких ситуациях рекламодатель может отфильтровать “сырые” данные по логам и выявить проблему (будь то ошибки в настройках или конфигурации), исправить ее или оперативно поделиться информацией о сбое с партнёрами и расследовать причины позже.
Расхождения в данных случаются и с апсторами, и вот почему:
Данные магазинов нельзя оспорить. Единственное, что можно сделать в такой ситуации – понять, что привело к расхождениям и решить, какой метод подсчета будете использовать вы.
4) Мошенничество
Вот несколько способов выявить мошеннические действия при помощи “сырых” данных. Предположим, что речь идет о продвинутых мошенниках, способных создать новый идентификатор устройства. Наличие “сырых” данных поможет вам отследить подозрительную активность. В таких случаях надо искать определенные закономерности: множество установок или уникальных идентификаторов, которые приходят с одного IP, нелогичные временные промежутки инсталлов (каждую секунду, каждые пять секунд и т.д.) или обратить внимание на то, что большое число IDFA привязано к одному IDFV (идентификатор производителя).
5) Повторное вовлечение пользователя через сети, которые их привели
Вы можете связать “сырые” атрибуционные данные трэкинг-провайдера с собственными шаблонами и бизнес-моделями. Такие связки помогут вам проводить кампании по повторному вовлечению (re-engagement) через рекламные сети или каналы, которые привели этих пользователей. Например, мотивировать пользователей, приобретенных через кампанию в Tвиттере, писать твиты про ваш продукт.
6) Бэкап данных
Настройка передачи данных в режиме реального времени через push API имеет кучу преимуществ, так что вас не должно удивлять, что этой функцией пользуются даже самые продвинутые маркетологи. Но что произойдет, если вы получаете данные от трэкинг-провайдера только в режиме реального времени, а у вас сбои со связью? Ответ прост – вы потеряет все данные за период сбоя. Опция выгрузки “сырых” данных за определенный период из дэшборда застрахует от любых потерь
Подробнее:http://www.cossa.ru/articles/155/108982/
7) Меняйте вендоров когда угодно
Наличие всего массива многоуровневых данных дает вам полную свободу. Имея под рукой “сырые” данные, вы всегда можете забрать их с собой и начать работать с другим поставщиком, тогда как без них вы фактически привязаны к одному вендору, который распоряжается вашими данными. Очевидная вещь, но многие даже не задумываются об этом. Все данные по вашим кампаниям и приложениям принадлежат вам и только вам и это ваш самый ценный актив.
БЕЗ “СЫРЫХ” ДАННЫХ ВЫ ПРАКТИЧЕСКИ ПРИВЯЗАНЫ К ЕДИНСТВЕННОМУ ПОСТАВЩИКУ
Итого
Для того, чтобы выжать максимум пользы из своих данных, нужно получить все логи, в идеале через API-трансфер (если вы поддерживаете эту функцию), либо через прямой доступ из дэшборда. Ведь для того, чтобы двигаться вперед, ваши тылы должны быть надежно прикрыты в любой ситуации.
Купить Raw Data
СПЕЦИАЛЬНОЕ ПРЕДЛОЖЕНИЕ! Заканчивается через
Купить The Survios Collection НАБОР (?)
Купить VR PIONEER BUNDLE НАБОР (?)
Контент для этой игры Просмотреть все (1)
Рецензии
“Survios’ Raw Data is the most addictive single player first person shooter on VR. Full stop.”
TechCrunch
“It cannot be said enough: Raw Data is the best action VR experience available.”
Hardcore Gamer
“Raw Data. is intuitive, it’s challenging and it’s an incredible amount of fun.”
Polygon
Об этой игре
However, as the secrets behind Chairman Shiro’s new “Promotion” program becomes clear, the reality gets much more complicated. Does it really grant immortality? What is Eden truly collecting? It seems that Eden’s corporate veneer may be just a thin facade for something much, much worse.
Built from the ground up for virtual reality, Raw Data’s action combat gameplay, intuitive controls, challenging enemies, and sci-fi atmosphere will completely immerse you within the surreal environments of Eden Corp. Go solo—or team up with a friend—and become the adrenaline-charged heroes of your own futuristic technothriller. You will put your wits, boldness, and endurance to the test.
Active VR gameplay turns you into a controller, with instant reflex access to an arsenal of advanced weapons and cutting-edge nanotech powers. Shared spaces with avatars and motion tracking encourage players to physically communicate through body language and environment interaction.
Raw Data
Минимальные:
ОС: Windows 10
Процессор: Intel i5-4590
Оперативная память: 8 GB ОЗУ
Видеокарта: NVIDIA GeForce GTX 970
DirectX: Версии 11
Место на диске: 10 GB
Рекомендуемые:
ОС: Windows 10
Процессор: Intel i7-4770
Оперативная память: 16 GB ОЗУ
Видеокарта: NVIDIA GeForce GTX 980 Ti
DirectX: Версии 12
Место на диске: 10 GB
Raw Data – это очень красивый мир сюрреализма и научной фантастики для шлемов виртуальной реальности. В 2271 году всем миром владеет корпорация «Эдем», имеющая планы заменить население планеты на роботов! Единственное сопротивление исходит из некой хакерской группы, способной разрушить зловещие планы. Игрокам в роли лучших хакеров в мире предстоит пробраться в башню Эдема и уничтожить корпорацию изнутри.
Кооперативный геймплей технотриллера делит дуэт хакеров – один герой проникает в смертельно опасную башню, а второй прикрывает ему спину посредством влияния на сетевые протоколы. Активный хакер может выбрать класс, передовое вооружение и ультимативные способности, что очень пригодится в битвах с невидимыми ниндзя, ракетными тяжеловесами, летающими дронами, мегаботами и прочими охранниками корпорации.
Используем Raw Data в Google Analytics на практике
Мы долго считали, что стандартные инструменты Google Analytics – лучший способ получить полезную информацию. Временами приходилось сталкиваться с некоторыми ограничениями и весьма странными результатами, и казалось, этому нет конца и края, пока некоторые аналитики не открыли для себя Google Analytics 360 и механизмы экспорта необработанных данных в Google BigQuery.
Спустя всего несколько часов работы с более продвинутыми инструментами и SQL-запросами, мы смогли извлечь информацию, которую бы никогда не получили, используя только сводные отчеты Google Analytics. С того момента мы сосредоточились на изучении особенностей необработанных («сырых») данных и на том, какую практическую пользу из них могут извлечь специалисты в области веб-аналитики.
В этой статье есть ответы на следующие вопросы:
Чем отличаются raw и сводные данные в Google Analytics
Используя бесплатную версию сервиса Google Analytics, можно получать только сводные данные. То есть, полная информация о просмотрах для конкретного визита и события будет недоступна. Разумеется, отчет User Explorer содержит много полезной информации, которую могут использовать веб-аналитики. Однако на этот файл наложены определенные ограничения: он не масштабируется и недоступен для скачивания.
В большинстве случаев наличия лишь сводных данных достаточно для получения ответов на распространенные вопросы:
Почему стандартные отчеты Google Analytics не содержат этих данных? Основная причина заключается в вычислительных затратах. Предоставляя только выборочные сводные данные, отпадает необходимость в обработке миллионов строк, содержащихся в отчете. Поэтому бесплатная версия Google Analytics не содержит инструментов для выполнения расширенных вычислений на бесплатной основе.
Какую информацию можно извлечь из необработанных данных
Понимая ограниченность сводных данных, пришло время узнать, как можно использовать необработанные данные. Рассмотрим несколько вариантов их применения.
Длительность ивентов
Одно из ограничений, с которым сталкивается любой веб-аналитик, использующий стандартные инструменты Google Analytics – нельзя определить временной интервал между помещением товара в корзину и оформлением покупки, независимо от того, происходит это действие в рамках одного сеанса или нет. Разумеется, для этого можно использовать cookies и проводить собственные расчеты. Но это бессмысленно, тем более что Google Analytics уже проделали эту работу за нас.
Проведя анализ необработанных данных, можно легко определить точное время возникновения события для конкретного пользователя, провести сравнительный анализ с другим событием для этого же пользователя. Также можно агрегировать данные на свое усмотрение, получив среднее, медианное или процентильное распределение, или использовать другую продвинутую статистическую модель. Разве тот факт, что 20% пользователей выполняют целевое действие за 2 минуты, а 10% — в течение целой недели, не имеет никакого значения? С этими знаниями вы будете использовать различные подходы для взаимодействия с этими двумя категориями пользователей.
Анализ объема аудитории
В отчетах как Google Analytics, так и Google Analytics 360 содержатся данные о сегментации посетителей на протяжении последних 90 дней. Зачастую для получения достоверных данных требуется проведение анализа на более длинных дистанциях (особенно это касается крупных компаний). На основе анализа необработанных данных можно получать ответы на следующие вопросы:
Взаимосвязи между данными
Коэффициент корреляции вводят для определения статистической взаимосвязи между двумя переменными значениями. При анализе больших объемов данных можно определять взаимоотношения между двумя типами поведения пользователей:
Сторонние данные
Последнее, но не менее важное, — необработанные данные позволяют получать намного больше информации, если подключить другие источники данных. Ниже приведены несколько наглядных примеров:
Данные электронной коммерции. Инструмент приносит наибольшую пользу в том случае, если вы сохраняете идентификатор клиента в Google Analytics, выполнявшим любые действия по добавлению в корзину или оформлению заказа. Это позволит рассчитать точное значение коэффициента конверсии, даже если инструменты Google Analytics не сработали (из-за используемых клиентами блокировщиков рекламы, отсутствия редиректа со страницы оплаты, длительного времени ожидания загрузки страницы и прочих причин). Кроме того, основываясь на собственных данных, вы сможете исключить отмененные целевые действия и возвраты для перерасчета реальной прибыли. Также это позволяет рассчитывать более сложные и закрытые показатели, например, маржу вместо дохода.
Данные CRM. Что может быть хуже, чем то, что в огромном множестве лидов содержится большое количество нерелевантных лидов? Это распространенная проблема для B2B онлайн сервисов. Экспортируя данные CRM с уникальными идентификаторами лидов (идентификатор клиента, зашифрованный с помощью SHA-256 e-mail, сгенерированный идентификатор и прочие), можно легко связывать их с идентификаторами клиентов в Google Analytics. Это позволит рассчитывать не только процент сгенерированных лидов, а и коэффициент конверсии. Для многоканального анализа потребуются более сложные запросы, однако вы сможете полностью контролировать процессы вычислений.
Для проведения такого анализа необходимо собрать информацию и предоставить ее в удобочитаемом формате. Выполнив это, вы будете обладать актуальными и востребованными данными.
Объявления, поисковые роботы, логи – все эти данные следует хранить в едином хранилище.
Научившись сопоставлять их с аналитическими данными, вы сможете воплотить в реальность самые смелые мечты:
Инструменты для извлечения необработанных данных
Информация, представленная выше, говорит в пользу необработанных данных. Но как их получить? Рассмотрим несколько наиболее распространенных способов.
Google Analytics 360
Если вам повезло получить доступ к этому сервису или вы располагаете достаточным бюджетом для оплаты стоимости его использования, в ваших руках находится лучший инструмент для извлечения необработанных данных в Google BigQuery. Он позволяет экспортировать любую информацию, включая расширенные данные электронной коммерции. Каждой строке соответствует определенный сеанс, и вы сможете использовать огромное количество параметров и метрик.
Google Analytics App+Web и Firebase
С недавнего времени веб-аналитики получили возможность экспортировать данные в Google BigQuery без необходимости покупки Google Analytics 360. Firebase, который является ядром Google Analytics App+Web, поддерживает функционал экспорта в Google BigQuery. Вам будет выставлен счет Blaze, который использует подход «оплата по мере использования». Если у вас крупный интернет портал, вам придется следить за своим бюджетом. Для небольших сайтов затраты составят от совсем ничего до всего нескольких долларов в месяц.
Каждой строке соответствует событие, содержащее скрин или просмотр страницы. Вам придется привыкнуть к этому весьма специфическому способу представления данных, который отличается от используемого в Google Analytics. Однако, этот сервис может стать лучшим решением для тех, кто желает использовать необработанные данные.
Прочие бесплатные инструменты: Яндекс.Метрика и Matomo
Я не смог опробовать каждый инструмент, поскольку многие из них являются платными. Каждый из них содержит функционал экспорта необработанных данных. Однако, существует два абсолютно бесплатных онлайн сервиса, которые предлагают тот же функционал и не взимают плату за их использование.
Яндекс.Метрика – абсолютно бесплатный инструмент, который предоставляет доступ к необработанным данным через API его логов. Matomo – инструмент аналитики с открытым исходным кодом, который необходимо устанавливать непосредственно на ваш сервер, на котором находятся файлы сайта. Он экспортирует необработанные данные непосредственно в вашу БД.
Конвейер данных
Еще один способ выгрузки данных Google Analytics непосредственно в ваше хранилище данных – конвейер данных. OWOX BI организовывает мощный поток данных между Google Analytics и BigQuery. Для реализации функционала необходимо создать кастомную задачу в Google Analytics. Он формирует копии полезной нагрузки Google Analytics и переносит в конечное хранилище данных.
Имея достаточный опыт, вы сможете самостоятельно создать собственную конечную точку выгрузки данных с использованием функционала облачного сервиса и на основе анализа лога. Ниже приведены два полезных ресурса, которые помогут вам разобраться в этом:
Симо Ахава – «Как сформировать GTM-монитор». После прочтения этой статьи вы узнаете, как отправлять данные в BigQuery с помощью облачных функций. Объемы передаваемых данных ограничены 100000 строк в секунду, которые можно интегрировать в сервис BigQuery. Если количество строк превышает указанное выше максимальное значение, вам придется группировать данные из нескольких логов.
Справочный центр Google Cloud – «Serverless Pixel Tracking Architecture». В этом источнике рассмотрен механизм создания собственного пикселя отслеживания с последующей интеграцией в BigQuery.
Примеры и частные случаи использования BigQuery
Теперь вы знаете о преимуществах использования необработанных данных и способах получения доступа к ним. Теперь рассмотрим несколько примеров, которые наглядно демонстрируют принципы работы с этими данными.
Установление взаимосвязи между тематиками и целевыми действиями в Google Analytics 360
Анализ был проведен для новостного сайта с онлайн подписчиками. Основная задача анализа состояла в том, чтобы установить взаимосвязь (корреляцию) между тематикой новостей, которые читают пользователи, и выполняемыми целевыми действиями.
Полученный результат и выводы:
corr_culture 0.397
corr_opinion 0.305
corr_lifestyle 0.0468
corr_sport 0.009
Наиболее вероятная категория тех, кто оформит подписку на сайт, — это пользователи, интересующиеся рубриками «Культура» и «Мнения». С другой стороны, если пользователь интересуется рубриками «Стиль жизни» или «Спорт», вероятность оформления им подписки является минимальной.
Когортный анализ с использованием Firebase
Для проведения анализа было взято приложение с регулярно обновляемым контентом и высоким показателем сезонности. Анализ проводится для поиска ответов на следующие вопросы:
Как ведут себя пользователи, которые впервые установили это приложение?
Какой момент времени является наилучшим для привлечения клиентов, которые будут использовать приложение на регулярной основе?
Полученный результат и выводы:
Судя по полученным данным, приложение чаще всего используют клиенты, которые загрузили его впервые в сентябре и декабре.
Выводы
Скорее всего в ближайшем будущем грядут серьезные изменения, и Google App+Web станет чем-то вроде отраслевого стандарта. Этот подход обеспечивает более тесную интеграцию между сервисами Google, такими как Marketing Platform и Google Cloud Platform, и особенно BigQuery. Если вы утратили навыки по созданию SQL-запросов (язык для работы с СУБД), я настоятельно рекомендую вам освежить информацию в своей памяти и потренироваться на практике.
Расширенная цифровая аналитика данных становится все более мощным инструментом благодаря простому доступу к необработанным данным, быстрым и эффективным вычислительным процессам, а также хорошей визуализации информации. В ближайшем будущем будет реализована еще более тесная интеграция с другими типами бизнес-данных.
Уже на протяжении многих лет эксперты утверждают, что цифровая и бизнес аналитика должны работать сообща. Медленно, но уверенно мы идем по пути воплощения этой идеи в реальность.