Меморандум · v1.0 · апрель 2026

Оценка готовности данных для Strategy & Insights

Фундамент данных TrueMind близок к рабочему. Поведение, платежи и игровая активность собираются и доступны через Athena. Стратегические ответы по росту требуют нормализованной атрибуции, чистого гео, причин отказа платежей, контекста релизов и таксономии фич.

01 · Executive summary

Главное за 30 секунд

Каталог ≠ метрики

OpenMetadata описывает структуру таблиц и колонок. Сами метрики живут в Athena и считаются запросами.

Источники найдены

PostHog-события, заказы/платежи, агрегатор ставок и сводка по игроку. Достаточно, чтобы строить воронки и когорты.

Слепые зоны критичны

Атрибуция, чистое гео, причины отказа платежей, контекст релизов и таксономия фич — без них стратегические ответы будут шаткими.

Гардрейл анализа

Никаких выводов по Reg2Dep без сегментации geo × aff_id. Микс аффилиатов искажает агрегаты.

02 · Data map

Поток данных

От описания структуры до ответа на бизнес-вопрос — четыре шага.

  1. 1

    OpenMetadata

    Каталог таблиц, колонок, владельцев. Используется для дискавери и проверки схемы.

  2. 2

    Athena

    Источник правды для метрик: события, заказы, ставки, агрегаты по игроку.

  3. 3

    Аналитические скрипты

    Воронки, когорты, драйверы, churn-фичи, разложение выручки.

  4. 4

    Ответы Product / Growth

    Меморандумы, дашборды, гипотезы для экспериментов.

03 · Источники данных

Что доступно в Athena

posthog_events

поведение

Фронтовые события: клики, экраны, формы. Часовая и дневная агрегации.

  • event
  • timestamp
  • brand_id
  • user_id · person_id
  • properties

Также: posthog_events_hourly, posthog_events_daily.

orders

платежи

Платёжные операции: депозиты, выводы, статусы.

  • type_order
  • status
  • amount_eur · currency_code
  • brand_pay_system_id
  • user_id

Также: orders_hourly.

aggregator_requests

игровая активность

Транзакции ставок и выигрышей по сессиям и играм.

  • amount_eur
  • game_id · session_id
  • action · status

Также: aggregator_requests_hourly.

player_summary

агрегаты

Профиль игрока, готовый к когортному анализу.

  • total_sessions
  • distinct_games
  • total_bet · total_win
  • last_activity_at

04 · Матрица ответимости

Как 15 вопросов ложатся на текущие данные

Статусы: да — отвечается на текущих данных, частично — нужны допущения и сегментация, блок — без новых параметров вывод недостоверен.

Вопрос Статус Что нужно сверх текущих данных
1Факторы Click → FTDчастичноЧистая таксономия событий, aff_id, гео.
2Паттерны пути до депозитада
3Платящие vs неплатящиеда
4Драйверы выручкичастичноGGR / NGR, бонусы, fee, рефанды.
5Действия, коррелирующие с FTDда
6Причины падения Reg2DepчастичноКоды ошибок платежей, причины отказа, гео × aff_id.
7Причины падения Click2RegчастичноИсточник трафика, лендинг, ошибки валидации.
8Точки роста в воронкечастичноЧистая таксономия шагов и сегментация.
9Эффект релизовблокrelease_id, feature_flag_*, тайминги деплоя.
10Сегменты с высоким LTVчастичноNGR, бонус-кост, lifecycle-метки.
11Самые ценные пользователичастичноПрибыльность, fraud_loss, chargebacks.
12Сигналы churnчастичноМетки churn_status, окна неактивности, CRM-кампании.
13Различия по геоблокЧистый country_code, регистрационная и IP-страна, локаль.
14Ценность фич продуктаблокТаксономия фич: exposure / click / success / error / version.
153 главных инсайта ростачастичноСводный вывод после закрытия P0-пробелов.

05 · Исходный запрос

Исходные вопросы

Полный список из 15 формулировок, полученных на вход — без редактуры.

  1. 01

    Проанализируй, какие факторы сильнее всего влияют на конверсию Click → FTD.

  2. 02

    Найди поведенческие паттерны пользователей, которые доходят до депозита.

  3. 03

    Сравни поведение платящих и неплатящих пользователей.

  4. 04

    Определи ключевые драйверы роста выручки в продукте.

  5. 05

    Найди действия, которые максимально коррелируют с FTD.

  6. 06

    Определи основные причины падения Reg2Dep.

  7. 07

    Определи основные причины падения Click2Reg.

  8. 08

    Найди точки роста в воронке.

  9. 09

    Определи, какие изменения после релиза повлияли на метрики.

  10. 10

    Найди сегменты пользователей с самым высоким LTV.

  11. 11

    Определи, какие пользователи приносят наибольшую ценность.

  12. 12

    Найди поведенческие сигналы, предсказывающие churn.

  13. 13

    Проанализируй различия поведения по гео.

  14. 14

    Определи, какие функции продукта дают максимальную ценность.

  15. 15

    Сформулируй 3 главных инсайта для роста продукта.

06 · Пробелы данных

Недостающие нормализованные параметры

Сгруппировано по приоритету. P0 закрывает большинство стратегических вопросов.

P0

Атрибуция

  • aff_id, affiliate_name
  • campaign_id, utm_source/medium/campaign/content/term
  • click_id, sub_id
  • traffic_source, landing_page_id
P0

География

  • country_code, country_name
  • registration_country, ip_country, kyc_country
  • locale, timezone
P0

Причины отказа платежей

  • payment_error_code, provider_error_code
  • provider_name, payment_method
  • failure_stage, attempt_id
P1

Релизы и эксперименты

  • release_id, release_timestamp
  • feature_flag_name, feature_flag_variant
  • experiment_id, experiment_group
  • Тайминги деплоя и отката
P1

Прибыльность

  • GGR, NGR, net_margin
  • bonus_cost, cashback_cost, payment_fee
  • chargebacks, refunds, fraud_loss
  • CAC / CPA, revenue share
P1

Lifecycle и CRM

  • registration_date, first_deposit_date, last_deposit_date
  • user_status, kyc_status, risk_status, vip_status, churn_status
  • crm_campaign_id, бонусные офферы
P2

Устройство и техника

  • device_type, os, browser
  • app_version, web_version, screen_size
  • domain, pathname, referrer
P2

Сессии

  • session_id, session_start/end, session_duration
  • events_per_session
  • entry_page, exit_page, is_bounced, logged_in_state
P2

Таксономия событий и фич

  • click, registration_start / success
  • deposit_open / call / success / failed
  • KYC, validation_error, feature_usage
  • feature: name, category, exposure, click, success, error, version, availability, flag_variant

07 · Toolkit

Аналитические скрипты

Минимально достаточный набор Python-модулей для повторяемого анализа.

truemind_growth_analysis/
├── config.yaml
├── athena_client.py
├── metadata_discovery.py
├── event_dictionary.py
├── funnel_builder.py
├── segment_extractor.py
├── cohort_builder.py
├── driver_analysis.py
├── sequence_mining.py
├── revenue_decomposition.py
├── churn_features.py
└── report_generator.py

08 · Усилия и сроки

Сколько займёт прохождение по 15 вопросам

3–5 ч

Быстрый диагноз

Подтверждение источников, базовая воронка, перечень слепых зон.

≈ 1 раб. день

Стандартный ответ

Все 15 вопросов для одного бренда и периода в текущей полноте данных.

1.5–2 дня

Высокая уверенность

С валидацией, исключением грязи, сегментацией geo × aff_id, проверкой релизов, LTV и churn.

09 · Guardrails

Аналитические ограничения

Никаких агрегатных выводов по Reg2Dep без сегментации

Минимум — geo × aff_id. Микс аффилиатов и стран маскирует реальные провалы и завышает кажущиеся улучшения.

Релизы без идентификаторов — не доказательство

Сравнения «до / после» без release_id и feature_flag_variant подвержены сезонности и кампанийному шуму.

LTV считается по NGR, а не по депозитам

Без бонус-коста, fee и chargeback цифры будут систематически завышены.

10 · Рекомендация

Что делать дальше

  1. Закрыть P0-пробелы: атрибуция, гео, причины отказа платежей. Это разблокирует большинство стратегических вопросов.
  2. Подключить контекст релизов: release_id, feature_flag_*. Это снимает блок с вопроса №9 и усиливает №8.
  3. Зафиксировать таксономию событий и фич: единый словарь без переименований. База для воронок, экспериментов и оценки фич.
  4. Параллельно — быстрый диагноз за 3–5 часов: чтобы получить первые честные ответы уже сейчас и приоритизировать дальнейшие шаги.