Тестовое задание: Аналитик данных (транспорт + ценообразование)
Задание 1 — Геолокационные данные
Описание:
Есть таблица с данными о геолокации автомобиля. Данные поступают каждую минуту, но возможны пропуски (интервалы могут быть нерегулярны). Все поля всегда заполнены.
Структура данных:
Поле | Тип | Описание |
---|---|---|
car_id |
integer | Уникальный идентификатор машины |
latitude |
numeric | Широта |
longitude |
numeric | Долгота |
datetime |
timestamp | Время замера |
Требуется:
Написать SQL-запрос или Python-скрипт, который определяет, какой автомобиль провёл больше всего времени без движения в течение дня.
Задание 2 — Эксперимент по эластичности спроса
Компания хочет спрогнозировать поведение пользователей в зависимости от цены (эластичность). Неудачные эксперименты с ценами привели к падению метрик, поэтому требуется продуманный эксперимент.
📊 Требуется:
Разработать стратегию и механику A/B-эксперимента, учитывая:
- В регионе 10 000 активных пользователей.
- Как построить эксперимент?
- Какие данные необходимо собрать?
- Как сегментировать пользователей? Сколько сегментов?
- Длительность эксперимента.
- Как оценить успех или провал ещё до запуска?
- Численные индикаторы: статистическая мощность, размер выборки.
- Ключевые метрики: поездки, выручка, churn rate и т.д.
- Интерпретация результатов для принятия решений.
- Как учитывать различные типы продуктов (краткосрочные / долгосрочные аренды).
- Какие дополнительные параметры сегментации рассмотреть (например, поведение, стаж, доход, источник привлечения и т.п.).
📁 Файл с данными по поездкам за последние 3 месяца прилагается.
Готовое решение необходимо представить в виде:
- Python-скрипта (или Jupyter Notebook),
- Чётких текстовых рекомендаций (можно в виде отчёта),
- Таблиц и графиков (если применимо).
Формат отправки: ссылка на репозиторий (GitHub / GitLab / Bitbucket) или zip-архив проекта.