-
Наша Бизнес цель: Как мы используем фичу, что мы хотим проверить
- 1) Наименование и описание
- 2) Цель
- 3) Формулируем гипотезу
- Определяем Бизнес-ценность гипотезы
-
Общая информация
- Роли сотрудников, которые будут работать с гипотезой
- Сценарий ее использования для каждой из ролей
-
Контекст использования и формат взаимодействия (ноут/мобайл, демо/отчетность/плановая работа)
- Частота использования
- Важные продуктовые требования (например, категорически нельзя делать ложные срабатывания или требования к конфиденциальности данных, что нельзя хранить какую-то инфу и тд)
- Как сейчас решается проблема, если решается, какие есть источники данных и как сейчас уже с ними идет работа ( можно ли получить эти данные для сравнение полученных результатов)
- в какое время суток нужно трекать данные: рабочие часы, 24/7
-
Данные: что получаем и как
-
3) Данные:
- что является источником данных
- какие требования к данным
-
4) Камера:
- требования к разрешению изображения
- где должна быть установлена
- какой угол обзора камеры требуется?
- если мы трекам данные в неосвещенном помещение, то какие требования к камере?
- кол-во камер
- как будем решать вопрос, если камер несколько? будем стоить трехмерные модели?
- нужна ли аудиозапись
-
5) Как мы обрабатываем данные:
-
нужна ли разметка
- можем ли использовать Толоку или другие краундинговые сервисы разметки
- 6) Есть ли какие-то внешние зависимости кроме видеопотока (например, информация с терминала)
-
Расчет: что мы получаем на выходе:
- 7) Как считаем метрику- математика наше все
-
8) Что получаем на выходе:
- Какой отчет будем формировать?
- С каким шагом нужно трекать динамику изменения метрики?
- Нужна ли детализация динамики, ее медиана/среднее/пороговые значения?
- Какие пороговые значения метрики для алертинга?
- 9) Какая получаемая точность. Какой процент допустимых ошибок и на каких изображениях
- 10) Как можем графически представлять результаты и можем ли?
-
11) Какие оповещение нужны и в какой момент они должны срабатывать:
- смс
- телеграм-бот
- и тд
-
12) Производственные мощности для обработки гипотезы (быстродействие железа):
- какие сейчас показатели
- что нужно
-
13) как часто нам нужно обрабатывать и отображать изменение данных:
- реалтайм
- ночная выгрузка и обработка
- 14) как мы начинаем работы с метрикой? если это терминал/окно, с которым мы фиксируем взаимодействие, то как и где мы его отмечаем как объект анализа
-
Доставка гипотезы, поддержка и обновление и не только:
-
15) какой метод приемки каждой гипотезы:
- на собранных доменных данных
- на открытых данных (например, поджигать не будем ничего)
- что будем делать, если нет данных для старта работы модели
- что будем делать, если тестовые данные отличаются от продакшена- могут ли отличаться?
- 16) Потенциальные риски и эдж-кейсы (что может пойти не так всех этапах - от сбора и разметки до моделирования, оценки результатов и использования в проде, вероятность возникновения и возможные последствия)
- 17) потребуется ли поддержка и обновление модели, как будет происходить процесс обновления.
- 18) приёмка на ретроспективных данных - это хорошо, а как будет происходить валидация в продакшне? потребуется ли какой-то мониторинг, какой период тестовый? какие вообще сценарии использования?
- 19) мониторинг поведения модели, как мы будем убеждаться, что наша модель работает корректно и не переобучилась и не эволюционировала непонятно куда
-
Это будет интересно
- Строим Дашборд правильно
- Статистика: Задача- Метод. A/B Testing. Statistical tests (Ru, En)
- ML-продукты. Разбираем основы
- Some notes about A/B Testing (V 2.0)
- Some notes about Exploratory Data Analysis (Python and Pandas)