Наша Бизнес цель: Как мы используем фичу, что мы хотим проверить
1) Наименование и описание
2) Цель
3) Формулируем гипотезу
Определяем Бизнес-ценность гипотезы
Общая информация
Роли сотрудников, которые будут работать с гипотезой
Сценарий ее использования для каждой из ролей
Контекст использования и формат взаимодействия (ноут/мобайл, демо/отчетность/плановая работа)
Частота использования
Важные продуктовые требования (например, категорически нельзя делать ложные срабатывания или требования к конфиденциальности данных, что нельзя хранить какую-то инфу и тд)
Как сейчас решается проблема, если решается, какие есть источники данных и как сейчас уже с ними идет работа ( можно ли получить эти данные для сравнение полученных результатов)
в какое время суток нужно трекать данные: рабочие часы, 24/7
Данные: что получаем и как
3) Данные:
что является источником данных
какие требования к данным
4) Камера:
требования к разрешению изображения
где должна быть установлена
какой угол обзора камеры требуется?
если мы трекам данные в неосвещенном помещение, то какие требования к камере?
кол-во камер
как будем решать вопрос, если камер несколько? будем стоить трехмерные модели?
нужна ли аудиозапись
5) Как мы обрабатываем данные:
нужна ли разметка
можем ли использовать Толоку или другие краундинговые сервисы разметки
6) Есть ли какие-то внешние зависимости кроме видеопотока (например, информация с терминала)
Расчет: что мы получаем на выходе:
7) Как считаем метрику- математика наше все
8) Что получаем на выходе:
Какой отчет будем формировать?
С каким шагом нужно трекать динамику изменения метрики?
Нужна ли детализация динамики, ее медиана/среднее/пороговые значения?
Какие пороговые значения метрики для алертинга?
9) Какая получаемая точность. Какой процент допустимых ошибок и на каких изображениях
10) Как можем графически представлять результаты и можем ли?
11) Какие оповещение нужны и в какой момент они должны срабатывать:
смс
телеграм-бот
и тд
12) Производственные мощности для обработки гипотезы (быстродействие железа):
какие сейчас показатели
что нужно
13) как часто нам нужно обрабатывать и отображать изменение данных:
реалтайм
ночная выгрузка и обработка
14) как мы начинаем работы с метрикой? если это терминал/окно, с которым мы фиксируем взаимодействие, то как и где мы его отмечаем как объект анализа
Доставка гипотезы, поддержка и обновление и не только:
15) какой метод приемки каждой гипотезы:
на собранных доменных данных
на открытых данных (например, поджигать не будем ничего)
что будем делать, если нет данных для старта работы модели
что будем делать, если тестовые данные отличаются от продакшена- могут ли отличаться?
16) Потенциальные риски и эдж-кейсы (что может пойти не так всех этапах - от сбора и разметки до моделирования, оценки результатов и использования в проде, вероятность возникновения и возможные последствия)
17) потребуется ли поддержка и обновление модели, как будет происходить процесс обновления.
18) приёмка на ретроспективных данных - это хорошо, а как будет происходить валидация в продакшне? потребуется ли какой-то мониторинг, какой период тестовый? какие вообще сценарии использования?
19) мониторинг поведения модели, как мы будем убеждаться, что наша модель работает корректно и не переобучилась и не эволюционировала непонятно куда