Для понимания экосистемы в данном отчете рабочий процесс машинного обучения разбит на пять этапов - подготовка данных, построение модели, валидация модели, ее обслуживание и наблюдение. Понимание целей и задач каждого этапа рабочего процесса поможет принять обоснованное решение о том, какие платформы инфраструктуры ML лучше всего подходят для нужд вашего бизнеса.

5 стадий:
Подготовка данных
На ранних стадиях конвейера исходные данные поступают из различных хранилищ данных и озер в организации. Следующий этап включает обработку данных для очистки, преобразования и извлечения объектов для получения согласованных входных данных на этапе выбора объектов. Этап подготовки данных включает в себя ряд шагов: поиск данных, обеспечение полноты, добавление меток и преобразования данных для создания функций.
Построение модели
Этот шаг начинается гораздо дальше, на этапе планирования и разработки идей рабочего процесса ML. На этом этапе, аналогичном жизненному циклу разработки программного обеспечения, специалисты по обработке данных собирают требования, рассматривают осуществимость и создают план подготовки данных, построения модели и производства. На этом этапе они используют данные для изучения различных экспериментов по построению моделей, которые они рассматривали на этапе планирования.
Валидация модели
Производственная среда, безусловно, является наиболее важной и, что удивительно, наименее обсуждаемой частью жизненного цикла модели. Именно здесь модель соприкасается с бизнесом. Это когда решения, принимаемые моделью, на самом деле улучшают результаты или вызывают проблемы у клиентов. Учебные среды, где специалисты по обработке данных проводят большую часть своего времени и размышлений, состоят всего лишь из образца того, что модель увидит в реальном мире.
Обслуживание модели
После того, как модель была обучена, построена и валидирована, наконец-то пришло время развернуть и обслуживать модель. В этом последний шаг ML, вся работа предыдущих шагов, наконец, используется моделью, управляемой данными.
Наблюдение
Наблюдаемость модели начинается с процесса сбора оценок модели в таких средах, как обучение, валидация и производство, а затем связывания их вместе с аналитикой, которая позволяет связать эти точки для решения инженерных задач ML.