Colocar modelos de Machine Learning (ML) em produção é um desafio constante, especialmente com times descentralizados, tecnologias variadas e a necessidade de integrar sistemas legados. Este artigo científico detalha como o Itaú Unibanco enfrentou essa complexidade.
O problema central estava relacionado à dificuldades em gerenciar o ciclo de vida completo de modelos de ML, passando por etapas como a concepção do problema na área de negócio e desenvolvimento do modelo, até chegar na publicação do modelo em produção e o monitoramento contínuo. Estes desafios são ainda agravados pela descentralização e diversidade tecnológica/de dados que estão divididas em camadas de SOR, SOT e SPEC.
A solução desenvolvida e apresentada neste texto foi de construir uma plataforma de MLOps unificada. O Itaú investiu na construção de uma plataforma MLOps, rodando em nuvem pública combinando soluções proprietárias, open-source e também cloud-native, cada uma com seu benefício específico para simplificar e padronizar o processo em todas as áreas do banco.
A criação desta plataforma de MLOps robusta, focada nas necessidades dos usuários e com forte governança, foi peça chave para superar os desafios da publicação de modelos de ML em larga escala, permitindo que o Itaú extraísse valor da ciência de dados de forma mais rápida, segura e eficiente.
O artigo intitulado “Automação no processo de publicação de modelos de Ciência de Dados“, foi publicado e apresentado no XIII Congresso Brasileiro de Software: Teoria e Prática, e está disponível para leitura completa neste link.
Para citações, utilize:
NOGARE, Diego; MELLO, Rodrigo Fernandes; LOPES, Marco Antonio. Automação no processo de publicação de modelos de Ciência de Dados. In: TRILHA DA INDÚSTRIA – CONGRESSO BRASILEIRO DE SOFTWARE: TEORIA E PRÁTICA (CBSOFT), 13. , 2022, Uberlândia/MG. Anais […]. Porto Alegre: Sociedade Brasileira de Computação, 2022 . p. 40-43. DOI: https://doi.org/10.5753/cbsoft_estendido.2022.226925.