Google lança Containers: ambientes portáteis e consistentes para machine learning

O trabalho de um desenvolvedor de machine learning não começa com a escolha de um modelo ou o pré-processamento dos dados, mas antes disso, com a definição do ambiente de trabalho. A maioria das bibliotecas utilizadas em machine learning estão em constante atualização, o que inclui o próprio Python. Com isso, de uma versão para outra, alguns módulos, comandos ou até mesmo a forma de representar dados podem mudar. Levando em consideração que um desenvolvedor usa várias bibliotecas, algumas delas dependentes de resultados das outras, dá pra imaginar como pode se tornar complicado estruturar um ambiente de trabalho consistente, com compatibilidade interna. Se pensarmos na linha inteira de utilização da solução em machine learning – desenvolvimento, máquinas virtuais, data center local e nuvem pública -, a tarefa se torna ainda mais trabalhosa.

No final de junho, o Google apresentou, em caráter beta, uma solução para essa etapa do projeto: os Containers para Deep Learning. A proposta é que esses containers sejam pacotes pré-montados, otimizados para performance, e testados para compatibilidade, para que o desenvolvedor tenha a possibilidade de iniciar a fase de implementação do modelo imediatamente. Assim, é possível usar o mesmo container nas fases seguintes do projeto, garantindo a reprodutividade e a exatidão dos resultados alcançados na etapa de desenvolvimento. O Google fica responsável por manter esses containers atualizados e consistentes quando novas versões das bibliotecas forem disponibilizadas.

Os containers têm integração total com os demais serviços da Google Cloud Platform, tornando fácil o escalonamento do projeto na nuvem, mas ainda assim é possível optar pelo desenvolvimento local. É até possível usar o container em outras plataformas na nuvem, usando o Google Kubernetes Engine. Eles também fornecem versões do TensorFlow otimizadas para trabalhar com GPUs da NVIDIA ou CPUs da Intel. Desenvolvedores podem usar os containers como base para construir suas próprias imagens incluindo os modelos para treinamento e inferência.

No link de anúncio do serviço, está disponível um breve tutorial com os primeiros passos para utilização dos containers. Os containers para deep learning são grátis para baixar e usar localmente. Se há interesse em usá-los na nuvem, atualmente o Google oferece 300 dólares de crédito com duração de um ano para novos usuários.