A Red Hat, referência em soluções open source, anunciou o Red Hat AI 3, atualização de sua plataforma empresarial de IA que reúne as inovações do Red Hat AI Inference Server, Red Hat Enterprise Linux AI (RHEL AI) e Red Hat OpenShift AI. O objetivo é simplificar a inferência de IA em escala e acelerar a passagem de provas de conceito para aplicações de produção, além de melhorar a colaboração entre equipes de TI.
Inferência de IA empresarial ganha destaque
Com a evolução da IA nas empresas, desafios como privacidade de dados, controle de custos e gestão de modelos tornaram-se prioritários. Segundo o relatório “The GenAI Divide: State of AI in Business”, do MIT, 95% das organizações não conseguem medir retornos financeiros em investimentos de US$ 40 bilhões em IA corporativa.
O Red Hat AI 3 oferece uma experiência unificada, permitindo que CIOs e líderes de TI escalem cargas de trabalho de IA em ambientes híbridos, suportando qualquer modelo e acelerador de hardware, desde datacenters a nuvens públicas e edge.
Do treinamento à ação: foco na inferência
A plataforma enfatiza a inferência de IA escalável, baseada em projetos comunitários como vLLM e llm-d, permitindo serviços de inferência de LLM (Large Language Models) em produção. O Red Hat OpenShift AI 3.0 introduz o llm-d, que otimiza o uso de Kubernetes para distribuição inteligente de modelos, reduz custos e melhora tempos de resposta, oferecendo ROI mensurável e desempenho previsível.
Plataforma unificada para colaboração
O Red Hat AI 3 cria um ambiente colaborativo para engenheiros de plataforma e de IA, com recursos como:
- Modelo como Serviço (MaaS): permite acesso centralizado a modelos e gerenciamento de custos.
- AI Hub: catálogo centralizado de modelos de IA generativa otimizados, ciclo de vida e monitoramento.
- Gen AI Studio: ambiente interativo para prototipagem, ajustes de prompts e integração com Retrieval-Augmented Generation (RAG).
- Modelos validados pela Red Hat, incluindo gpt-oss, DeepSeek-R1, Whisper e Voxtral Mini.
Preparando a próxima geração de agentes de IA
O Red Hat OpenShift AI 3 estabelece a base para agentes de IA escaláveis, com alta capacidade de inferência e novos recursos de gestão de agentes. A plataforma adota a camada de API unificada Llama Stack e o Model Context Protocol (MCP) para integração de modelos com ferramentas externas.
O Red Hat AI 3 também oferece ferramentas modulares para customização de modelos, com bibliotecas Python especializadas, suporte a ingestão de dados não estruturados, geração de dados sintéticos e monitoramento de resultados, permitindo que as empresas obtenham resultados de IA mais precisos e confiáveis.





