Especialista II (Engenharia de IA Generativa)
🏢 Brasilseg
🗓️ Publicada em: 21 de março de 2026, 22:54
Descrição da vaga
O que estará sobre seus cuidados:
- Liderar a concepção e evolução de soluções baseadas em LLMs com foco na elevação da experiência do cliente, habilitação de aplicações comerciais e ganhos de eficiência operacional. O papel envolve traduzir desafios de negócio em arquiteturas de GenAI (como RAG e sistemas agentic), garantindo geração de valor por meio de aplicações escaláveis, seguras e orientadas a resultados.
- Responsável por atuar de ponta a ponta no ciclo de vida de aplicações de IA generativa — do design à produção —, com forte ênfase em experimentação, avaliação contínua e otimização de performance e custo. Espera-se também protagonismo na disseminação de boas práticas, governança e aceleração da adoção de GenAI na organização.
Responsabilidades e atribuições
O que é importante você ter?
- Projetar e implementar pipelines de IA Generativa end-to-end, contemplando ingestão, processamento, retrieval, inferência e serving de aplicações baseadas em LLMs
- Traduzir requisitos de negócio em designs de sistemas generativos, especificando contratos de input/output, model tasks, orchestration chains e fluxos de execução multi-step
- Desenvolver e otimizar prompt templates e metaprompts, incluindo controle de estrutura (JSON schema, function calling), grounding e redução de alucinação
- Projetar e operar arquiteturas RAG (Retrieval-Augmented Generation) com foco em: estratégias avançadas de chunking (semantic, recursive, sliding window), indexação vetorial e híbrida, re-ranking (cross-encoder, LLM-based ranking)
- Implementar pipelines de data preparation para GenAI, incluindo parsing de documentos, content filtering, normalização e enriquecimento semântico
- Desenvolver e manter data pipelines em Delta Lake, incluindo escrita e versionamento de dados em Unity Catalog
- Construir sistemas de retrieval utilizando Vector Search (Mosaic AI Vector Search), embeddings e tuning de relevância
- Desenvolver agentic systems utilizando frameworks como LangChain/LlamaIndex, incluindo definição de tools, planners e execution graphs
- Implementar LLM guardrails (input/output filtering, prompt hardening, PII masking, policy enforcement) para mitigação de riscos
- Selecionar e avaliar modelos (LLMs e embeddings) com base em: métricas offline (accuracy, recall@k, MRR, BLEU, etc.) avaliações qualitativas (human-in-the-loop, rubric-based evaluation)
- Integrar modelos via Foundation Model APIs e/ou model hubs (ex: Hugging Face), considerando latência, custo e contexto máximo
- Desenvolver e versionar aplicações utilizando MLflow (tracking, model registry, pyfunc models)
- Implementar e publicar endpoints de inferência com controle de acesso e governança
- Projetar workloads de inferência batch e online (real-time serving), incluindo uso de ai_query() e pipelines distribuídos
- Monitorar aplicações em produção com: inference logging, métricas de custo, latência e qualidade; Agent Monitoring e observabilidade de pipelines
- Definir e implementar estratégias de evaluation & monitoring contínuo, incluindo testes com ground truth e avaliação automatizada
- Garantir conformidade com requisitos de governança de dados, segurança e licenciamento (LGPD e AI TRiSM)
- Promover programas de alfabetização do uso de IA, com estratégias convencionais e de gamificação, para fomentar a capacidade analítica e cultura orientada a dados.
Requisitos e qualificações
- Superior Completo (Administração, Sistemas de Informação, Gestão e tecnologia da informação, Engenharia da dados, estatística e/ou Matemática);
- Conhecimento em Excel avançado;
- Conhecimento em Ferramentas IDE, Ferramentas Vibe Coding;
- Conhecimento com entregáveis correlatos agentes e aplicação de IA generativa.
- Experiência com ecossistema de dados/ML e protocolos MCP, A2A etc.
- Conhecimento aprofundado em LLMs, arquiteturas Transformer e sistemas generativos
- Experiência prática com RAG pipelines, incluindo embeddings, retrieval e ranking
- Domínio de prompt engineering avançado (structured outputs, tool use, few-shot, chain-of-thought control)
- Experiência com frameworks de orquestração como LangChain, LlamaIndex ou similares
- Experiência com model evaluation frameworks e definição de métricas para GenAI
- Conhecimento em LLMOps / MLOps, incluindo versionamento, experiment tracking e deployment
- Experiência com desenvolvimento e deploy de APIs e serviços de inferência
- Experiência em setores regulados (seguro, financeiro, saúde).
Informações adicionais
Como Cuidamos de você:
Benefícios:
- Seguro Saúde;
- Seguro Odontológico;
- Seguro Decesso;
- Vale Transporte
- Vale Refeição;
- Vale Alimentação;
- Estacionamento Gratuito;
- 13ª Cesta de Alimentação;
- Seguro de Vida em Grupo;
- Plano de Previdência Privada;
- Auxílio Creche e/ou Babá;
- Participação nos Lucros e Resultados (PLR);
- Gympass;
- Day off para comemorar seu aniversário;
- Universidade Corporativa com mais 500 cursos;
- Programa de Saúde Integrada: mental, social, financeira e física.
Onde ficamos?
Nossa sede fica localizada na zona sul de São Paulo, próximo a estação de trem Morumbi (linha 9 – Esmeralda), na região do bairro Chácara Santo Antônio.