Especialista II (Engenharia de IA Generativa)

🏢 Brasilseg

🗓️ Publicada em: March 21, 2026 22:54

Descrição da vaga

O que estará sobre seus cuidados:

  • Liderar a concepção e evolução de soluções baseadas em LLMs com foco na elevação da experiência do cliente, habilitação de aplicações comerciais e ganhos de eficiência operacional. O papel envolve traduzir desafios de negócio em arquiteturas de GenAI (como RAG e sistemas agentic), garantindo geração de valor por meio de aplicações escaláveis, seguras e orientadas a resultados.
  • Responsável por atuar de ponta a ponta no ciclo de vida de aplicações de IA generativa — do design à produção —, com forte ênfase em experimentação, avaliação contínua e otimização de performance e custo. Espera-se também protagonismo na disseminação de boas práticas, governança e aceleração da adoção de GenAI na organização.

Responsabilidades e atribuições

O que é importante você ter?

  • Projetar e implementar pipelines de IA Generativa end-to-end, contemplando ingestão, processamento, retrieval, inferência e serving de aplicações baseadas em LLMs
  • Traduzir requisitos de negócio em designs de sistemas generativos, especificando contratos de input/output, model tasks, orchestration chains e fluxos de execução multi-step
  • Desenvolver e otimizar prompt templates e metaprompts, incluindo controle de estrutura (JSON schema, function calling), grounding e redução de alucinação
  • Projetar e operar arquiteturas RAG (Retrieval-Augmented Generation) com foco em: estratégias avançadas de chunking (semantic, recursive, sliding window), indexação vetorial e híbrida, re-ranking (cross-encoder, LLM-based ranking)
  • Implementar pipelines de data preparation para GenAI, incluindo parsing de documentos, content filtering, normalização e enriquecimento semântico
  • Desenvolver e manter data pipelines em Delta Lake, incluindo escrita e versionamento de dados em Unity Catalog
  • Construir sistemas de retrieval utilizando Vector Search (Mosaic AI Vector Search), embeddings e tuning de relevância
  • Desenvolver agentic systems utilizando frameworks como LangChain/LlamaIndex, incluindo definição de tools, planners e execution graphs
  • Implementar LLM guardrails (input/output filtering, prompt hardening, PII masking, policy enforcement) para mitigação de riscos
  • Selecionar e avaliar modelos (LLMs e embeddings) com base em: métricas offline (accuracy, recall@k, MRR, BLEU, etc.) avaliações qualitativas (human-in-the-loop, rubric-based evaluation)
  • Integrar modelos via Foundation Model APIs e/ou model hubs (ex: Hugging Face), considerando latência, custo e contexto máximo
  • Desenvolver e versionar aplicações utilizando MLflow (tracking, model registry, pyfunc models)
  • Implementar e publicar endpoints de inferência com controle de acesso e governança
  • Projetar workloads de inferência batch e online (real-time serving), incluindo uso de ai_query() e pipelines distribuídos
  • Monitorar aplicações em produção com: inference logging, métricas de custo, latência e qualidade; Agent Monitoring e observabilidade de pipelines
  • Definir e implementar estratégias de evaluation & monitoring contínuo, incluindo testes com ground truth e avaliação automatizada
  • Garantir conformidade com requisitos de governança de dados, segurança e licenciamento (LGPD e AI TRiSM)
  • Promover programas de alfabetização do uso de IA, com estratégias convencionais e de gamificação, para fomentar a capacidade analítica e cultura orientada a dados.

Requisitos e qualificações

  • Superior Completo (Administração, Sistemas de Informação, Gestão e tecnologia da informação, Engenharia da dados, estatística e/ou Matemática);
  • Conhecimento em Excel avançado;
  • Conhecimento em Ferramentas IDE, Ferramentas Vibe Coding;
  • Conhecimento com entregáveis correlatos agentes e aplicação de IA generativa.
  • Experiência com ecossistema de dados/ML e protocolos MCP, A2A etc.
  • Conhecimento aprofundado em LLMs, arquiteturas Transformer e sistemas generativos
  • Experiência prática com RAG pipelines, incluindo embeddings, retrieval e ranking
  • Domínio de prompt engineering avançado (structured outputs, tool use, few-shot, chain-of-thought control)
  • Experiência com frameworks de orquestração como LangChain, LlamaIndex ou similares
  • Experiência com model evaluation frameworks e definição de métricas para GenAI
  • Conhecimento em LLMOps / MLOps, incluindo versionamento, experiment tracking e deployment
  • Experiência com desenvolvimento e deploy de APIs e serviços de inferência
  • Experiência em setores regulados (seguro, financeiro, saúde).

Informações adicionais

Como Cuidamos de você:

Benefícios:

  • Seguro Saúde;
  • Seguro Odontológico;
  • Seguro Decesso;
  • Vale Transporte
  • Vale Refeição;
  • Vale Alimentação;
  • Estacionamento Gratuito;
  • 13ª Cesta de Alimentação;
  • Seguro de Vida em Grupo;
  • Plano de Previdência Privada;
  • Auxílio Creche e/ou Babá;
  • Participação nos Lucros e Resultados (PLR);
  • Gympass;
  • Day off para comemorar seu aniversário;
  • Universidade Corporativa com mais 500 cursos;
  • Programa de Saúde Integrada: mental, social, financeira e física.

Onde ficamos?

Nossa sede fica localizada na zona sul de São Paulo, próximo a estação de trem Morumbi (linha 9 – Esmeralda), na região do bairro Chácara Santo Antônio.

Link Original da Vaga