Especialista II (Engenharia de IA Generativa)

🏢 Brasilseg

🗓️ Publicada em: 21 de março de 2026, 22:54

Descrição da vaga

O que estará sobre seus cuidados:

Liderar a concepção e evolução de soluções baseadas em LLMs com foco na elevação da experiência do cliente, habilitação de aplicações comerciais e ganhos de eficiência operacional. O papel envolve traduzir desafios de negócio em arquiteturas de GenAI (como RAG e sistemas agentic), garantindo geração de valor por meio de aplicações escaláveis, seguras e orientadas a resultados.
Responsável por atuar de ponta a ponta no ciclo de vida de aplicações de IA generativa — do design à produção —, com forte ênfase em experimentação, avaliação contínua e otimização de performance e custo. Espera-se também protagonismo na disseminação de boas práticas, governança e aceleração da adoção de GenAI na organização.

Responsabilidades e atribuições

O que é importante você ter?

Projetar e implementar pipelines de IA Generativa end-to-end, contemplando ingestão, processamento, retrieval, inferência e serving de aplicações baseadas em LLMs
Traduzir requisitos de negócio em designs de sistemas generativos, especificando contratos de input/output, model tasks, orchestration chains e fluxos de execução multi-step
Desenvolver e otimizar prompt templates e metaprompts, incluindo controle de estrutura (JSON schema, function calling), grounding e redução de alucinação
Projetar e operar arquiteturas RAG (Retrieval-Augmented Generation) com foco em: estratégias avançadas de chunking (semantic, recursive, sliding window), indexação vetorial e híbrida, re-ranking (cross-encoder, LLM-based ranking)
Implementar pipelines de data preparation para GenAI, incluindo parsing de documentos, content filtering, normalização e enriquecimento semântico
Desenvolver e manter data pipelines em Delta Lake, incluindo escrita e versionamento de dados em Unity Catalog
Construir sistemas de retrieval utilizando Vector Search (Mosaic AI Vector Search), embeddings e tuning de relevância
Desenvolver agentic systems utilizando frameworks como LangChain/LlamaIndex, incluindo definição de tools, planners e execution graphs
Implementar LLM guardrails (input/output filtering, prompt hardening, PII masking, policy enforcement) para mitigação de riscos
Selecionar e avaliar modelos (LLMs e embeddings) com base em: métricas offline (accuracy, recall@k, MRR, BLEU, etc.) avaliações qualitativas (human-in-the-loop, rubric-based evaluation)
Integrar modelos via Foundation Model APIs e/ou model hubs (ex: Hugging Face), considerando latência, custo e contexto máximo
Desenvolver e versionar aplicações utilizando MLflow (tracking, model registry, pyfunc models)
Implementar e publicar endpoints de inferência com controle de acesso e governança
Projetar workloads de inferência batch e online (real-time serving), incluindo uso de ai_query() e pipelines distribuídos
Monitorar aplicações em produção com: inference logging, métricas de custo, latência e qualidade; Agent Monitoring e observabilidade de pipelines
Definir e implementar estratégias de evaluation & monitoring contínuo, incluindo testes com ground truth e avaliação automatizada
Garantir conformidade com requisitos de governança de dados, segurança e licenciamento (LGPD e AI TRiSM)
Promover programas de alfabetização do uso de IA, com estratégias convencionais e de gamificação, para fomentar a capacidade analítica e cultura orientada a dados.

Requisitos e qualificações

Superior Completo (Administração, Sistemas de Informação, Gestão e tecnologia da informação, Engenharia da dados, estatística e/ou Matemática);
Conhecimento em Excel avançado;
Conhecimento em Ferramentas IDE, Ferramentas Vibe Coding;
Conhecimento com entregáveis correlatos agentes e aplicação de IA generativa.
Experiência com ecossistema de dados/ML e protocolos MCP, A2A etc.
Conhecimento aprofundado em LLMs, arquiteturas Transformer e sistemas generativos
Experiência prática com RAG pipelines, incluindo embeddings, retrieval e ranking
Domínio de prompt engineering avançado (structured outputs, tool use, few-shot, chain-of-thought control)
Experiência com frameworks de orquestração como LangChain, LlamaIndex ou similares
Experiência com model evaluation frameworks e definição de métricas para GenAI
Conhecimento em LLMOps / MLOps, incluindo versionamento, experiment tracking e deployment
Experiência com desenvolvimento e deploy de APIs e serviços de inferência
Experiência em setores regulados (seguro, financeiro, saúde).

Informações adicionais

Como Cuidamos de você:

Benefícios:

Seguro Saúde;
Seguro Odontológico;
Seguro Decesso;
Vale Transporte
Vale Refeição;
Vale Alimentação;
Estacionamento Gratuito;
13ª Cesta de Alimentação;
Seguro de Vida em Grupo;
Plano de Previdência Privada;
Auxílio Creche e/ou Babá;
Participação nos Lucros e Resultados (PLR);
Gympass;
Day off para comemorar seu aniversário;
Universidade Corporativa com mais 500 cursos;
Programa de Saúde Integrada: mental, social, financeira e física.

Onde ficamos?

Nossa sede fica localizada na zona sul de São Paulo, próximo a estação de trem Morumbi (linha 9 – Esmeralda), na região do bairro Chácara Santo Antônio.

Link Original da Vaga

Especialista II (Engenharia de IA Generativa)

Descrição da vaga

O que estará sobre seus cuidados:

Responsabilidades e atribuições

O que é importante você ter?

Requisitos e qualificações

Informações adicionais

Como Cuidamos de você:

Onde ficamos?

Outras Vagas

Converse com a Esther

Conversar Agora

Agendar Conversa

Escolha o melhor horário

Seu email

Esther está preparando tudo

Qual é o seu momento?

Já tenho um agente

Quero aprender