Pessoa Engenheira de IA Generativa Pleno

🏢 SOUTH SYSTEM

🗓️ Publicada em: 06 de março de 2026, 13:31

🚀 Vem decolar com a South System!

Estamos em busca de uma pessoa Engenheira de IA Generativa Pleno para embarcar na nossa nave e, juntos, impulsionarmos pessoas e negócios por meio da inovação.

Local: Remoto

Responsabilidades:

  • Atuar no desenvolvimento de agentes conversacionais de IA generativa com arquitetura multi-agente, incluindo padrões de handoff entre agentes especializados.
  • Desenvolver e evoluir agentes de IA baseados em LLMs (Anthropic Claude, Amazon Nova) utilizando Python e LangChain, participando de todo o ciclo — da concepção à produção.
  • Trabalhar com soluções de RAG (Retrieval-Augmented Generation) com busca híbrida sobre Amazon Bedrock Knowledge Bases.
  • Integrar ferramentas externas aos agentes via Model Context Protocol (MCP).
  • Desenvolver e manter middleware customizado para gerenciamento de janela de contexto, sumarização de conversas, model fallback e retry.
  • Atuar com Prompt Engineering avançado — design, versionamento e caching de prompts via Arize Phoenix.
  • Ter domínio de Amazon Bedrock (inference, Knowledge Bases, Guardrails) e Bedrock AgentCore (hosting de agentes, memória semântica e de eventos).
  • Trabalhar com streaming em tempo real via SSE e WebSocket na exposição de serviços.
  • Containerizar agentes com Docker para deploy em ambientes de produção na nuvem.
  • Aplicar padrões de design (Middleware Pipeline, State Machine, Cache com TTL, multi-tenancy) para garantir escalabilidade e manutenibilidade.

Requisitos obrigatórios:

  • Python 3.11+ como linguagem principal
  • LangChain e LangGraph — orquestração de agentes, ferramentas, state management, middleware customizado
  • Pydantic — validação de dados e gerenciamento de configuração
  • Boto3 — SDK AWS para integração com serviços de IA, storage e infraestrutura
  • Familiaridade com gerenciadores de pacotes modernos (uv, poetry)
  • Experiência sólida com Large Language Models (Anthropic Claude, Amazon Nova ou equivalentes)
  • Integração com Amazon Bedrock — inference de modelos, Knowledge Bases, hosting de agentes
  • RAG (Retrieval-Augmented Generation) — embeddings, bases de conhecimento vetoriais, estratégias de busca híbrida
  • Prompt Engineering avançado — design de system prompts complexos, versionamento, caching e gerenciamento remoto de prompts
  • Model Context Protocol (MCP) — integração de ferramentas para agentes via protocolo padronizado
  • Padrões de multi-agent handoff — transferência de contexto e controle entre agentes especializados
  • Estratégias de model fallback, retry com backoff e gerenciamento de janela de contexto
  • Técnicas de sumarização de conversas para otimização de contexto em interações longas com LLMs
  • Arize Phoenix — tracing de chamadas LLM, análise de latência, custo de tokens, qualidade de respostas, gerenciamento e versionamento de prompts
  • Amazon Bedrock — inference de modelos, Knowledge Bases, Guardrails
  • Amazon Bedrock AgentCore — hosting e deploy de agentes containerizados, memória de agentes (semântica e eventos)
  • Docker — containerização de aplicações Python, multi-stage builds, otimização de imagens
  • Microserviços — serviços independentes com responsabilidades bem definidas
  • Multi-tenancy — isolamento por namespace, gerenciamento de sessões por tenant
  • Streaming — Server-Sent Events (SSE) e WebSocket para respostas em tempo real
  • Middleware/Pipeline Pattern — composição de etapas de processamento (sanitização, sumarização, fallback, contexto)
  • State Machine — gerenciamento de estado em fluxos multi-agente com persistência
  • Cache com TTL — instâncias de agentes, prompts, configurações

Diferenciais:

  • Experiência com Google Vertex AI — inference de modelos, agentes e knowledge bases no ecossistema GCP
  • Experiência com Azure AI Foundry / Azure OpenAI — inference de modelos, agentes e knowledge bases no ecossistema Azure
  • Conhecimento de APIs de ferramentas de gestão de projetos (Azure DevOps, Jira, etc.)
  • Prática com testes automatizados em aplicações de IA (pytest, avaliação de qualidade de respostas)
  • Familiaridade com Node.js / JavaScript para scripts de integração
  • Experiência com ferramentas de análise estática de código (SonarQube, CodeClimate, etc

🎁 Benefícios que fazem a diferença:

  • Cursos e certificações na Udemy conforme indicação do time de Business Partner com curadoria e orientação.
  • Benefício de home office para tornar seu dia a dia mais confortável.
  • Educação financeira para apoiar sua saúde econômica.
  • Cartão Flash.

Gostou da oportunidade?

Agora queremos continuar mostrando porque fazer parte da South é tão especial:

  • 🏆 Somos reconhecidos pelo nosso time: já fomos eleitos duas vezes uma das melhores empresas para se trabalhar no Brasil (GPTW), e temos nota 4.9 no Glassdoor e Indeed.
  • 🌟 Fomos premiados no LinkedIn Talent Awards.
  • 🌱 Temos compromisso com o futuro: somos carbono neutro, compensando 100% das nossas emissões de carbono.
  • 🌍 Operamos com modelos de trabalho remoto e híbrido, de acordo com a vaga e o projeto.

💙 Nosso jeito de ser:

  • Valorizamos crescimento e desenvolvimento contínuo.
  • Temos uma cultura baseada em respeito, colaboração e lealdade.
  • Somos diversos, inclusivos e acreditamos na potência da pluralidade dos nossos times.
Link Original da Vaga