Pessoa Engenheira de IA Generativa Pleno
🏢 SOUTH SYSTEM
🗓️ Publicada em: 06 de março de 2026, 13:31
🚀 Vem decolar com a South System!
Estamos em busca de uma pessoa Engenheira de IA Generativa Pleno para embarcar na nossa nave e, juntos, impulsionarmos pessoas e negócios por meio da inovação.
Local: Remoto
Responsabilidades:
Agora queremos continuar mostrando porque fazer parte da South é tão especial:
Estamos em busca de uma pessoa Engenheira de IA Generativa Pleno para embarcar na nossa nave e, juntos, impulsionarmos pessoas e negócios por meio da inovação.
Local: Remoto
Responsabilidades:
- Atuar no desenvolvimento de agentes conversacionais de IA generativa com arquitetura multi-agente, incluindo padrões de handoff entre agentes especializados.
- Desenvolver e evoluir agentes de IA baseados em LLMs (Anthropic Claude, Amazon Nova) utilizando Python e LangChain, participando de todo o ciclo — da concepção à produção.
- Trabalhar com soluções de RAG (Retrieval-Augmented Generation) com busca híbrida sobre Amazon Bedrock Knowledge Bases.
- Integrar ferramentas externas aos agentes via Model Context Protocol (MCP).
- Desenvolver e manter middleware customizado para gerenciamento de janela de contexto, sumarização de conversas, model fallback e retry.
- Atuar com Prompt Engineering avançado — design, versionamento e caching de prompts via Arize Phoenix.
- Ter domínio de Amazon Bedrock (inference, Knowledge Bases, Guardrails) e Bedrock AgentCore (hosting de agentes, memória semântica e de eventos).
- Trabalhar com streaming em tempo real via SSE e WebSocket na exposição de serviços.
- Containerizar agentes com Docker para deploy em ambientes de produção na nuvem.
- Aplicar padrões de design (Middleware Pipeline, State Machine, Cache com TTL, multi-tenancy) para garantir escalabilidade e manutenibilidade.
- Python 3.11+ como linguagem principal
- LangChain e LangGraph — orquestração de agentes, ferramentas, state management, middleware customizado
- Pydantic — validação de dados e gerenciamento de configuração
- Boto3 — SDK AWS para integração com serviços de IA, storage e infraestrutura
- Familiaridade com gerenciadores de pacotes modernos (uv, poetry)
- Experiência sólida com Large Language Models (Anthropic Claude, Amazon Nova ou equivalentes)
- Integração com Amazon Bedrock — inference de modelos, Knowledge Bases, hosting de agentes
- RAG (Retrieval-Augmented Generation) — embeddings, bases de conhecimento vetoriais, estratégias de busca híbrida
- Prompt Engineering avançado — design de system prompts complexos, versionamento, caching e gerenciamento remoto de prompts
- Model Context Protocol (MCP) — integração de ferramentas para agentes via protocolo padronizado
- Padrões de multi-agent handoff — transferência de contexto e controle entre agentes especializados
- Estratégias de model fallback, retry com backoff e gerenciamento de janela de contexto
- Técnicas de sumarização de conversas para otimização de contexto em interações longas com LLMs
- Arize Phoenix — tracing de chamadas LLM, análise de latência, custo de tokens, qualidade de respostas, gerenciamento e versionamento de prompts
- Amazon Bedrock — inference de modelos, Knowledge Bases, Guardrails
- Amazon Bedrock AgentCore — hosting e deploy de agentes containerizados, memória de agentes (semântica e eventos)
- Docker — containerização de aplicações Python, multi-stage builds, otimização de imagens
- Microserviços — serviços independentes com responsabilidades bem definidas
- Multi-tenancy — isolamento por namespace, gerenciamento de sessões por tenant
- Streaming — Server-Sent Events (SSE) e WebSocket para respostas em tempo real
- Middleware/Pipeline Pattern — composição de etapas de processamento (sanitização, sumarização, fallback, contexto)
- State Machine — gerenciamento de estado em fluxos multi-agente com persistência
- Cache com TTL — instâncias de agentes, prompts, configurações
- Experiência com Google Vertex AI — inference de modelos, agentes e knowledge bases no ecossistema GCP
- Experiência com Azure AI Foundry / Azure OpenAI — inference de modelos, agentes e knowledge bases no ecossistema Azure
- Conhecimento de APIs de ferramentas de gestão de projetos (Azure DevOps, Jira, etc.)
- Prática com testes automatizados em aplicações de IA (pytest, avaliação de qualidade de respostas)
- Familiaridade com Node.js / JavaScript para scripts de integração
- Experiência com ferramentas de análise estática de código (SonarQube, CodeClimate, etc
- Cursos e certificações na Udemy conforme indicação do time de Business Partner com curadoria e orientação.
- Benefício de home office para tornar seu dia a dia mais confortável.
- Educação financeira para apoiar sua saúde econômica.
- Cartão Flash.
Agora queremos continuar mostrando porque fazer parte da South é tão especial:
- 🏆 Somos reconhecidos pelo nosso time: já fomos eleitos duas vezes uma das melhores empresas para se trabalhar no Brasil (GPTW), e temos nota 4.9 no Glassdoor e Indeed.
- 🌟 Fomos premiados no LinkedIn Talent Awards.
- 🌱 Temos compromisso com o futuro: somos carbono neutro, compensando 100% das nossas emissões de carbono.
- 🌍 Operamos com modelos de trabalho remoto e híbrido, de acordo com a vaga e o projeto.
- Valorizamos crescimento e desenvolvimento contínuo.
- Temos uma cultura baseada em respeito, colaboração e lealdade.
- Somos diversos, inclusivos e acreditamos na potência da pluralidade dos nossos times.