Databricks e a Nova Era do Trabalho com Dados

Databricks apresentou em 11 de março de 2026 o Genie Code, um sistema de agentes de IA autônomos projetado para executar trabalhos de engenharia de dados, ciência de dados e análises em ambientes corporativos. A notícia chega acompanhada de dois sinais que devem ser lidos em conjunto: a Databricks afirma que seu agente eleva a taxa de sucesso em tarefas de ciência de dados de 32,1% para 77,1% em comparação a agentes líderes, e ao mesmo tempo anuncia a aquisição da Quotient AI, especializada na avaliação e reforço de agentes para detectar regressões de desempenho. Em outras palavras, a Databricks não quer apenas que os agentes "façam coisas"; deseja que o façam com disciplina operacional e sem degradação quando os dados, as permissões ou o contexto mudam.

O mercado de agentes de codificação está repleto de uma narrativa sedutora: menos fricção, mais velocidade, “vibe-coding” como forma de produção. A Databricks entra por outra via. Sua tese explícita é que o objetivo não é a aplicação, mas o dado. Por isso, o Genie Code é apoiado no Unity Catalog para governança, linhagem e controle de acessos, orquestrando múltiplos modelos grandes da Anthropic, OpenAI e Google, além de modelos menores para tarefas rotineiras. Em sua própria narrativa, isso representa uma transição de assistentes que sugerem para agentes que operam, com humanos no papel de guias.

A cifra que deve preocupar qualquer comitê executivo não é a de 77,1%. É a outra: segundo o relatório State of AI Agents da Databricks, os agentes já criam 80% das bases de dados e 97% dos ambientes de teste e desenvolvimento em sua plataforma. Dois anos atrás, isso era marginal. Isso descreve uma mudança de soberania dentro da empresa: o trabalho começa a se mover de pessoas para agentes, e o gargalo deixa de ser técnico para se tornar gerencial.

Do assistente obediente ao operador com iniciativa

Genie Code é vendido como “agente” porque promete assumir o ciclo completo: planejar, escrever, implantar modelos, registrar em MLflow, otimizar endpoints de serviço, diagnosticar falhas em Lakeflow, triagem de incidentes e até lidar com fricções típicas de produção como mudanças de esquema ou modificações de permissões. O importante não é a lista de funções; é a alteração do contrato.

Um assistente clássico vive em modo reativo: espera a ordem, completa um bloco de código, sugere um padrão. Um operador com iniciativa vive em modo contínuo: observa, interpreta, decide o próximo passo, executa, valida, deixa registro. Essa transição tem um custo interno. Quando um agente planeja e executa em múltiplos passos dentro de uma conversa, não pode mais ser gerido pelo antigo modelo de "tarefa concluída" e "responsável individual". É necessária a rastreabilidade das decisões, clareza sobre a autoridade para mudanças e um padrão de explicação quando algo der errado.

A Databricks tenta cobrir essa lacuna com o Unity Catalog como guardrail: governança, controles de acesso e linhagem embutidos no fluxo. É uma decisão estratégica, porque o calcanhar de Aquiles de muitos agentes gerais é a falta de semântica corporativa e sua relação superficial com o risco. Em dados, o risco não é apenas vazamento; é também qualidade, continuidade operacional e decisões executivas baseadas em métricas que podem se deslocar silenciosamente.

No plano narrativo, o CEO Ali Ghodsi afirma que nos últimos seis meses o desenvolvimento de software passou de assistência para engenharia baseada em agentes, e que agora esse salto se transfere para equipes de dados. O que está em jogo é uma nova divisão do trabalho: humanos guiando e agentes executando. Essa frase soa eficiente; também é uma afirmação de governança. Em uma organização madura, “guiar” não é opinar: é estabelecer limites, tolerâncias e responsabilidades.

A economia do agente é medida em risco, não em demonstrações

A Databricks reportou que sua ARR superou 4.800 milhões de dólares em outubro de 2025 e que mais de 20.000 organizações utilizam sua plataforma. Nesse contexto, Genie Code não é um experimento: é um movimento para capturar a próxima camada de valor em uma base instalada enorme. A pergunta financeira que importa é qual linha do P&L será afetada primeiro.

A economia de tempo na escrita de código é visível, mas costuma ser um sonho ilusório. Em equipes de dados, o grande custo está na operação: falhas em pipelines, degradação de qualidade, mudanças nas fontes, incidentes por permissões, rotatividade de pessoal que deixa conhecimento implícito, e semanas perdidas tentando entender por que um dashboard mudou. Se o Genie Code realmente diagnostica, repara e documenta, a alavanca não é velocidade; é redução do custo de incidentes e menor dependência de heróis técnicos.

O caso mencionado de SiriusXM reporta cerca de 20% de melhora na produtividade em tarefas de engenharia de dados, com o VP de Engenharia de Dados Bernie Graham descrevendo-o como um parceiro “prático” para notebooks, SQL complexo, relacionamentos entre tabelas e depuração de pipelines. Esse tipo de melhora, se mantida, se traduz em duas possíveis decisões gerenciais: fazer mais com a mesma equipe ou sustentar a produção com menor carga e menos desgaste. A primeira tentação costuma ser empilhar projetos; a segunda, estabilizar. A maioria das organizações opta pela primeira e depois se surpreende quando a qualidade cai.

Aqui surge o ponto que quase ninguém quer dizer em comitê: a produtividade dos agentes se torna uma dívida se não houver um padrão explícito de qualidade. Um agente que entrega mais rápido pode produzir mais variabilidade, mais artefatos intermediários e mais mudanças na produção. A Databricks sabe disso, e por isso compra a Quotient AI: a aquisição faz sentido menos por “talento” e mais por controle do risco de regressão. Em um sistema baseado em agentes, o inimigo não é o erro pontual, mas a degradação silenciosa ao longo do tempo.

A batalha não é pelo código, é pela soberania sobre os dados

O mercado celebra ferramentas como Cursor ou Claude Code por seu impacto no desenvolvimento de software. A Databricks escolhe outra guerra: transformar o trabalho de dados em um domínio onde os agentes não apenas escrevem, mas operam com contexto empresarial. Em sua própria visão, outros agentes ajudam a escrever aplicações; a Databricks quer chegar ao dado como produto final.

Essa distinção é mais do que marketing. Em empresas médias e grandes, os dados estão atravessados por hierarquias: quem pode ver o quê, quem aprova mudanças, quem assina um modelo que influencia decisões comerciais. Se o agente se integra ao Unity Catalog, a automação se acopla a permissões, linhagem e rastreabilidade. Essa integração é uma vantagem competitiva, mas também um espelho: expõe a desordem de governança que muitas empresas toleram enquanto o trabalho é manual.

Quando tudo é feito “manual”, a organização se engana com a ideia de controle. Na realidade, o que existe é fricção. O agente elimina a fricção e expõe o controle: políticas explícitas, qualidade definida, rotas de escalonamento de incidentes. Portanto, a adoção de agentes não é bloqueada pela falta de GPUs; é bloqueada pela incapacidade da direção de chegar a um consenso sobre como governar os dados.

A integração com ferramentas externas via Model Context Protocol (MCP), conectando-se ao Jira e GitHub, sugere que a Databricks busca se inserir no fluxo de trabalho completo, desde tickets até implantações. Esse movimento é lógico: o valor aparece quando o agente não reside em uma demonstração, mas em uma cadeia de responsabilidades que deixa rastros. A promessa de memória persistente e aprendizado a partir das interações com usuários acelera a produção, mas também amplifica preconceitos e atalhos. Assim, sem avaliação contínua, o agente se torna uma fábrica de variação.

O ponto cego do C-Level é a conversa sobre autoridade

Na Sustainabl, vejo um padrão repetido: as empresas investem em automação para evitar uma conversa interna que causa desconforto. A conversa não é tecnológica; é política e operacional. Quem tem autoridade para mudar um pipeline de produção? Quais limiares de qualidade permitem bloquear uma implantação? Que tipo de decisão pode um agente tomar sem aprovação humana? O que é documentado como explicação suficiente para auditoria interna?

Ali Ghodsi fala de um mundo onde “os agentes fazem o trabalho, guiados por humanos”. Essa frase se quebra quando ocorre o primeiro incidente grave e ninguém sabe quem "possui" a decisão do agente. As companhias que resolvem isso bem não o fazem com discursos, mas com estrutura: definição clara de permissões, expectativas de qualidade, revisões pós-incidente e regras explícitas para mudanças automáticas.

A Databricks afirma que o Genie Code pode lidar com mudanças de esquema ou permissões. Essa capacidade é atraente e perigosa ao mesmo tempo. Atraente porque reduz tempos mortos. Perigosa porque normaliza mudanças sem conversa humana prévia. Em organizações maduras, isso é gerido com limites rigorosos: tipos de mudanças permitidas, janelas de implantação, rastreabilidade obrigatória, critérios de reversão.

Há também uma reordenação de prestígio. Durante anos, o status técnico foi construído em torno de ser a pessoa que “conserta” o pipeline quando falha. Se um agente começa a consertá-lo, esse status migra para arquitetura, governança e design de sistemas. Isso requer líderes capazes de sustentar a mudança sem desmerecer aqueles que foram críticos no modelo anterior. As transições mal geridas não falham por causa da IA; falham por identidade profissional e silenciosos acúmulos de descontentamento.

A Databricks está fazendo uma grande aposta em uma categoria que cresce rapidamente e gera receita de maneira acelerada. Nesse contexto, o sucesso do Genie Code dependerá menos de benchmarks internos e mais de conseguir estabelecer um padrão de confiança repetível em produção. A compra da Quotient AI é uma admissão sutil de uma realidade: sem avaliação, os agentes tornam-se imprevisíveis.

A direção madura transforma autonomia em disciplina operacional

A leitura executiva do Genie Code não é entusiasmo nem cinismo. É reconhecer que o trabalho baseado em agentes empurra a empresa para um modelo onde os dados são geridos como infraestrutura crítica, com automação que atua e aprende. Quando a Databricks afirma que milhares de clientes estão experimentando o Genie Code, isso significa que o mercado está em fase de pilotos, e que os próximos vencedores serão aqueles que converterem pilotos em operações estáveis sem transformar a organização em um laboratório permanente.

SiriusXM relata melhorias na produtividade e a Repsol o utiliza para acelerar previsões e fluxos de produção automatizando notebooks, pipelines e orquestração de modelos. São casos de uso coerentes: ali o retorno aparece quando se reduz o tempo entre um sinal e uma decisão, sem quebrar a governança.

A tentação típica do C-Level é pedir velocidade e delegar o custo de controle a uma área técnica. Esse roteiro termina em incidentes, auditorias internas tensas e uma cultura onde todos olham para baixo quando algo dá errado. O roteiro alternativo exige assumir que a autonomia de um agente é um tema de liderança, não de engenharia.

A cultura de toda organização não é mais do que o resultado natural da busca de um propósito autêntico, ou, por outro lado, o sintoma inevitável de todas as conversas difíceis que o ego do líder não permite que sejam tidas.