Databricks
Genie & Agent Bricks do zero [1] - O que é o AI/BI Genie e como ele funciona sobre o Unity Catalog
Fala dataholics, bora de mais conteúdo técnico! Hoje estou empolgado porque vamos abrir uma série nova aqui no blog: Genie & Agent Bricks do zero. A ideia é mostrar, do conceito à prática, tudo que o Azure Databricks oferece pra você criar agentes que conversam com os seus dados. E começamos pelo coração de tudo: o AI/BI Genie.
Imagine qualquer pessoa da sua empresa, mesmo quem nunca escreveu uma linha de SQL, perguntando para os dados em português e recebendo a resposta certa, com a query governada rodando por trás. É exatamente isso que o Genie faz. E com as novidades de 2026, principalmente o Genie Ontology, ele deixou de só gerar SQL e passou a entender o seu negócio de verdade.
O que veremos nesse post:
O que é o AI/BI Genie
Como ele funciona por baixo dos panos sobre o Unity Catalog
A família Genie: Spaces, Agents, One, Code e Ontology
A grande novidade: Genie Ontology, Unity Catalog Metrics e o OntoRank
Por que isso importa e o que vem na série

O que é o AI/BI Genie
O AI/BI Genie é a interface de linguagem natural do Databricks para os seus dados. Na prática, você aponta o Genie para um conjunto de tabelas e views governadas no Unity Catalog e libera o pessoal de negócio para perguntar coisas como "qual foi o faturamento por região no último trimestre?" ou "quantos clientes novos entraram esse mês?". O Genie interpreta a pergunta, gera o SQL, executa e devolve a resposta, muitas vezes já com um gráfico.
O ponto que eu sempre faço questão de reforçar: isso não é um chatbot genérico chutando resposta. É um motor de text-to-SQL rodando dentro da sua plataforma, com os seus dados, respeitando a sua governança. A resposta vem da tabela, não da imaginação do modelo.
Reginaldo, mas isso não é a mesma coisa que dar acesso ao banco pra todo mundo sair rodando query?
Não, e essa é a graça. O Genie roda sobre o Unity Catalog, então ele respeita as permissões que você já configurou. Quem não tem acesso a uma tabela, não vê o dado dela pelo Genie. A democratização do acesso aos dados acontece sem você abrir mão da governança.
Como o Genie funciona por baixo dos panos
Vale entender o fluxo, porque ele explica tudo que vem depois:
Contexto: o Genie lê os metadados do Unity Catalog (nomes de tabelas, colunas, comentários, tipos e relacionamentos) para entender o que existe.
Interpretação: a pergunta em linguagem natural é transformada em uma intenção e, a partir do contexto, vira uma consulta SQL.
Execução: o SQL roda em um SQL Warehouse, ou seja, no seu compute, com o seu custo e a sua performance.
Governança: tudo passa pelo Unity Catalog. Permissões, linhagem e auditoria continuam valendo.
Resposta: o resultado volta em tabela ou visualização, e o usuário pode pedir follow-up mantendo o contexto da conversa.
DETALHE IMPORTANTE: a qualidade da resposta depende diretamente de quão bem o seu ambiente está descrito. Tabela sem comentário, coluna com nome críptico e zero contexto de negócio fazem o Genie trabalhar no escuro. É por isso que a Microsoft e o Databricks investiram pesado na camada semântica, que é exatamente onde entra o Ontology mais pra frente.
A família Genie: Spaces, Agents, One e Code
Quando as pessoas falam "Genie", normalmente pensam só na caixinha de perguntas. Mas no Data + AI Summit 2026 o Databricks expandiu o Genie para uma família inteira de produtos. Vamos passar por cada um:
Genie Spaces: a base de tudo. Um espaço de conversa curado e focado em um assunto (vendas, financeiro, logística), com as tabelas, instruções e exemplos daquele domínio. Já passaram de 1 milhão de Spaces criados. É a fundação que está evoluindo para os Genie Agents.
Genie Agents: a evolução dos Spaces. Em vez de uma conversa solta, você salva qualquer conversa do Genie como um agente reutilizável, que herda a memória, as fontes e as instruções daquela conversa. Aí o time inteiro chama esse agente pelo nome e repete o fluxo. Eles raciocinam sobre dados estruturados e não estruturados e tomam ação nas suas ferramentas de negócio. Vem junto o Genie App Builder pra montar esses agentes.
Genie One: o coworker agêntico universal. É o Genie para o pessoal de negócio (marketing, financeiro, vendas, RH) que responde perguntas, produz documentos e relatórios, roda tarefas agendadas e toma ação via tools MCP. Funciona na web, no iOS, no Android e dentro do Slack e do Microsoft Teams. Ele fica no topo, orquestrando as outras capacidades.
Genie Code: o parceiro de engenharia autônomo, já GA. Pensa nele como um agente que ajuda a construir, depurar, otimizar e operar pipelines de dados e IA dentro do Databricks. É o lado "agentic engineering" da família, com integração via MCP server.
Genie Ontology: o cérebro no centro de tudo, a camada de contexto que faz todos os anteriores responderem melhor. Vou detalhar ela na próxima seção, porque é a grande virada.
Tem ainda o Genie ZeroOps em private preview, mirando operação automática. Recursos como o raciocínio em vários passos e o Deep Research (que entrega respostas detalhadas e com citações) estão embutidos nessa experiência. E, por baixo, dá pra integrar tudo nas suas aplicações via Conversation API e expor o Genie como tool de outros agentes pelo Managed MCP Server.
Repara que isso já abre o caminho da série inteira: o mesmo Genie que responde no chat pode virar um Genie Agent reutilizável, ser orquestrado pelo Genie One ou virar tool de um agente lá no Agent Bricks.
A grande novidade de 2026: Genie Ontology
Aqui está, na minha opinião, a virada de chave. O Genie Ontology é uma camada de contexto viva, um grafo de conhecimento que se aprimora sozinho e fica aprendendo o seu negócio a partir das suas tabelas, dashboards, queries, notebooks, pipelines e de mais de 50 aplicações conectadas. Em vez de adivinhar o que é "engajamento" ou "cliente ativo" a cada pergunta, o Genie passa a usar uma definição verificada.
Esse contexto se apoia em duas peças importantes:
Unity Catalog Metrics (Business Semantics): agora GA e open source, é onde você define os seus KPIs de negócio uma única vez, como receita, churn, usuários ativos e margem, como objetos governados e reutilizáveis. O Genie consulta essa definição oficial em vez de tentar montar a conta na mão.
OntoRank: o mecanismo que ranqueia o conhecimento por autoridade. Como um engenheiro do Databricks resumiu, "o PageRank ranqueava páginas web, o OntoRank ranqueia diferentes tipos de dado". Ele usa sinais como credibilidade de quem criou, amplitude de uso, ligação entre datasets e recência, para o agente confiar na definição certa, não na que casa por acaso com o texto.
O resultado disso aparece no número: nos testes do Databricks, a acurácia das respostas subiu de cerca de 50% para 84,5% depois que esse contexto entrou em jogo. E não é só acurácia, vem junto menos alucinação, menor custo de token e menos latência, porque o agente para de ficar caçando contexto fragmentado.
O Ontology também trouxe modelagem semântica mais rica: relacionamentos multi-fato, cálculos por nível de detalhe (LOD) e métricas parametrizadas que se adaptam à pergunta em tempo de execução.
Reginaldo, então eu preciso configurar esse Ontology na unha?
Não. A parte boa é que o Ontology constrói e mantém esse mapa do seu negócio automaticamente, extraindo e ranqueando conhecimento das suas fontes. O seu trabalho é alimentar bem a base: definir as métricas no Unity Catalog, comentar bem as tabelas e curar os Spaces. Quanto melhor o insumo, melhor o contexto.
Preparando o Genie para responder bem
Mesmo com toda essa inteligência automática, um Genie Space bem curado continua sendo o que separa um Genie mediano de um Genie confiável. Os principais ingredientes, que vou detalhar nos próximos posts da série, são:
General instructions: instruções em texto contando o contexto do negócio e regras daquele domínio.
Sample SQL (example queries): exemplos de perguntas e o SQL esperado, que ensinam o Genie a estruturar respostas parecidas.
Trusted assets: queries e funções SQL verificadas que entregam respostas certificadas, dando uma camada extra de confiança.
Benchmarks: um conjunto de perguntas de teste com a resposta esperada, para você medir e melhorar a acurácia do Space ao longo do tempo.
Comentários e métricas no Unity Catalog: a base de tudo, porque alimenta o contexto e o Ontology.
Por que isso importa
Eu trabalho com Databricks há tempo e sempre defendi que o maior gargalo de dados nas empresas não é técnico, é de acesso. Tem dado bom parado porque a fila pra um analista escrever a query é gigante. O Genie ataca exatamente isso: coloca o autoatendimento de dados na mão de quem precisa da resposta, sem abrir mão da governança do Unity Catalog.
E como tudo roda dentro do Azure Databricks, você ganha isso em cima do ambiente que já tem, com a segurança, a linhagem e o controle de custo que você já conhece. É o Lakehouse virando, de fato, plataforma de agentes de dados.
RESUMO
AI/BI Genie: interface de linguagem natural que faz text-to-SQL governado sobre o Unity Catalog.
Governança nativa: respeita permissões, linhagem e auditoria. Quem não tem acesso à tabela, não vê o dado.
A família Genie: Spaces (virando Agents), Genie Agents reutilizáveis, Genie One (coworker), Genie Code (engenharia) e o Genie Ontology no centro.
Genie Ontology: camada de contexto que aprende o negócio sozinha e usa o OntoRank para confiar na definição mais autoritativa.
Unity Catalog Metrics: defina os KPIs uma vez, de forma governada, e o Genie usa a definição oficial.
Resultado: nos testes do Databricks, a acurácia subiu de 50% para 84,5% com o contexto aplicado, com menos alucinação e menor custo.
Sem dúvidas o Genie é uma das features mais bacanas pro nosso arsenal de Databricks, e a base de tudo que vem por aí na série. Nos próximos posts a gente entra nos tipos de Genie em detalhe, em como curar um Space de alta qualidade e, claro, no hands-on criando um Genie do zero no Azure Databricks.
Referências:
https://learn.microsoft.com/en-us/azure/databricks/genie/
https://www.databricks.com/blog/next-generation-databricks-genie
https://www.databricks.com/blog/unifying-data-and-governance-agentic-era-whats-new-azure-databricks
https://www.databricks.com/product/unity-catalog/business-semantics
Fique bem e até a próxima.
#databricks #datainaction #genie #aibi #unitycatalog #azuredatabricks #ia
Gostou? Tem mais no YouTube e no LinkedIn.