top of page
Topo
Buscar

Databricks - Delta lake - Vacuum Inventory Table - Reduzindo até 50% de custos
Aprenda como reduzir até 50% da sua operação de Vacuum no seu Delta Lake!
Reginaldo Silva
1 de jun. de 20248 min de leitura

Databricks - API - Executando um comando SQL via API
Quer aprender a consumir dados do seu Delta Lake usando a API do Databricks?
Reginaldo Silva
1 de abr. de 20243 min de leitura

Databricks - Deletion Vector - Photon - Preditictive IO - Comparando a performance
Nesse post vamos comparar a performance do Deletion Vector e a engine do Photon.
Reginaldo Silva
26 de fev. de 20246 min de leitura

Azure Function para Analytics - Delta Lake Sem SPARK - delta-rs
Ja viu um Delta Lake sem Spark? Da uma conferida nesse post.
Reginaldo Silva
5 de fev. de 20247 min de leitura

Azure Function para Analytics - Introdução - Lendo e escrevendo no Azure Storage
Quer aprender sobre Azure Function e como rodar seus códigos sem precisar de um servidor?
Reginaldo Silva
1 de jan. de 202410 min de leitura

Databricks - Lakehouse Federation - O que é, como funciona e benefícios
Quer aprender a fazer queries em diversas fontes de dados diferentes, sem necessidade de copiar dados? Aprenda sobre Lakehouse Federation.
Reginaldo Silva
25 de dez. de 20237 min de leitura


Databricks - Delta Lake - Particionar ou não, eis a questão! Guia definitivo!
Nesse post veremos como funciona o particionamento de dados e quando vale a pena utilizar.
Reginaldo Silva
16 de out. de 202310 min de leitura


Databricks - 7 TB - 127 BILHÕES de linhas - Truncate table vs Delete?
Você sabe qual é mais performático, truncate table ou delete?
Reginaldo Silva
17 de jul. de 20233 min de leitura

DTSTOOLS - lastMaintenance - Descubra se sua tabela Delta tem rotina de manutenção
Quer saber se sua tabela Delta tem uma boa rotina de manutenção aplicada? Da uma conferida na DTSTOOLS.
Reginaldo Silva
10 de jul. de 20232 min de leitura

DTSTOOLS - Descubra o verdadeiro tamanho do seu Delta Lake
A DTSTOOLS é uma biblioteca para te ajudar com seu Delta Lake e reduzir custos de storage
Reginaldo Silva
19 de jun. de 20233 min de leitura


Delta Lake - Nunca mais leia Parquets
Nesse post eu explico o motivo pelo qual você não deve ler arquivos Parquet.
Reginaldo Silva
12 de jun. de 20234 min de leitura


Delta Lake - Time Travel vs Change Data Feed (CDF) - O que você precisa saber
Nesse post você irá conhecer as particularidades do Time Travel e o Change Data Feed do Delta Lake.
Reginaldo Silva
5 de jun. de 20239 min de leitura

Databricks - Delta Lake - Versões, Protocolos, Features, Upgrade e mais
Entenda mais sobre o comportamento e versões da sua tabela Delta.
Reginaldo Silva
29 de mai. de 20239 min de leitura


Databricks - Deletion Vectors - Otimizando seu Storage
Deletion Vector - Essa feature pode otimizar seu custo com Storage.
Reginaldo Silva
22 de mai. de 20235 min de leitura


Databricks - Count(*) vs Count(1)? Como um Count em 100 Bilhões roda em menos de 1 segundo?
Já ouviu a lenda do COUNT(*) vs COUNT(1)? Nesse post vamos ir no deep dive.
Reginaldo Silva
8 de mai. de 20236 min de leitura


Databricks - TablesSize&Vacuum - Monitore e reduza custos do seu Delta lake
Você possui rotina de manutenção no seu Delta Lake? Essa rotina pode diminuir seus custos com storage e te dar um monitoramento proativo.
Reginaldo Silva
23 de abr. de 20237 min de leitura


Backup de Data Lake, isso existe? Salvando vidas e empregos
Já ouviu falar em Backup de Data Lake? De fato, esse tema não é tão falado assim, mas existem maneiras de se proteger contra incidentes.
Reginaldo Silva
16 de abr. de 20239 min de leitura


Databricks - Da para reduzir custos com paralelismo?
Paralelismo é um recurso muito importante para a computação, se bem aplicado pode trazer muitos benefícios, mas e para o mundo dos dados?
Reginaldo Silva
6 de fev. de 20234 min de leitura

Otimize seu Delta Lake e reduza custos (Storage, Databricks e computação)
Otimize seu Delta Lake e reduza custos com essa função disponibilizada para dar manutenção em suas tabelas.
Reginaldo Silva
28 de jan. de 20235 min de leitura
bottom of page