top of page
Topo
Buscar

Databricks - SQL Warehouse - Workflows Jobs - TIMEOUT
Evite custos desnecessários e force os desenvolvedores a criarem queries performáticas com a utilização dessa configuração.
Reginaldo Silva
25 de mar. de 20244 min de leitura

Databricks - Deletion Vector - Photon - Preditictive IO - Comparando a performance
Nesse post vamos comparar a performance do Deletion Vector e a engine do Photon.
Reginaldo Silva
26 de fev. de 20246 min de leitura


Databricks - Delta Lake - Particionar ou não, eis a questão! Guia definitivo!
Nesse post veremos como funciona o particionamento de dados e quando vale a pena utilizar.
Reginaldo Silva
16 de out. de 202310 min de leitura


Databricks - 7 TB - 127 BILHÕES de linhas - Truncate table vs Delete?
Você sabe qual é mais performático, truncate table ou delete?
Reginaldo Silva
17 de jul. de 20233 min de leitura

DTSTOOLS - Descubra o verdadeiro tamanho do seu Delta Lake
A DTSTOOLS é uma biblioteca para te ajudar com seu Delta Lake e reduzir custos de storage
Reginaldo Silva
19 de jun. de 20233 min de leitura


Delta Lake - Time Travel vs Change Data Feed (CDF) - O que você precisa saber
Nesse post você irá conhecer as particularidades do Time Travel e o Change Data Feed do Delta Lake.
Reginaldo Silva
5 de jun. de 20239 min de leitura


Databricks - Count(*) vs Count(1)? Como um Count em 100 Bilhões roda em menos de 1 segundo?
Já ouviu a lenda do COUNT(*) vs COUNT(1)? Nesse post vamos ir no deep dive.
Reginaldo Silva
8 de mai. de 20236 min de leitura


Databricks - Da para reduzir custos com paralelismo?
Paralelismo é um recurso muito importante para a computação, se bem aplicado pode trazer muitos benefícios, mas e para o mundo dos dados?
Reginaldo Silva
6 de fev. de 20234 min de leitura

Otimize seu Delta Lake e reduza custos (Storage, Databricks e computação)
Otimize seu Delta Lake e reduza custos com essa função disponibilizada para dar manutenção em suas tabelas.
Reginaldo Silva
28 de jan. de 20235 min de leitura
bottom of page