top of page
Topo
Buscar


Databricks - Deletion Vectors - Otimizando seu Storage
Deletion Vector - Essa feature pode otimizar seu custo com Storage.
Reginaldo Silva
22 de mai. de 20235 min de leitura


Databricks - Count(*) vs Count(1)? Como um Count em 100 Bilhões roda em menos de 1 segundo?
Já ouviu a lenda do COUNT(*) vs COUNT(1)? Nesse post vamos ir no deep dive.
Reginaldo Silva
8 de mai. de 20236 min de leitura


Backup de Data Lake, isso existe? Salvando vidas e empregos
Já ouviu falar em Backup de Data Lake? De fato, esse tema não é tão falado assim, mas existem maneiras de se proteger contra incidentes.
Reginaldo Silva
16 de abr. de 20239 min de leitura


Databricks - Casos de suporte - Você sabe a diferença entre %run e dbutils.notebook.run()?
Você sabe a diferença entre o %run e o notebook.run()?
Reginaldo Silva
26 de mar. de 20234 min de leitura


Databricks: Where date = current_date (Cade meus dados?) Cuidado com o UTC
Já teve problemas com datas, timestamp, timezone no Databricks? Esse post é para voce.
Reginaldo Silva
6 de mar. de 20232 min de leitura


Quanto custa o Databricks? Da para salvar dinheiro depois desse vídeo?
Como precificar um ambiente de Databricks? Como fazer saving no ambiente com as informações desse video?
Reginaldo Silva
22 de fev. de 20231 min de leitura


(DBUTILS.FS.LS + Recursividade -> Dataframe) Transforme o resultado do Dbutils em Dataframe
Converta o resultado do dbutils.fs.ls() em Dataframe e leia pastas de forma recursiva.
Reginaldo Silva
20 de fev. de 20232 min de leitura


Databricks APIs - Clusters (List, Create e Delete)
Databricks: Veja como listar seus clusters para utilizar em diversos reports.
Reginaldo Silva
11 de fev. de 20233 min de leitura

![Databricks [1] - Clouds, como o Databricks roda e suas curiosidades no Azure](https://static.wixstatic.com/media/a794bc_87ecd53d237746efa6be04dcd33505a8~mv2.jpg/v1/fill/w_454,h_341,fp_0.50_0.50,q_90,enc_avif,quality_auto/a794bc_87ecd53d237746efa6be04dcd33505a8~mv2.webp)
Databricks [1] - Clouds, como o Databricks roda e suas curiosidades no Azure
Curiosidades como:
- Data Plane vs Control Plane
- Containers?!
- Você sabia que os dados do Display() vai para conta da Databricks?
Reginaldo Silva
8 de fev. de 20231 min de leitura


Databricks - Da para reduzir custos com paralelismo?
Paralelismo é um recurso muito importante para a computação, se bem aplicado pode trazer muitos benefícios, mas e para o mundo dos dados?
Reginaldo Silva
6 de fev. de 20234 min de leitura
bottom of page