top of page

Resumo sobre AWS Databricks Platform Architect - Accreditation

Fala dataholics, no post de hoje continuaremos falando sobre cursos, estudos e certificações, falaremos um pouco sobre os detalhes do curso AWS Databricks Platform Architect e seu badge.


No último post falamos sobre o curso Azure Databricks Platform Architect, dá uma conferida no conteúdo desse curso la, vale muito a pena:

Gosto muito da plataforma de cursos Databricks Academy, sem dúvidas la você encontra os melhores treinamentos, embora, somente inglês, infelizmente temos essa barreira ainda.


No próximo post deixarei uma lista de recomendações de treinamentos para fazer na plataforma.


Assim como o de Azure e GCP esse treinamento de AWS Platform Architect tem um foco para administradores e arquitetos, conteúdo focado para implementação com boas práticas e configuração de acessos, redes e particularidades de cada Cloud.


Vamos ao conteúdo.


Tempo total do conteúdo é 4h20, fiz pelo menos umas 15h00, precisei revisar e rever alguns vídeos diversas vezes para entender, confesso que levei uma surra na parte de configuração de Networking e Cloud Integrations.


Para ter uma noção, realizei 5x o teste do Accreditation antes de passar, cada vez que não passava voltava e assistia os vídeos em que achava que estava errando, a minha sorte é que para partners é gratuito, se não estaria pobre agora rs.


O teste do Accreditation é composto por 20 perguntas e você precisa acertar pelo menos 16 para receber o Badge.

OBS: O teste não é monitorado, então você pode pesquisar na internet durante o teste, NÃO faça isso, a ideia do teste é de fato medir se você assimilou o conteúdo, por reprovar 5x percebi que algo estava errado, eu realmente não estava assimilando ou aprendendo algo o que me fez parar, respirar e assistir o conteúdo com mais foco.


Diferente do teste de Azure que assisti o conteúdo somente 1x e passei de primeira, pois, já era mais o meu dia a dia, trabalho com AWS e GCP também, embora são ambientes já implementados e estáveis, logo algumas coisas desse curso são muito pontuais.


Aqui o resumo do conteúdo que você ira aprender nesse curso:


Platform Administration Fundamentals:

  • Arquitetura de referência na AWS

  • Credential Configuration

  • Storage Configuration

  • Metastore Configuration

  • Network and Key Configuration

    • Configuração bem importante de entender

  • Criando um Metastore

  • Criando um Workspace

  • Atribuindo um Mestastore para um Worksapce existente

  • Account API

  • IaC

  • Terraform

Obs: Esse conteúdo apesar de ser mais introdutório, preste bem atenção nos requisitos e configurações para criação de um workspace.


Networking and Security Fundamentals:

  • Customer-Managed VPC

    • Overview

    • Criando uma VPC

    • Deploying Workspace com VPC

    • Usando mesma VPC para vários Workspaces

  • Customer-Managed Keys

    • Overview

    • Criando uma Key Configuration no Account Console

    • Criando uma Key Configuration via Account API

    • Aplicando uma Key Configurations nos Workspaces

Obs: Esse conteúdo parece ser mais simples e curto, mas aqui é onde você deve dar maior atenção, principalmente na parte de VPC, entender as principais configurações, requisitos para subnets e permissões necessárias.


Cloud Integrations:

  • External Data Storage in S3

    • Overview

    • Configurando um Bucket no S3 com permissões necessárias

    • Storage Credentials

    • External Localtions

    • Acessando um External Storage

  • Data Streaming with Kinesis

    • Overview

    • Autenticando na AWS

    • Autenticando no Databricks

    • Acessando o Kinesis com Databricks

  • Data Warehousing with Redshift

    • Overview

    • Arquitetura

    • Configurando um storage temporário

    • Autenticando Databricks

    • Autenticando Redshift

    • Peering VPCs

    • Acessando Redshift com Databricks

Obs: Preste bem atenção na conexão entre o Databricks e as ferramentas externas, requisitos dentro da AWS e Databricks, com Redshift temos um detalhe importante que é a configuração de Peerging entre VPCs.


Se você comparar a grade de conteúdo desse curso com o de Azure, ele parece ser bem mais curto, embora, tenha a mesma quantidade de horas, são bem menos tópicos, contudo, achei mais complexos rs.

 

Conteúdo bem curto, mas, bastante agregador, continuarei aprendendo mais através de labs, a prática é muito importante para fixar de fato o conhecimento.


Um dos pontos mais chato que achei é bem específico da AWS, configuração de IAM Role e Policies para liberação de acessos, no Azure temos maneiras muitos mais simples de chegar no mesmo resultado com AppRegistration / Managed Identity e RBAC, embora, acredito que seja apenas a questão de familiaridade.


Sobre VPC é muito similar a VNET no Azure, então uma vez que você entenda o conceito em uma, se aplica para outra, o que pode mudar são as nomenclaturas.


No geral, tem muito mais detalhes e configurações do que no Azure, até por isso acho que o Terraform cai muito bem aqui na AWS, claro que para GCP e Azure também, o ponto é que no Azure as configurações são muito mais amigáveis de fazer pelo portal.


Sigo com a mesma recomendação do post anterior: Recomendo esse curso Databricks para times de administração/sustentação e arquitetos de dados, acredito que para engenheiros tem muito a agregar, sim, mas foge muito do seu dia a dia, se você é engenheiro de dados, foque nos cursos essenciais para se tornar um bom engenheiro e caso já tenha zerado a trilha, aí sim é muito valido esse curso, logo, seria para engenheiros de dados Sênior.


Espero que tenha gostado.


Fique bem e até a próxima.

57 visualizações0 comentário
Post: Blog2 Post
bottom of page