Fala dataholics, no post de hoje continuaremos falando sobre cursos, estudos e certificações, falaremos um pouco sobre os detalhes do curso AWS Databricks Platform Architect e seu badge.
No último post falamos sobre o curso Azure Databricks Platform Architect, dá uma conferida no conteúdo desse curso la, vale muito a pena:
Gosto muito da plataforma de cursos Databricks Academy, sem dúvidas la você encontra os melhores treinamentos, embora, somente inglês, infelizmente temos essa barreira ainda.
No próximo post deixarei uma lista de recomendações de treinamentos para fazer na plataforma.
Assim como o de Azure e GCP esse treinamento de AWS Platform Architect tem um foco para administradores e arquitetos, conteúdo focado para implementação com boas práticas e configuração de acessos, redes e particularidades de cada Cloud.
Vamos ao conteúdo.
Tempo total do conteúdo é 4h20, fiz pelo menos umas 15h00, precisei revisar e rever alguns vídeos diversas vezes para entender, confesso que levei uma surra na parte de configuração de Networking e Cloud Integrations.
Para ter uma noção, realizei 5x o teste do Accreditation antes de passar, cada vez que não passava voltava e assistia os vídeos em que achava que estava errando, a minha sorte é que para partners é gratuito, se não estaria pobre agora rs.
O teste do Accreditation é composto por 20 perguntas e você precisa acertar pelo menos 16 para receber o Badge.
OBS: O teste não é monitorado, então você pode pesquisar na internet durante o teste, NÃO faça isso, a ideia do teste é de fato medir se você assimilou o conteúdo, por reprovar 5x percebi que algo estava errado, eu realmente não estava assimilando ou aprendendo algo o que me fez parar, respirar e assistir o conteúdo com mais foco.
Diferente do teste de Azure que assisti o conteúdo somente 1x e passei de primeira, pois, já era mais o meu dia a dia, trabalho com AWS e GCP também, embora são ambientes já implementados e estáveis, logo algumas coisas desse curso são muito pontuais.
Aqui o resumo do conteúdo que você ira aprender nesse curso:
Platform Administration Fundamentals:
Arquitetura de referência na AWS
Credential Configuration
Storage Configuration
Metastore Configuration
Network and Key Configuration
Configuração bem importante de entender
Criando um Metastore
Criando um Workspace
Atribuindo um Mestastore para um Worksapce existente
Account API
IaC
Terraform
Obs: Esse conteúdo apesar de ser mais introdutório, preste bem atenção nos requisitos e configurações para criação de um workspace.
Networking and Security Fundamentals:
Customer-Managed VPC
Overview
Criando uma VPC
Deploying Workspace com VPC
Usando mesma VPC para vários Workspaces
Customer-Managed Keys
Overview
Criando uma Key Configuration no Account Console
Criando uma Key Configuration via Account API
Aplicando uma Key Configurations nos Workspaces
Obs: Esse conteúdo parece ser mais simples e curto, mas aqui é onde você deve dar maior atenção, principalmente na parte de VPC, entender as principais configurações, requisitos para subnets e permissões necessárias.
Cloud Integrations:
External Data Storage in S3
Overview
Configurando um Bucket no S3 com permissões necessárias
Storage Credentials
External Localtions
Acessando um External Storage
Data Streaming with Kinesis
Overview
Autenticando na AWS
Autenticando no Databricks
Acessando o Kinesis com Databricks
Data Warehousing with Redshift
Overview
Arquitetura
Configurando um storage temporário
Autenticando Databricks
Autenticando Redshift
Peering VPCs
Acessando Redshift com Databricks
Obs: Preste bem atenção na conexão entre o Databricks e as ferramentas externas, requisitos dentro da AWS e Databricks, com Redshift temos um detalhe importante que é a configuração de Peerging entre VPCs.
Se você comparar a grade de conteúdo desse curso com o de Azure, ele parece ser bem mais curto, embora, tenha a mesma quantidade de horas, são bem menos tópicos, contudo, achei mais complexos rs.
Conteúdo bem curto, mas, bastante agregador, continuarei aprendendo mais através de labs, a prática é muito importante para fixar de fato o conhecimento.
Um dos pontos mais chato que achei é bem específico da AWS, configuração de IAM Role e Policies para liberação de acessos, no Azure temos maneiras muitos mais simples de chegar no mesmo resultado com AppRegistration / Managed Identity e RBAC, embora, acredito que seja apenas a questão de familiaridade.
Sobre VPC é muito similar a VNET no Azure, então uma vez que você entenda o conceito em uma, se aplica para outra, o que pode mudar são as nomenclaturas.
No geral, tem muito mais detalhes e configurações do que no Azure, até por isso acho que o Terraform cai muito bem aqui na AWS, claro que para GCP e Azure também, o ponto é que no Azure as configurações são muito mais amigáveis de fazer pelo portal.
Sigo com a mesma recomendação do post anterior: Recomendo esse curso Databricks para times de administração/sustentação e arquitetos de dados, acredito que para engenheiros tem muito a agregar, sim, mas foge muito do seu dia a dia, se você é engenheiro de dados, foque nos cursos essenciais para se tornar um bom engenheiro e caso já tenha zerado a trilha, aí sim é muito valido esse curso, logo, seria para engenheiros de dados Sênior.
Espero que tenha gostado.
Fique bem e até a próxima.
Comments