Pré-lançamento · Pré-Associate

PySpark do zero,
sem pagar mensalidade de cloud.

Curso prático de PySpark e arquitetura Lakehouse rodando 100% no Databricks Free Edition (ambiente gratuito da Databricks). 10 unidades + bônus técnico de classes Python.

10 unidades + bônus técnico Ambiente gratuito PT-BR + EN
Sobre o curso

Porta de entrada pro mundo Databricks

Parte do zero — não assume que você já sabe Spark ou Databricks. Roda na Free Edition.

  • Sem custo de cloud — o curso usa Databricks Free Edition, que é gratuito da Databricks (não precisa cartão de crédito pra criar conta)
  • Do zero ao Lakehouse — começa em "o que é Spark?" e termina criando um mini-Lakehouse com Delta
  • 5 pré-módulos teóricos — Spark, DataFrames, schemas, métodos fundamentais, como o motor funciona
  • Projeto Lakehouse em 4 módulos — setup → ingestão → transformações → mini-Lakehouse Delta
  • Bônus técnico — classes Python + PySpark reutilizável, ponte pro CI/CD
  • Material bilíngue — PT-BR e EN, com guias HTML + notebooks executáveis

Importante: gratuito vs pago

O ambiente é gratuito — você cria uma conta na Databricks Free Edition sem cartão, e roda os notebooks lá.

O curso da AD é um produto pago (currículo, simulados, notebooks, guias, suporte). Acesso hoje via Plano Gold.

Não confunda — o nome "Free" do curso se refere ao ambiente onde ele roda, não ao curso.

Ementa

10 unidades + bônus técnico

5 módulos teóricos para criar a base, 4 módulos práticos no Lakehouse, 1 bônus avançado.

A

Base teórica

5 pré-módulos
00a

O que é Spark, PySpark e DataFrames

Spark como engine distribuída, PySpark como API Python, DataFrame como abstração. Sem essa base, todos os métodos viram cargo cult.

00d

Schemas, StructType, StructField e cast

Declarar schemas, tipos do PySpark, conversão (cast) explícita. Previne inferência ruim e ingestão suja.

00e

Métodos fundamentais de DataFrame

select, filter, withColumn, groupBy, agg, show, count, sort — os métodos que aparecem em 80% do trabalho.

00f

Cheat sheet de comandos essenciais

Referência rápida com todos os comandos do curso, para consulta durante o trabalho.

00g

Como o Spark funciona por baixo

Stages, tasks, executors, driver, shuffle, lazy evaluation — mapa mental de execução. Desbloqueia leitura da Spark UI.

B

Projeto Lakehouse

4 módulos práticos
01

Setup e primeiros DataFrames

Criar conta Databricks Free, abrir workspace, criar cluster, primeiro notebook, primeiro DataFrame.

02

Ingestão CSV, JSON e schemas

Ler CSV/JSON com schema explícito, opções de leitura (header, inferSchema, multiLine, encoding), tratamento de tipos.

03

Transformações, joins e agregações

filter, withColumn, joins (inner/left/broadcast), agregações com groupBy, window functions básicas.

04

Mini Lakehouse Delta no Databricks Free

Criar mini-arquitetura Bronze/Silver/Gold com Delta no Free Edition, MERGE, OPTIMIZE, time travel.

Bônus técnico

avançado
05

Classes Python e PySpark reutilizável

Empacotar lógica PySpark em classes Python, notebooks como orquestradores, ponte para Git e CI/CD com bundles.

Pra quem é

Esse curso é pra você?

✓ É pra você se

  • Quer começar em engenharia de dados sem pagar cloud
  • Sabe Python básico mas nunca tocou Spark
  • Pretende fazer a certificação Associate da Databricks depois
  • Quer aprender Lakehouse na prática (não só teoria)
  • Vem de BI/Analytics e quer migrar pra engenharia

✗ Não é pra você se

  • Já é Data Engineer experiente com Spark/Databricks
  • Quer focar direto em production-grade (faça o Professional)
  • Procura curso só com vídeos, sem prática real
  • Não quer instalar nada nem criar conta na Databricks
Como acessar

PySpark Free é incluso no Plano Gold

Plano Gold dá acesso ao PySpark Free + Associate + Professional + GenAI + SDP + Azure DP-750 por R$ 795/ano.

Assinatura anual

Comece pelo PySpark e siga até a certificação Databricks

O Plano Gold dá acesso aos 6 cursos da família AD, à comunidade exclusiva no WhatsApp, e ao chatbot Athena que responde dúvidas citando aula específica. O caminho natural pra quem está começando: PySpark Free → Novo Associate → Professional.

  • PySpark no Databricks Free incluso (este curso)
  • Novo Associate 2026 — sua primeira certificação
  • Professional Data Engineer — quando estiver pronto
  • GenAI Engineer, SDP mini-curso, Azure DP-750
  • Comunidade exclusiva com outros alunos iniciantes
  • Chatbot Athena tirando dúvidas no WhatsApp
Investimento anual
R$ 795
por ano · ~R$ 66/mês
PySpark Free está em pré-lançamento — acesso só via Gold.
Plano Gold: R$ 795/ano · PySpark + Associate (R$ 499) + Professional (R$ 699) + 3 outros + Athena.
Só Associate + Professional avulso = R$ 1.198. Gold é R$ 795.
Entrar no Plano Gold → Quer só este curso? Fala com a equipe
FAQ

Perguntas frequentes

O Databricks Free Edition é mesmo gratuito?

Sim, é totalmente gratuito da Databricks. Você cria a conta em databricks.com/learn/free sem cartão de crédito. Tem limitações de recursos (cluster pequeno, sem alguns recursos enterprise) mas é mais que suficiente pra todo este curso.

E o curso da AD, é grátis?

Não. O ambiente Databricks é grátis. O curso da AD (currículo, simulados, notebooks, guias, suporte) é um produto pago. Acesso hoje via Plano Gold (R$ 795/ano).

Preciso saber programar antes?

Python básico ajuda — variáveis, funções, listas, condicionais. Não precisa saber Spark ou pandas. O curso parte do zero em Spark.

Faço o PySpark Free antes do Associate?

É o caminho recomendado pra quem está começando. PySpark Free constrói os fundamentos que o Associate assume que você já tem. Se você já manda bem em Spark, pode ir direto ao Associate.

Tem vídeos ou só material escrito?

O curso está em pré-lançamento. Currículo + simulados + notebooks executáveis + guias HTML já estão prontos. Vídeos entram em ondas. Quem entra no Plano Gold tem acesso aos materiais hoje e às gravações conforme elas saírem.

Tem suporte para dúvidas?

Sim — no WhatsApp da AD com nosso chatbot Athena, que responde citando aula específica. Para o que exige humano, há atendimento da equipe.

Quanto tempo leva pra terminar?

Estimativa: 4-6 semanas com 5-8 horas de estudo por semana. Quem já programa em Python pode acelerar.

Tem garantia de reembolso?

Sim, 7 dias de garantia padrão Kiwify. Pedidos em reembolso.kiwify.com.br.