Ingyenes · Magyar nyelvű · Nyílt forráskódú

Projektalapú Data & AI Engineering crash course-ok

Q: Mennyi idő elvégezni egy kurzust?

Kurzustól függően 2-6 óra. Saját tempóban haladhatsz — a haladás automatikusan mentődik a böngésződben.

Q: Milyen előfeltételek vannak?

A Foundation útvonal (SQL, Python, Docker) nulláról indul. A haladóbb kurzusokhoz a kurzuskártyáknál feltüntetjük az előfeltételeket.

Q: Kapok-e tanúsítványt?

Jelenleg nem adunk hivatalos tanúsítványt. A cél a gyakorlati tudás: a GitHub repo és az elkészült projektek beszélnek magukért az állásinterjúkon.

Építs végig egy modern adat- és AI-platformot lokálisan: Delta Lake, Spark, feature store, RAG chatbot, MLflow, Docker, Kubernetes és monitoring — egy közös webshop esettanulmányon keresztül.

Kurzusok böngészése Tanulási útvonalak

Kurzus

260+

Szekció

25+

Technológia

100%

Ingyenes

Saját haladás

0% · 0 / 260 szekció kész

Kinek szól?

Az oldal kifejezetten gyakorlatias

🔧

Junior / Medior Data Engineer

Akik szeretnének elsajátítani modern data toolokat: Delta Lake, Spark, Airflow, dbt, Databricks.

📊

Analytics Engineer

Akik mélyebben meg akarják érteni a data pipeline-okat, adatminőséget és lakehouse architektúrát.

💻

Backend fejlesztő → Data irány

Akik pályát akarnak módosítani data engineering vagy AI engineering irányba, gyakorlati projektekkel.

🤖

AI Engineer / MLOps iránt érdeklődő

Akik RAG rendszert, ML deployment-et, monitoringot vagy feature store-t akarnak építeni.

Tanulási útvonalak

Logikus sorrendben haladhatsz

Válaszd ki a számodra megfelelő útvonalat, és haladj a kurzusok sorrendjében. A zöld pipa jelöli az általad teljesített kurzusokat.

🏗️ Foundation

Alapozás · 3 kurzus · Kezdő

⚡ Data Engineering

Teljes pipeline · 10 kurzus · Kezdőtől haladóig

🤖 AI Engineering

LLM → RAG → Eval → Production · 7 kurzus · Középhaladó

Kurzusok

Összes kurzus egy helyen

15 interaktív, projektalapú és magyar nyelvű kurzus. Minden kurzus kész és azonnal elkezdhető — kattints az info ikonra a részletes előnézetért.

15 kurzus

Közös projektalap

WebShop Pro Platform

A kurzusok egy közös dummy webshopra épülnek. Ugyanazokkal a rendelésekkel, termékekkel és clickstream eseményekkel dolgozol SQL-ben, Pythonban, Sparkban, Delta Lake-ben, dbt-ben, RAG-ben és MLOps-ban is.

WebShop demo megnyitása Local Docker Lab

WebShop Pro demo dashboard screenshot — Futtatható dummy webshop dashboard, amelyből a kurzusok adatai indulnak.

A projekt lokálisan is végigjátszható.

A Local Docker Lab elindítja a webshopot, az adatbázist, az adatpipeline-eszközöket, az AI/RAG réteget és a monitoringot. A Local Docker Lab oldalon minden service-nél látod, melyik kurzushoz tartozik, milyen URL-en éred el, és kell-e hozzá belépési adat.

shell

docker compose up -d --build

Forrásrendszer

Termékkatalógus, rendelések és clickstream események JSON fixture-ökben. Ezekből indul az SQL, Python és Docker alapozás.

Lakehouse

Bronze/Silver/Gold rétegek Delta Lake-kel és Sparkkal. Itt tanulod meg a tisztítást, joinokat, time travelt és optimalizálást.

Analytics

dbt martok készülnek napi bevételhez, termékteljesítményhez és customer lifetime value riportokhoz.

AI és Ops

RAG ügyfélszolgálat, churn modell, MLflow tracking, FastAPI serving és Grafana monitoring ugyanarra a webshopra.

Adatfolyam: source → bronze → silver → gold → AI → ops

orders / events

→

Bronze
nyers ingest

→

Silver
tisztított

→

Gold
KPI / mart

→

RAG + churn

→

monitoring

Karrier és kimenetek

Milyen szerepkörökre készít fel?

A kurzusok nem önéletrajz-díszítők — gyakorlati tudást adnak, amit valódi állásinterjún és projekten használhatsz. Az alábbi szerepekre direkt módon készítenek fel.

⚡

Data Engineer

900.000 – 2.000.000 Ft/hó*

Pipeline-okat épít, adatokat mozgat és transzformál. Ez az oldal Foundation + Data Engineering útvonalát járja be.

SparkDelta LakeAirflowSQL

📐

Analytics Engineer

800.000 – 1.600.000 Ft/hó*

Híd az adatmérnök és a data analyst között. dbt-vel és SQL-lel rétegzett analitikai modelleket épít.

dbtSQLBIGit

🤖

AI / ML Engineer

1.000.000 – 2.500.000 Ft/hó*

LLM és ML modelleket integrál production rendszerekbe. RAG, eval, MLOps a mindennapok.

OpenAIRAGMLflowFastAPI

🚀

MLOps Engineer

1.100.000 – 2.200.000 Ft/hó*

ML infrastruktúra, deployment, monitoring és drift. CI/CD pipeline ML modellekre.

DockerKubernetesPrometheusMLflow

☁️

Cloud Data Engineer

1.000.000 – 2.100.000 Ft/hó*

Databricks, Azure/AWS/GCP lakehouse platformokat üzemeltet és fejleszt.

DatabricksAzureUnity Catalog

🌊

Streaming Engineer

1.100.000 – 2.400.000 Ft/hó*

Real-time adatfeldolgozás Kafka és Flink/Spark stack-kel. Event-driven architektúrák.

KafkaSpark StreamingFlink

* Magyar piaci bérsáv, 2025 végi adatok alapján (Profession.hu, Pallon, Hays). A konkrét bér cég, senioritás és régió függő.

Technológiai stack

Amit használni fogsz

Valós production környezetben használt eszközök — nem Hello World demók, hanem tényleges szakmai toolkit.

További források

Tanulási források a kurzusokon túl

A kurzusok egy szilárd alapot adnak, de a data/AI engineering rohamosan fejlődő terület. Ezek a források segítenek naprakészen maradni.

Könyvek

A data & AI engineering legfontosabb referenciaművei.

Designing Data-Intensive Applications — Kleppmann
Fundamentals of Data Engineering — Reis, Housley
Designing Machine Learning Systems — Chip Huyen
AI Engineering — Chip Huyen (2025)
The Data Warehouse Toolkit — Kimball

YouTube csatornák

A legjobb ingyenes tartalom a téma iránt érdeklődőknek.

DataTalksClub — MLOps és Data Engineering Zoomcamp
Databricks — platform és lakehouse
Advancing Analytics — gyakorlati Databricks
Confluent — Kafka és streaming
Marc Lamberti — Apache Airflow

Ingyenes kurzusok

Minőségi ingyenes programok, ha mélyebbre akarsz ásni.

DE Zoomcamp — 9 hetes DE program
MLOps Zoomcamp — MLOps A-tól Z-ig
dbt Learn — hivatalos dbt kurzus
Databricks Academy — Community Edition + Trainings
DeepLearning.AI Short Courses — AI/RAG/LLMOps

Közösség

Fórumok, hol szakmai kérdésekre választ kaphatsz.

Blogok és newsletterek

Heti-havi frissítések a területről.

Cheatsheet-ek

Gyors referencia a napi munkához.

Gyakori kérdések

GYIK

Kinek ajánlott ez a kurzusgyűjtemény?

Junior és medior data engineereknek, analytics engineereknek, backend fejlesztőknek, akik data vagy AI engineering irányba mennek, és AI engineereknek, akik RAG rendszert vagy MLOps-ot akarnak építeni. Ha teljesen kezdő vagy, a Foundation útvonal (SQL + Python + Docker) megadja az alapokat.

Mennyibe kerül?

Teljesen ingyenes, nyílt forráskódú (MIT License). Regisztráció sem szükséges — bármelyik kurzust azonnal elkezdheted.

Mennyi idő elvégezni egy kurzust?

Kurzustól függően 2–6 óra. Saját tempóban haladhatsz — a haladás automatikusan mentődik a böngésződben. Az összes kurzus kb. 60–80 óra intenzív munkát igényel, ha lineárisan végigcsinálod.

Milyen előfeltételek vannak?

A Foundation útvonal (SQL, Python, Docker) nulláról indul. A haladóbb kurzusokhoz a kurzuskártyáknál feltüntetjük az előfeltételeket — ezek közt általában Delta Lake és Spark alapismeret szerepel.

Milyen gépigény szükséges?

Egy átlagos laptop bőven elég (8 GB RAM ajánlott, 16 GB kényelmesebb). A lokális példák szándékosan kis adathalmazon futnak, hogy mindenki ki tudja próbálni őket. A Docker-alapú kurzusokhoz érdemes legalább 20 GB szabad lemez.

Kapok-e tanúsítványt?

Jelenleg nem adunk hivatalos tanúsítványt. A cél a gyakorlati tudás: a GitHub repo és az elkészült projektek beszélnek magukért az állásinterjúkon. Ha bővíted a saját portfóliódat a kurzus-projektekkel (és továbbfejleszted őket), az önmagában erősebb, mint egy certifikát.

Milyen sorrendben érdemes haladni?

Nézd meg a Tanulási útvonalak szekciót. Három előre megtervezett útvonal van: Foundation (kezdőknek alap), Data Engineering (teljes DE pipeline), AI Engineering (LLM és MLOps). Minden útvonal logikus sorrendben építi fel a tudást.

Hogyan tudok segíteni / hozzájárulni?

A projekt nyílt forráskódú a GitHub-on. Pull request, issue, typo-javítás, új kurzus-ötlet mind jöhet. Ha egy kurzust elvégeztél és hasznosnak találtad, a legjobb köszönet ha megosztod LinkedIn-en vagy valakinek, aki tanul.

Mi van ha elakadok egy kurzusnál?

Mindegyik kurzus lépésről lépésre van magyarázva, és minden kódrészlet lokálisan futtatható. Ha elakadsz: (1) ellenőrizd a pontos parancsot/verzió-t, (2) nézd meg a kurzus bootstrap scriptjét (bootstrap.sh / bootstrap.ps1), (3) nyiss egy GitHub Issue-t.

Mennyire naprakészek a kurzusok?

A kurzusok a 2026-os helyzetet tükrözik a főbb eszközökkel: Delta Lake 3.x, Spark 3.5+, Databricks Unity Catalog, OpenAI-modellek, MLflow 2.x. Ha szakmai változás van, GitHubon követheted: csillagozd a repót, és kapcsold be a Watch figyelést.