Ingyenes · Magyar nyelvű · Nyílt forráskódú

Projektalapú Data & AI Engineering crash course-ok

Építs végig egy modern adat- és AI-platformot lokálisan: Delta Lake, Spark, feature store, RAG chatbot, MLflow, Docker, Kubernetes és monitoring — egy közös webshop esettanulmányon keresztül.

Kurzusok böngészése Tanulási útvonalak
15
Kurzus
260+
Szekció
25+
Technológia
100%
Ingyenes
Saját haladás
0% · 0 / 260 szekció kész
Kinek szól?

Az oldal kifejezetten gyakorlatias

🔧

Junior / Medior Data Engineer

Akik szeretnének elsajátítani modern data toolokat: Delta Lake, Spark, Airflow, dbt, Databricks.

📊

Analytics Engineer

Akik mélyebben meg akarják érteni a data pipeline-okat, adatminőséget és lakehouse architektúrát.

💻

Backend fejlesztő → Data irány

Akik pályát akarnak módosítani data engineering vagy AI engineering irányba, gyakorlati projektekkel.

🤖

AI Engineer / MLOps iránt érdeklődő

Akik RAG rendszert, ML deployment-et, monitoringot vagy feature store-t akarnak építeni.

Tanulási útvonalak

Logikus sorrendben haladhatsz

Válaszd ki a számodra megfelelő útvonalat, és haladj a kurzusok sorrendjében. A zöld pipa jelöli az általad teljesített kurzusokat.

🏗️ Foundation

Alapozás · 3 kurzus · Kezdő

  1. SQL & Data Modeling
  2. Python for Data Engineering
  3. Docker & Local Data Platform
Kurzusok

Összes kurzus egy helyen

15 interaktív, projektalapú és magyar nyelvű kurzus. Minden kurzus kész és azonnal elkezdhető — kattints az info ikonra a részletes előnézetért.

15 kurzus

WebShop Pro Platform

A kurzusok egy közös dummy webshopra épülnek. Ugyanazokkal a rendelésekkel, termékekkel és clickstream eseményekkel dolgozol SQL-ben, Pythonban, Sparkban, Delta Lake-ben, dbt-ben, RAG-ben és MLOps-ban is.

WebShop Pro demo dashboard screenshot
Futtatható dummy webshop dashboard, amelyből a kurzusok adatai indulnak.
A projekt lokálisan is végigjátszható.

A Local Docker Lab elindítja a webshopot, az adatbázist, az adatpipeline-eszközöket, az AI/RAG réteget és a monitoringot. A Local Docker Lab oldalon minden service-nél látod, melyik kurzushoz tartozik, milyen URL-en éred el, és kell-e hozzá belépési adat.

shell
docker compose up -d --build
1

Forrásrendszer

Termékkatalógus, rendelések és clickstream események JSON fixture-ökben. Ezekből indul az SQL, Python és Docker alapozás.

2

Lakehouse

Bronze/Silver/Gold rétegek Delta Lake-kel és Sparkkal. Itt tanulod meg a tisztítást, joinokat, time travelt és optimalizálást.

3

Analytics

dbt martok készülnek napi bevételhez, termékteljesítményhez és customer lifetime value riportokhoz.

4

AI és Ops

RAG ügyfélszolgálat, churn modell, MLflow tracking, FastAPI serving és Grafana monitoring ugyanarra a webshopra.

Adatfolyam: source → bronze → silver → gold → AI → ops
orders / events
Bronze
nyers ingest
Silver
tisztított
Gold
KPI / mart
RAG + churn
monitoring
Karrier és kimenetek

Milyen szerepkörökre készít fel?

A kurzusok nem önéletrajz-díszítők — gyakorlati tudást adnak, amit valódi állásinterjún és projekten használhatsz. Az alábbi szerepekre direkt módon készítenek fel.

Data Engineer

900.000 – 2.000.000 Ft/hó*

Pipeline-okat épít, adatokat mozgat és transzformál. Ez az oldal Foundation + Data Engineering útvonalát járja be.

SparkDelta LakeAirflowSQL
📐

Analytics Engineer

800.000 – 1.600.000 Ft/hó*

Híd az adatmérnök és a data analyst között. dbt-vel és SQL-lel rétegzett analitikai modelleket épít.

dbtSQLBIGit
🤖

AI / ML Engineer

1.000.000 – 2.500.000 Ft/hó*

LLM és ML modelleket integrál production rendszerekbe. RAG, eval, MLOps a mindennapok.

OpenAIRAGMLflowFastAPI
🚀

MLOps Engineer

1.100.000 – 2.200.000 Ft/hó*

ML infrastruktúra, deployment, monitoring és drift. CI/CD pipeline ML modellekre.

DockerKubernetesPrometheusMLflow
☁️

Cloud Data Engineer

1.000.000 – 2.100.000 Ft/hó*

Databricks, Azure/AWS/GCP lakehouse platformokat üzemeltet és fejleszt.

DatabricksAzureUnity Catalog
🌊

Streaming Engineer

1.100.000 – 2.400.000 Ft/hó*

Real-time adatfeldolgozás Kafka és Flink/Spark stack-kel. Event-driven architektúrák.

KafkaSpark StreamingFlink

* Magyar piaci bérsáv, 2025 végi adatok alapján (Profession.hu, Pallon, Hays). A konkrét bér cég, senioritás és régió függő.

Technológiai stack

Amit használni fogsz

Valós production környezetben használt eszközök — nem Hello World demók, hanem tényleges szakmai toolkit.

További források

Tanulási források a kurzusokon túl

A kurzusok egy szilárd alapot adnak, de a data/AI engineering rohamosan fejlődő terület. Ezek a források segítenek naprakészen maradni.

Könyvek

A data & AI engineering legfontosabb referenciaművei.

YouTube csatornák

A legjobb ingyenes tartalom a téma iránt érdeklődőknek.

Ingyenes kurzusok

Minőségi ingyenes programok, ha mélyebbre akarsz ásni.

Közösség

Fórumok, hol szakmai kérdésekre választ kaphatsz.

Blogok és newsletterek

Heti-havi frissítések a területről.

Gyakori kérdések

GYIK

Kinek ajánlott ez a kurzusgyűjtemény?

Junior és medior data engineereknek, analytics engineereknek, backend fejlesztőknek, akik data vagy AI engineering irányba mennek, és AI engineereknek, akik RAG rendszert vagy MLOps-ot akarnak építeni. Ha teljesen kezdő vagy, a Foundation útvonal (SQL + Python + Docker) megadja az alapokat.

Mennyibe kerül?

Teljesen ingyenes, nyílt forráskódú (MIT License). Regisztráció sem szükséges — bármelyik kurzust azonnal elkezdheted.

Mennyi idő elvégezni egy kurzust?

Kurzustól függően 2–6 óra. Saját tempóban haladhatsz — a haladás automatikusan mentődik a böngésződben. Az összes kurzus kb. 60–80 óra intenzív munkát igényel, ha lineárisan végigcsinálod.

Milyen előfeltételek vannak?

A Foundation útvonal (SQL, Python, Docker) nulláról indul. A haladóbb kurzusokhoz a kurzuskártyáknál feltüntetjük az előfeltételeket — ezek közt általában Delta Lake és Spark alapismeret szerepel.

Milyen gépigény szükséges?

Egy átlagos laptop bőven elég (8 GB RAM ajánlott, 16 GB kényelmesebb). A lokális példák szándékosan kis adathalmazon futnak, hogy mindenki ki tudja próbálni őket. A Docker-alapú kurzusokhoz érdemes legalább 20 GB szabad lemez.

Kapok-e tanúsítványt?

Jelenleg nem adunk hivatalos tanúsítványt. A cél a gyakorlati tudás: a GitHub repo és az elkészült projektek beszélnek magukért az állásinterjúkon. Ha bővíted a saját portfóliódat a kurzus-projektekkel (és továbbfejleszted őket), az önmagában erősebb, mint egy certifikát.

Milyen sorrendben érdemes haladni?

Nézd meg a Tanulási útvonalak szekciót. Három előre megtervezett útvonal van: Foundation (kezdőknek alap), Data Engineering (teljes DE pipeline), AI Engineering (LLM és MLOps). Minden útvonal logikus sorrendben építi fel a tudást.

Hogyan tudok segíteni / hozzájárulni?

A projekt nyílt forráskódú a GitHub-on. Pull request, issue, typo-javítás, új kurzus-ötlet mind jöhet. Ha egy kurzust elvégeztél és hasznosnak találtad, a legjobb köszönet ha megosztod LinkedIn-en vagy valakinek, aki tanul.

Mi van ha elakadok egy kurzusnál?

Mindegyik kurzus lépésről lépésre van magyarázva, és minden kódrészlet lokálisan futtatható. Ha elakadsz: (1) ellenőrizd a pontos parancsot/verzió-t, (2) nézd meg a kurzus bootstrap scriptjét (bootstrap.sh / bootstrap.ps1), (3) nyiss egy GitHub Issue-t.

Mennyire naprakészek a kurzusok?

A kurzusok a 2026-os helyzetet tükrözik a főbb eszközökkel: Delta Lake 3.x, Spark 3.5+, Databricks Unity Catalog, OpenAI-modellek, MLflow 2.x. Ha szakmai változás van, GitHubon követheted: csillagozd a repót, és kapcsold be a Watch figyelést.