Python - datová analýza v Polars (PYDATA1B)
Programování, Python
Pracujete s daty v Excelu, Power Query, SQL nebo Pandas a narážíte na limity výkonu? Potřebujete zpracovat miliony řádků bez čekání? Polars je moderní knihovna pro Python, která zvládne to, co vaše stávající nástroje nezvládají – a výrazně rychleji.
Na workshopu se naučíte efektivně zpracovávat velká data pomocí Polars v Jupyter Notebooku. Využijete své znalosti z SQL a tabulkových nástrojů – syntaxe Polars vám bude povědomá. Získáte plnou kontrolu nad analýzou a naučíte se automatizovat opakující se úlohy.
TOTO ŠKOLENÍ VÁM POMŮŽE:
- Naučit se zpracovávat data pomocí knihovny Polars a vizualizovat je v grafech
- Automatizovat postup zpracování dat a získat plnou kontrolu nad jejich analýzou
- Používat Jupyter Notebook pro dokumentaci a interaktivní zpracování dat
- Zpracovávat i velké datasety díky optimalizaci dotazů a streaming režimu
- Načítat data z různých zdrojů – CSV, Excel, SQL, Parquet
- Porozumět chybovým hláškám a efektivně debugovat kód
KDO BY SE MĚL KURZU ZÚČASTNIT?
- Analytici pracující v Excelu nebo Power Query, kteří potřebují větší výkon
- Uživatelé Pandas, kteří naráží na limity při práci s velkými daty
- SQL uživatelé, kteří chtějí přenést své dovednosti do Pythonu
- Vývojáři budující datové pipeline a ETL procesy
KDE A KDY KURZ PROBÍHÁ?
Kontaktujte nás
S námi
máte na výběr: Přijďte na
kurz osobně do naší učebny, nebo se ke kurzu
připojte online. Pokud preferujete online formu, uveďte prosím do poznámky v objednávce "Připojím se virtuálně".
Více informací k hybridní formě školení
naleznete zde.
Náplň kurzu:
Skrýt detaily
-
Nástroje datové analýzy
-
Formulace problému
-
Přehled nástrojů pro datovou analýzu
-
Proč Polars – rychlost, efektivita, moderní API
-
Jupyter Notebook
-
Instalace a spuštění
-
Text a kód v jednom dokumentu
-
Spouštění jednotlivých kroků
-
Dokumentace postupu zpracování dat
-
DataFrame a základní operace
-
Vytváření DataFrame
-
Datové typy v Polars
-
Výběr sloupců a filtrování řádků
-
Přidávání a transformace sloupců
-
Expressions API
-
Co jsou expressions a proč jsou důležité
-
Výběr sloupců: pl.col(), pl.all(), pl.exclude()
-
Podmínky: pl.when().then().otherwise()
-
Řetězení operací (method chaining)
-
Zdroje dat
-
Tabulkové formáty (Excel, CSV)
-
Databázové zdroje (SQL)
-
Formát Parquet pro velká data
-
Práce s více soubory najednou
-
Zpracování dat
-
Transformace tabulkových dat
-
Konverze datových typů
-
Práce s chybějícími hodnotami
-
Spojování tabulek (join, concat)
-
Agregace dat
-
Seskupování a agregační funkce
-
Více agregací najednou
-
Pivot tabulky
-
Optimalizace výkonu
-
Lazy evaluation – automatická optimalizace dotazů
-
Kdy použít eager a kdy lazy režim
-
Streaming pro velká data
-
Vizualizace query plánu
-
Řešení chyb
-
Čtení chybových hlášek v Polars
-
Časté chyby: datové typy, chybějící sloupce
-
Debugging a kontrola dat
-
Výstupy a prezentace výsledků
-
Tabulky a grafy (Matplotlib)
-
Export do různých formátů
-
Předpokládané znalosti:
-
Základy Pythonu (proměnné, cykly, funkce). Zkušenost s Excel, SQL, Power Query nebo Pandas výhodou.
-
Časový rozvrh:
-
2 dny (9:00hod. - 17:00hod.)
-
Cena za osobu:
-
9 800,00 Kč (11 858,00 Kč včetně 21% DPH)