Python - datová analýza v Polars (PYDATA1B)

Programování, Python

Pracujete s daty v Excelu, Power Query, SQL nebo Pandas a narážíte na limity výkonu? Potřebujete zpracovat miliony řádků bez čekání? Polars je moderní knihovna pro Python, která zvládne to, co vaše stávající nástroje nezvládají – a výrazně rychleji.

Na workshopu se naučíte efektivně zpracovávat velká data pomocí Polars v Jupyter Notebooku. Využijete své znalosti z SQL a tabulkových nástrojů – syntaxe Polars vám bude povědomá. Získáte plnou kontrolu nad analýzou a naučíte se automatizovat opakující se úlohy.

TOTO ŠKOLENÍ VÁM POMŮŽE:

  • Naučit se zpracovávat data pomocí knihovny Polars a vizualizovat je v grafech
  • Automatizovat postup zpracování dat a získat plnou kontrolu nad jejich analýzou
  • Používat Jupyter Notebook pro dokumentaci a interaktivní zpracování dat
  • Zpracovávat i velké datasety díky optimalizaci dotazů a streaming režimu
  • Načítat data z různých zdrojů – CSV, Excel, SQL, Parquet
  • Porozumět chybovým hláškám a efektivně debugovat kód

KDO BY SE MĚL KURZU ZÚČASTNIT?

  • Analytici pracující v Excelu nebo Power Query, kteří potřebují větší výkon
  • Uživatelé Pandas, kteří naráží na limity při práci s velkými daty
  • SQL uživatelé, kteří chtějí přenést své dovednosti do Pythonu
  • Vývojáři budující datové pipeline a ETL procesy

KDE A KDY KURZ PROBÍHÁ?

Kontaktujte nás

S námi máte na výběr: Přijďte na kurz osobně do naší učebny, nebo se ke kurzu připojte online. Pokud preferujete online formu, uveďte prosím do poznámky v objednávce "Připojím se virtuálně".
Více informací k hybridní formě školení naleznete zde.

Náplň kurzu:

Skrýt detaily
  • Nástroje datové analýzy
    1. Formulace problému
    2. Přehled nástrojů pro datovou analýzu
    3. Proč Polars – rychlost, efektivita, moderní API
  • Jupyter Notebook
    1. Instalace a spuštění
    2. Text a kód v jednom dokumentu
    3. Spouštění jednotlivých kroků
    4. Dokumentace postupu zpracování dat
  • DataFrame a základní operace
    1. Vytváření DataFrame
    2. Datové typy v Polars
    3. Výběr sloupců a filtrování řádků
    4. Přidávání a transformace sloupců
  • Expressions API
    1. Co jsou expressions a proč jsou důležité
    2. Výběr sloupců: pl.col(), pl.all(), pl.exclude()
    3. Podmínky: pl.when().then().otherwise()
    4. Řetězení operací (method chaining)
  • Zdroje dat
    1. Tabulkové formáty (Excel, CSV)
    2. Databázové zdroje (SQL)
    3. Formát Parquet pro velká data
    4. Práce s více soubory najednou
  • Zpracování dat
    1. Transformace tabulkových dat
    2. Konverze datových typů
    3. Práce s chybějícími hodnotami
    4. Spojování tabulek (join, concat)
  • Agregace dat
    1. Seskupování a agregační funkce
    2. Více agregací najednou
    3. Pivot tabulky
  • Optimalizace výkonu
    1. Lazy evaluation – automatická optimalizace dotazů
    2. Kdy použít eager a kdy lazy režim
    3. Streaming pro velká data
    4. Vizualizace query plánu
  • Řešení chyb
    1. Čtení chybových hlášek v Polars
    2. Časté chyby: datové typy, chybějící sloupce
    3. Debugging a kontrola dat
  • Výstupy a prezentace výsledků
    1. Tabulky a grafy (Matplotlib)
    2. Export do různých formátů
Předpokládané znalosti:
Základy Pythonu (proměnné, cykly, funkce). Zkušenost s Excel, SQL, Power Query nebo Pandas výhodou.
Časový rozvrh:
2 dny (9:00hod. - 17:00hod.)
Cena za osobu:
9 800,00 Kč (11 858,00 Kč včetně 21% DPH)