Pokročilá datová analýza v Pythonu (PYDATA2)

Programování, Python

Toto dvoudenní školení je určeno uživatelům se znalostí jazyka Python (knihovny Pandas), kteří se chtějí naučit efektivně analyzovat data. Účastníci se naučí pokročilé transformace dataframe, spojování dat z více dataframe, vizualizaci dat a práci s časovými řadami.

Dále se účastníci seznámí s problematikou lineární regrese a analýzou textových dat. Kurz poskytne účastníkům praktické zkušenosti v oblasti pokročilé datové analýzy v Pythonu.

TOTO ŠKOLENÍ VÁM POMŮŽE:

  • Analyzovat větší datové sady či informace z více datových sad najednou
  • Připravit si datovou sadu tak, aby bylo možné ji použít pro modely strojového učení, export do databáze či pro vizualizaci
  • Vytvářet si analýzu nad časovými řadami, a to dokonce i nad vlastními časovými řadami (typicky směny v podniku, pracovní dny v podniku apod.)
  • Tvořit plnohodnotné a dokonce i interaktivní dashboardy
  • Snáze pracovat a analyzovat textové hodnoty
  • Uchopit myšlenku strojového učení

KDO BY SE MĚL KURZU ZÚČASTNIT?

  • Uživatelé se základními znalostmi Python (knihovny Pandas), kteří si chtějí výrazně zjednodušit práci s velkými daty
  • Uživatelé se základními znalostmi Python, kteří hledají možnost analyzovat a vizualizovat data v jednom prostředí

Lokalita, termín kurzu



Virtuálně se můžete přidat i ke školením ve výše nabízených lokalitách. Do poznámky v objednávce prosím uveďte „Připojím se virtuálně“

Náplň kurzu:

Skrýt detaily
  • Pokročilé transformace dataframe 
    1. Převod sloupců na řádky a naopak 
    2. Práce se sloupci datového typu list 
    3. Tvorba kontingenčních tabulek 
    4. Spojování dat z více sloupců do jednoho sloupce datového typu list 
  • Spojování dat z více dataframe 
    1. Spojování dat pod sebe 
    2. Spojování dat vedle sebe 
  • Vizualizace dat 
    1. Nastavení okna pro vizualizace 
    2. Nastavení vlastností jednotlivých grafů 
    3. Možnosti vykreslení více grafů do jednoho okna 
    4. Základy tvorby interaktivních reportů 
  • Práce s časovými řadami 
    1. Posouvání se o řádky 
    2. Posouvání se o definované časové období 
    3. Tvorba vlastního kalendáře (např. kalendář pracovní doby, pracovních dnů apod.) 
  • Lineární regrese 
    1. Úvod do problematiky lineární regrese 
    2. Příprava dat pro model lineární regrese knihovny sklearn 
    3. Ověření přesnosti modelu, interpretace výsledků 
  • Analýza textových dat 
    1. Normalizace dat 
    2. Shlukování podobných textů (např. překlepy, texty bez diakritiky apod.) 
Předpokládané znalosti:
Znalost jazyka Python a knihovny Pandas
Doporučený předchozí kurz:
Datová analýza v Pythonu (PYDATA1)
Časový rozvrh:
2 dny (9:00hod. - 17:00hod.)
Cena za osobu:
10 800,00 Kč (13 068,00 Kč včetně 21% DPH)
Jazyk:
Česky