Strojové učení v praxi: detekce a klasifikace (AICLS)

Umělá Inteligence, AI pro vývojáře

Kurz poskytuje systematický rámec pro tvorbu detekčních a klasifikačních systémů založených na strojovém učení. Účastníci projdou kompletním životním cyklem modelu: od přípravy dat a návrhu příznaků (feature engineering), přes volbu algoritmů a vyhodnocení metrik (precision/recall, ROC‑AUC, F1), až po interpretaci výsledků (SHAP/LIME) a nasazení do provozu formou služeb (REST API, Docker, CI/CD). Důraz je kladen na prevenci běžných chyb (data leakage, chybné validace), replikovatelnost a bezpečné zacházení s daty.

Kurz reflektuje bezpečnostní use‑cases (phishing, DGA domény, anomálie v logech) i obecné scénáře. Součástí je návrh monitoringu kvality modelu, detekce driftu a proces retrainingu. Účastníci získají vzorové notebooky, šablony pipeline (scikit‑learn/MLflow), příklady REST služeb a checklist metrik. Výstupem je funkční klasifikátor, report výsledků a doporučení pro integraci do stávajícího SOC/MLOps ekosystému.

TOTO ŠKOLENÍ VÁM POMŮŽE:

  • Rozumět rozdílům mezi klasickým ML a DL pro detekční úlohy
  • Vybrat správné metriky (precision/recall, ROC-AUC, F1) a vyhodnotit model
  • Navrhnout a implementovat klasifikační pipeline (feature extraction › model › interpretace)
  • Nasadit model do provozu (Docker, CI/CD) a monitorovat jeho drift

KDO BY SE MĚL KURZU ZÚČASTNIT?

  • Data/ML inženýři, analytici, bezpečnostní týmy (SOC), vývojáři backendů
  • Každý, kdo řeší automatizovanou detekci (spam, fraud, DGA, anomálie)

Privátní školení a termíny na míru

Toto téma je možné zrealizovat pouze jako privátní, a to nejen formou uzavřeného firemního kurzu, ale také jako individuální konzultaci pro jednotlivce.

V případě kurzu na míru je níže uvedená osnova pouze inspirací. Finální obsah vzdělávání, jeho délka i termíny budou přizpůsobeny konkrétním vstupním znalostem, potřebám a cílům účastníků.

Cenovou nabídku vám rádi připravíme na základě vstupů zaslaných e-mailem nebo zadaných prostřednictvím poptávkového formuláře. Cena privátního školení vychází z náročnosti požadované obsahové náplně školení, časového rozsahu a celkového počtu přihlášených osob.

KDE A KDY KURZ PROBÍHÁ?

Kontaktujte nás

S námi máte na výběr: Přijďte na kurz osobně do naší učebny, nebo se ke kurzu připojte online. Pokud preferujete online formu, uveďte prosím do poznámky v objednávce "Připojím se virtuálně".
Více informací k hybridní formě školení naleznete zde.

Náplň kurzu:

Skrýt detaily
  • Úvod & opakování základů ML
    1. Terminologie: supervised/unsupervised, klasifikace vs. regrese, anomaly detection
    2. ML × DL: kdy stačí tree‑based modely, kdy CNN/LSTM/Transformers
    3. Data leakage, train/test split, cross‑validation – časté chyby a prevence
  • Detekční domény (security use‑cases)
    1. Phishing & spam: textové/URL rysy, reputace domén
    2. DGA/malicious domains: délka, entropie, n‑gramy, WHOIS/TLS atributy
    3. Anomálie v logech: outlier detection, DBSCAN, Isolation Forest
    4. Zdroje dat: Alexa/Tranco, Phishtank, vlastní logy, syntetická data
  • Feature engineering & výběr modelů
    1. Lexikální/statistické rysy pro domény/URL, TF‑IDF, hashing trick, embeddings
    2. XGBoost/LightGBM, SVM, RandomForest vs. jednoduchá CNN/LSTM
    3. Pipelines ve scikit‑learn, eliminace leakage, replikovatelnost
    4. Hyperparameter tuning: GridSearchCV vs. Optuna
  • Metriky a validace
    1. Confusion matrix, ROC vs. PR křivka (nevyvážená data)
    2. F1, balanced accuracy, MCC
    3. Interpretace modelu: SHAP/LIME
    4. K‑fold CV, stratifikace, time‑based split
  • Nasazení a provoz
    1. Export modelu (pickle/joblib vs. ONNX)
    2. Docker + REST API (FastAPI/Flask), CI/CD pipeline
    3. Monitoring kvality, logování predikcí, drift detekce, retraining (Airflow/cron), verzování (MLflow/DVC)
  • Hands‑on workshop
    1. Od CSV ke klasifikátoru: příprava dat, feature engineering, trénink modelů
    2. Vizualizace metrik (ROC/PR), SHAP interpretace
    3. Mini‑deploy (lokální REST API) + manažerský report
  • Bonus / rozšíření
    1. Active learning, semi‑supervised přístup
    2. Feature store & model registry (Feast, MLflow)
    3. Integrace se SIEM/SOC, automatické enrichování alertů
    4. Základy MLOps: monitoring, governance, reproducibility
Předpokládané znalosti:
Základní znalost Pythonu, základní povědomí o ML
Časový rozvrh:
2 dny (9:00hod. - 17:00hod.)