Strojové učení v praxi: detekce a klasifikace (AICLS)
Umělá Inteligence, AI pro vývojáře
Kurz poskytuje systematický rámec pro tvorbu detekčních a klasifikačních systémů založených na strojovém učení. Účastníci projdou kompletním životním cyklem modelu: od přípravy dat a návrhu příznaků (feature engineering), přes volbu algoritmů a vyhodnocení metrik (precision/recall, ROC‑AUC, F1), až po interpretaci výsledků (SHAP/LIME) a nasazení do provozu formou služeb (REST API, Docker, CI/CD). Důraz je kladen na prevenci běžných chyb (data leakage, chybné validace), replikovatelnost a bezpečné zacházení s daty.
Kurz reflektuje bezpečnostní use‑cases (phishing, DGA domény, anomálie v logech) i obecné scénáře. Součástí je návrh monitoringu kvality modelu, detekce driftu a proces retrainingu. Účastníci získají vzorové notebooky, šablony pipeline (scikit‑learn/MLflow), příklady REST služeb a checklist metrik. Výstupem je funkční klasifikátor, report výsledků a doporučení pro integraci do stávajícího SOC/MLOps ekosystému.
TOTO ŠKOLENÍ VÁM POMŮŽE:
- Rozumět rozdílům mezi klasickým ML a DL pro detekční úlohy
- Vybrat správné metriky (precision/recall, ROC-AUC, F1) a vyhodnotit model
- Navrhnout a implementovat klasifikační pipeline (feature extraction › model › interpretace)
- Nasadit model do provozu (Docker, CI/CD) a monitorovat jeho drift
KDO BY SE MĚL KURZU ZÚČASTNIT?
- Data/ML inženýři, analytici, bezpečnostní týmy (SOC), vývojáři backendů
- Každý, kdo řeší automatizovanou detekci (spam, fraud, DGA, anomálie)
Privátní školení a termíny na míru
Toto téma je možné zrealizovat pouze jako privátní, a to nejen formou uzavřeného firemního kurzu, ale také jako individuální konzultaci pro jednotlivce.
V případě kurzu na míru je níže uvedená osnova pouze inspirací. Finální obsah vzdělávání, jeho délka i termíny budou přizpůsobeny konkrétním vstupním znalostem, potřebám a cílům účastníků.
Cenovou nabídku vám rádi připravíme na základě vstupů zaslaných e-mailem nebo zadaných prostřednictvím poptávkového formuláře. Cena privátního školení vychází z náročnosti požadované obsahové náplně školení, časového rozsahu a celkového počtu přihlášených osob.
KDE A KDY KURZ PROBÍHÁ?
Kontaktujte nás
S námi
máte na výběr: Přijďte na
kurz osobně do naší učebny, nebo se ke kurzu
připojte online. Pokud preferujete online formu, uveďte prosím do poznámky v objednávce "Připojím se virtuálně".
Více informací k hybridní formě školení
naleznete zde.
Náplň kurzu:
Skrýt detaily
-
Úvod & opakování základů ML
-
Terminologie: supervised/unsupervised, klasifikace vs. regrese, anomaly detection
-
ML × DL: kdy stačí tree‑based modely, kdy CNN/LSTM/Transformers
-
Data leakage, train/test split, cross‑validation – časté chyby a prevence
-
Detekční domény (security use‑cases)
-
Phishing & spam: textové/URL rysy, reputace domén
-
DGA/malicious domains: délka, entropie, n‑gramy, WHOIS/TLS atributy
-
Anomálie v logech: outlier detection, DBSCAN, Isolation Forest
-
Zdroje dat: Alexa/Tranco, Phishtank, vlastní logy, syntetická data
-
Feature engineering & výběr modelů
-
Lexikální/statistické rysy pro domény/URL, TF‑IDF, hashing trick, embeddings
-
XGBoost/LightGBM, SVM, RandomForest vs. jednoduchá CNN/LSTM
-
Pipelines ve scikit‑learn, eliminace leakage, replikovatelnost
-
Hyperparameter tuning: GridSearchCV vs. Optuna
-
Metriky a validace
-
Confusion matrix, ROC vs. PR křivka (nevyvážená data)
-
F1, balanced accuracy, MCC
-
Interpretace modelu: SHAP/LIME
-
K‑fold CV, stratifikace, time‑based split
-
Nasazení a provoz
-
Export modelu (pickle/joblib vs. ONNX)
-
Docker + REST API (FastAPI/Flask), CI/CD pipeline
-
Monitoring kvality, logování predikcí, drift detekce, retraining (Airflow/cron), verzování (MLflow/DVC)
-
Hands‑on workshop
-
Od CSV ke klasifikátoru: příprava dat, feature engineering, trénink modelů
-
Vizualizace metrik (ROC/PR), SHAP interpretace
-
Mini‑deploy (lokální REST API) + manažerský report
-
Bonus / rozšíření
-
Active learning, semi‑supervised přístup
-
Feature store & model registry (Feast, MLflow)
-
Integrace se SIEM/SOC, automatické enrichování alertů
-
Základy MLOps: monitoring, governance, reproducibility
-
Předpokládané znalosti:
-
Základní znalost Pythonu, základní povědomí o ML
-
Časový rozvrh:
-
2 dny (9:00hod. - 17:00hod.)