Retour
Data engineer
Objectifs de la formation
- Élaborer des codes Python pour la transformation des données - Construire des algorithmes de Machine Learning et Deep Learning - Expliquer et auditer le comportement des algorithmes - Mettre en place des calculs distribués - Déployer des modèles de Machine Learning dans le Cloud
Contenu de la formation
Première phase : Préparation des données Module 1 : Introduction 1.1 : Récupérer les données et regarder leur structure Module 2 : Exploration des données 2.1 : Construire des graphiques pour comprendre les données 2.2 : Étudier les séries temporelles pour en déduire le comportement des prix Module 3 : Nettoyage et encodage des données 3.1 : Nettoyer les données en modifiant les valeurs manquantes et supprimant les valeurs aberrantes 3.2 : Encoder numériquement les variables pour l'apprentissage des modèles Seconde phase : Modélisation Module 4 : Introduction à la modélisation 4.1 : Comprendre les concepts fondamentaux de l'apprentissage supervisé 4.2 : Savoir appliquer un modèle de Machine Learning avec le modèle linéaire Module 5 : Arbres de décisions 5.1 : Découvrir les arbres de décision et l'algorithme CART 5.2 : Appliquer un arbre de régression sur les données Airbnb Module 6 : Random Forest 6.1 : Découvrir les Random Forest 6.2 : Optimiser les hyper-paramètres des modèles Module 7 : XGBoost 7.1 : Découvrir le modèle XGBoost et le Gradient Boosting 7.2 : Valider des modèles par des méthodes de validation croisée Module 8 : Interprétabilité 8.1 : Comprendre l'intérêt de l'interprétabilité avec les PDP 8.2 : Utiliser SHAP pour interpréter localement les modèles Module 9 : Deep Learning 9.1 : Introduire les modèles de Deep Learning avec les réseaux de neurones Troisième phase : Déploiement Module 10 : Data Engineering 10.1 : Comprendre Spark et sa différence avec Hadoop 10.2 : Comprendre l'architecture Map Reduce sur un algorithme Module 11 : Déploiement de modèles 11.1 : Se rappeler des notions réseaux et de Cloud Computing 11.2 : Être capable de déployer le modèle avec Heroku
Résultats de la formation
Attestation d'acquis ou de compétences;Attestation de suivi de présence
Conditions spécifiques d'accès à la formation
Aucun.
Formation 100% en ligne
Métier formé
Data / Big data
Niveau d'étude visé
Sans le Bac
Prise en charge
Formation éligible au financement via Pôle Emploi
Type d'immersion professionnelle
Formation initiale
Organisme de formation
Blent.AI
Durée de la formation
13 mois
Prochaine(s) session(s)
- 01/12/2023 - 31/12/2024