Retour

Data engineer

Objectifs de la formation

- Élaborer des codes Python pour la transformation des données - Construire des algorithmes de Machine Learning et Deep Learning - Expliquer et auditer le comportement des algorithmes - Mettre en place des calculs distribués - Déployer des modèles de Machine Learning dans le Cloud

Contenu de la formation

Première phase : Préparation des données Module 1 : Introduction 1.1 : Récupérer les données et regarder leur structure Module 2 : Exploration des données 2.1 : Construire des graphiques pour comprendre les données 2.2 : Étudier les séries temporelles pour en déduire le comportement des prix Module 3 : Nettoyage et encodage des données 3.1 : Nettoyer les données en modifiant les valeurs manquantes et supprimant les valeurs aberrantes 3.2 : Encoder numériquement les variables pour l'apprentissage des modèles Seconde phase : Modélisation Module 4 : Introduction à la modélisation 4.1 : Comprendre les concepts fondamentaux de l'apprentissage supervisé 4.2 : Savoir appliquer un modèle de Machine Learning avec le modèle linéaire Module 5 : Arbres de décisions 5.1 : Découvrir les arbres de décision et l'algorithme CART 5.2 : Appliquer un arbre de régression sur les données Airbnb Module 6 : Random Forest 6.1 : Découvrir les Random Forest 6.2 : Optimiser les hyper-paramètres des modèles Module 7 : XGBoost 7.1 : Découvrir le modèle XGBoost et le Gradient Boosting 7.2 : Valider des modèles par des méthodes de validation croisée Module 8 : Interprétabilité 8.1 : Comprendre l'intérêt de l'interprétabilité avec les PDP 8.2 : Utiliser SHAP pour interpréter localement les modèles Module 9 : Deep Learning 9.1 : Introduire les modèles de Deep Learning avec les réseaux de neurones Troisième phase : Déploiement Module 10 : Data Engineering 10.1 : Comprendre Spark et sa différence avec Hadoop 10.2 : Comprendre l'architecture Map Reduce sur un algorithme Module 11 : Déploiement de modèles 11.1 : Se rappeler des notions réseaux et de Cloud Computing 11.2 : Être capable de déployer le modèle avec Heroku

Résultats de la formation

Attestation d'acquis ou de compétences;Attestation de suivi de présence

Conditions spécifiques d'accès à la formation

Aucun.

Formation 100% en ligne

Métier formé

Data / Big data

Niveau d'étude visé

Sans le Bac

Prise en charge

Formation éligible au financement via Pôle Emploi

Type d'immersion professionnelle

Formation initiale

Organisme de formation

Blent.AI

Durée de la formation

13 mois

Prochaine(s) session(s)

  • 01/12/2023 - 31/12/2024