Retour
Les essentiels du Data analyst
Objectifs de la formation
À l'issue de la formation, le stagiaire sera capable d'acquérir les connaissances théoriques et les compétences pratiques nécessaires pour exercer le métier de Data Analyst en entreprise. Ces compétences permettront d'analyser les données, les visualiser dans Power Bi et réaliser une modélisation prédictive sur des données structurées en utilisant le langage de programmation Python et SQL.
Contenu de la formation
Module n°1 - Langage de programmation Python : - Développer un programme simple en pur Python - Utiliser et manipuler les principaux objets en python (listes & dictionnaires) - Développer des boucles pour automatiser une action - Développer des fonctions pour généraliser le script - Utiliser la librairie NumPy pour manipuler des arrays et réaliser des opérations matricielles Module n°2 - Data Management en Python : - Utiliser la librairie pandas pour importer, explorer et manipuler des données tabulaires en Python - Nettoyer les données dans le but de réaliser une modélisation prédictive non biaisée (gestion des doublons, gestion des valeurs manquantes, gestion des outliers, gestion des dates, gestion des variables catégorielles) Module n°3 - Data Visualization en Python - Utiliser la visualisation adaptée aux données que l'on a disposition - Réaliser des data visualisations avec les librairies matplotlib et seaborn Module n°4 - Bases de données et Big Data (SQL) - Comprendre et utiliser les commandes SQL de base pour interroger des bases de données - Concevoir et gérer des bases de données : création de tables, relations, contraintes. - Optimiser les requêtes pour améliorer la performance des recherches. - Implémenter des fonctions avancées Module n°5 - Business Intelligence (Power Bi) - Importer et intégrer des données de multiples sources dans Power BI. - Modéliser des données et créer des relations efficaces entre les différentes tables. - Créer des visualisations de données interactives et des tableaux de bord pour des analyses approfondies. - Utiliser le langage DAX pour créer des mesures et des calculs avancés. - Publier et partager des rapports et Dashboard pour permettre une prise de décision basée sur des données actualisées et pertinentes. Module n°6 - Machine Learning en Python - Distinguer l'apprentissage supervisé de l'apprentissage non-supervisé et du clustering - Distinguer les tâches de classification binaires des tâches de classification multiples et de régression - Expliquer et développer une fonction de perte et une descente de gradient - Expliquer le fonctionnement de l'arbitrage biais-variance - Programmer en pur python des algorithmes de régression et les comparer à leurs équivalents de la librairie scikit-learn - Construire une régression linéaire (avec et sans pénalisation Ridge et/ou Lasso) & une régression logistique - Construire et interpréter une Analyse en Composantes Principales - Construire et interpréter un k-means - Construire et interpréter une Classification Ascendante Hiérarchique
Résultats de la formation
Attestation de suivi de présence
Conditions spécifiques d'accès à la formation
Entretien telephonique
Formation 100% en ligne
Métier formé
Data / Big data
Niveau d'étude visé
Sans le Bac
Type d'immersion professionnelle
Formation initiale
Organisme de formation
Datagong
Durée de la formation
12 mois
Prochaine(s) session(s)
- 18/01/2024 - 18/01/2025