Retour

Pandas Avancé

Objectifs de la formation

Exploiter la librairie Pandas du langage Python pour traiter vos problématiques et projets en Data Science

Contenu de la formation

- Tour d'horizon de la librairie Pandas Vous utilisez Pandas pour vos analyses de données ou vos projets de Data Science, mais vous n'en maîtrisez pas tous les aspects ? Ce tour d'horizon vous permettra d'identifier toutes les possibilités qu'offre cette librairie. Par un exercice guidé, vous pourrez revoir les notions de bases pour l'utilisation de Pandas, des notions de visualisation de données avec Matplotlib, Pandas et Seaborn Rappels sur les notions de bases de Pandas Lecture de fichiers de données (csv, excel, SQL, parquet) Description du jeu de données et analyse statistique simple Implémenter des analyses et des visualisations différentes en fonction du type de données Gestion des données manquantes Manipulation de dates pour les Time Series Gestion des chaînes de caractères Mise en place des bonnes pratiques en Data Science - Maîtriser les subtilités des groupbys Les groupbys peuvent vous permettre de mieux appréhender les modalités dans votre jeu de données. Groupby à simple indice avec les fonctions d'agrégations classiques Personnalisation des fonctions d'agrégations Groupby à multiples indices Différence entre les fonctions apply et transform Rappels sur les fonctions anonymes - Tables pivots et tableaux croisés Vous verrez par le biais de nombreux exemples et exercices, l'intérêt des tables pivots et des tableaux croisés pour une représentation différente des jeux de données. Fonctions d'agrégation et tables pivots Matrice de contingence Tableaux croisés - Jointure de tables Pour joindre des tables, il est possible de procéder par indice ou par colonne. Notions d'axes Concaténation Merge selon une ou plusieurs clés Jointure par rapport aux indices - Atelier de mise en pratique sur une journée Toutes les notions vues précédemment seront mises en pratique lors d'une journée de travaux pratiques sur un problème d'analyse de données complet mettant en œuvre les bonnes pratiques à utiliser en Data Science. - Accélération du calcul avec Pandas Vous verrez quelles sont les librairies qui vous permettent de faire du multiprocessing avec Pandas Boucler sur les lignes et les colonnes Revenir aux basiques avec NumPy Exemples avec la librairie Modin Exemples avec la librairie Numba

Résultats de la formation

Attestation de formation

Conditions spécifiques d'accès à la formation

Pour suivre ce stage dans de bonnes conditions, il est recommande d avoir suivi en amont la formationPython - Bases et introduction aux librairies scientifiquesou d avoir atteint par la pratique un niveau equivalent

Métier formé

Data / Big data

Niveau d'étude visé

Sans le Bac

Type d'immersion professionnelle

Formation initiale

Organisme de formation

Data Value

Durée de la formation

1 mois

Modalités de formation

formation entièrement présentielle

Prochaine(s) session(s)

  • 15/09/2025 - 17/09/2025

Lieu de formation

41 rue de la Decouverte CS 37623 31676 Labège