Retour
Python pour la data science
Objectifs de la formation
Objectif : Apprendre à utiliser le langage Python et ses principales librairies scientifiques pour traiter, visualiser et modéliser les données en Data Science Compétences visées : Connaître et savoir utiliser les librairies incontournables de Python pour la data science : La Scipy Stack Connaître et utiliser les principales librairies de visualisation de données et notamment orientées cartographie Savoir manipuler des données volumineuses ne tenant pas en mémoire Avoir une bonne compréhension de l'écosystème scientifique de Python, savoir trouver ses librairies et juger de leur qualité
Contenu de la formation
-L'écosystème scientifique Python Les incontournables: Numpy, Scipy, Pandas, Matplotlib et iPython qui sont le ciment de toutes les autres librairies scientifiques Panorama des librairies et logiciels scientifiques par domaine Les critères permettant de juger de la qualité d'une librairie -Calculer avec des nombres réels: comprendre les erreurs de calculs La représentation des nombres réels Comprendre les erreurs de calculs et les contourner -La scipy stack Manipuler des tableaux de nombres: Numpy o Différences avec les listes Python o Création, sélection, filtres et principales fonctions Visualiser ses données: Matplotlib o Les concepts de la librairie o Principaux graphiques: nuages de points, courbes, histogrammes, boxplot, ... o Fonctionnalités avancées: 3D, légendes, colorbar, manipuler les axes, annotations, ... Analyse de données: Pandas o Les fondements de la librairie: Manipuler des données de type CSV et Excel o Séries et Dataframes o Index, sélection de données, filtres/recherche, agrégations, jointures et fonctions avancées o Manipuler des séries temporelles Les fonctions mathématiques avancées: Scipy o Statistiques, optimisation, interpolations/régressions, traitement d'images -Visualisation de données Présentation de l'écosystème de visualisation de données de Python Les librairies orientées Web: Bokeh, Altair et Plotly Les "écosystèmes" PyViz et HoloViz La visualisation de données volumineuses/big data avec DataShader Les statistiques avec Seaborn -Visualiser des données géospatiales Convertir ses données d'un système de coordonnées à l'autre Cartographie interactive "à la Open Street Map/Google Maps" avec Folium/iPyleaflet Cartographie statique avec Cartopy Autres librairies géospatiales -Manipulation de données volumineuses Les librairies h5py, pytables, netcdf4, xarray, iris, parquet permettant de lire vos fichiers scientifiques Paralléliser ses calculs avec Dask Paralléliser ses calculs avec CuDF Manipuler des dataframes gigantesques avec Dask -Personnalisation Sous réserve de contraintes techniques ou de confidentialité, nous vous proposons de personnaliser la formation en réalisant des exercices directement sur vos données métiers.
Résultats de la formation
Attestation d'acquis ou de compétences;Attestation de suivi de présence
Conditions spécifiques d'accès à la formation
Pour suivre ce stage dans de bonnes conditions, il est recommande d avoir suivi en amont la formation Python - Bases et introduction aux librairies scientifiques
Métier formé
Data / Big data
Niveau d'étude visé
Sans le Bac
Type d'immersion professionnelle
Formation initiale
Organisme de formation
Data Value
Durée de la formation
1 mois
Modalités de formation
formation entièrement présentielle
Prochaine(s) session(s)
- 16/06/2025 - 20/06/2025