Retour
Data analyst
Objectifs de la formation
"Pour transformer les données brutes en informations utiles, l'analyste de données doit posséder des compétences particulières en informatique et maîtriser des outils spécifiques au Big Data, aussi bien au niveau du stockage des données que de leur traitement (par exemple MapReduce, Hadoop ou encore Spark). Pour dégager des tendances pouvant aboutir à des recommandations sur les stratégies à adopter, l'analyste de données doit également maîtriser les outils et méthodes statistiques et d'apprentissage automatique. A l'issue de la formation, le stagiaire sera capable de gérer toute la chaîne de valeur partant des données brutes initiales et aboutissant à l'information pertinente, d'acquérir les fondements théoriques relatifs à différents types d'approches issues des sciences des données, de construire, évaluer et interpréter des modèles d'analyse et d'apprentissage en tenant compte de la nature des données, de maitriser la méthodologie d'apprentissage à partir des données brutes à l'évaluation.
Contenu de la formation
"Data warehouse : ""Maitriser les technologies des BD relationnelles par : - la modélisation : au niveau conceptuel (modèles multidimensionnels) et niveau logique (schémas en étoiles...) - le langage SQL et les optimisations de bases de données pour les requêtes OLAP: indexes, partitionnement et vues - l'architecture des entrepôts - les processus ETL (rapidement) - les grands principes des bases de données 'in memory'"" Probabilités et statistiques : Initiation au langage des probabilités et à leurs applications aux statistiques (loi des grands nombres, convergence, ...). Compréhension des statistiques, utilisation des estimateurs et analyse de données. Programmation distribuée : ""Acquisition des concepts avancés de traitement distribué des données : - traitement de donnée distribuées sur une même machine (rappel des principes généraux de programmation parallèle, des concepts bas-niveau) - traitement client/serveur : concept de transaction dans les BDs relationnelles : algorithmes de verrouillages et structures de données associées. - traitement distribué « big data » : introduction au paradigme « map/reduce » et aux frameworks Hadoop et Spark."" Traitement automatique des langues : ""Présentation des concepts de linguistique : - Introduction au traitement automatique des langues - Analyse syntaxique de l'étiquetage morphosyntaxique à l'analyse en profondeur, en passant par les analyseurs robustes - Présentation et utilisation d'analyseurs syntaxiques - Analyse sémantique : de la syntaxe à une représentation fondée sur les réseaux sémantiques - Applications : système de questions-réponses, systèmes de dialogue homme-machine."" Cloud computing : Apprendre à créer et déployer des applications Cloud, définition et types de cloud, risques et opportunités du cloud (gestion de la sécurité, accès instantannés à des ressources de calcul et de stockage, création et déploiement d'applications). Machine learning / Deep learning : Acquisition des bases indispensables en apprentissage automatique ou ""Machine Learning"": les principales familles de modèles et les algorithmes associés (inférence et apprentissage). En particulier, seront traités : (i) les bases théoriques de l'apprentissage, les modèles probabilistes et l'apprentissage Bayésien, (ii) les modèles linéaires et les SVM (Support Vector Machines). "
Résultats de la formation
Attestation de suivi de présence
Conditions spécifiques d'accès à la formation
"Niveau Bac+4 ou equivalent en sciences (mathematiques, informatique, sciences de l ingenieur). Maitrise d un langage de programmation (python et/ou java de preference). Bonnes connaissances en bases de donnees relationnelles. Bases du calcul matriciel."
Métier formé
Data / Big data
Niveau d'étude visé
Sans le Bac
Prise en charge
Formation financée par le Conseil régional
Type d'immersion professionnelle
Formation initiale
Organisme de formation
Lycée polyvalent Viollet le Duc
Durée de la formation
4 mois
Modalités de formation
formation mixte
Prochaine(s) session(s)
- 04/12/2023 - 30/03/2024