Retour

R pour les utilisateurs SAS

Objectifs de la formation

Apprendre à réécrire sous R un programme SAS faisant appel à des étapes de manipulation, de traitement, d'analyse et de visualisation de données

Contenu de la formation

- Introduction Présentation de R et son interface R Studio Spécificités de l'approche R (par rapport à SAS) Spécificités de la syntaxe R (par rapport à SAS) - Manipulations de base sous R Généralités sur le langage R "historique" Installation et chargement de packages Types de données sous R Importer des fichiers sous R (textes bruts, Excel, dataset SAS) Récupérer les caractéristiques d'un objet (équivalent procédure CONTENTS) Calculer des indicateurs statistiques, et comparaison par rapport aux procédures type MEANS / FREQ de SAS Pratique : importer un fichier SAS depuis R, le décrire et calculer des statistiques descriptives - Traitement de données sous R Le dataframe et ses manipulations courantes : équivalent sous R des dataset SAS Package dyplr : manipuler les données dans une logique similaire à celle des étapes data / proc SQL Autres packages du tidyverse : manipulations sur les dates, facteurs, chaînes de caractère, transpositions de données Pratique : manipuler sous R un fichier de données - Visualisations Présentation succincte des fonctions natives de visualisation sous R Package ggplot2 : principes, syntaxe et comparaison par rapport aux procédures GPLOT et SGPLOT Pratique : produire sous R différentes visualisations graphiques - Analyse de données et machine learning Tests statistiques et ACP : mise en œuvre sous R et interprétation des sorties Régression linéaire : comparaison des approches et sorties de R par rapport à SAS (proc REG) Introduction rapide au machine learning sous R Pratique : mettre en œuvre une régression et / ou une ACP sous R et comparer les sorties obtenues avec celles de SAS - Aperçu des possibilités de R avec des packages additionnels Packages SQL : pour rester dans la syntaxe d'une proc SQL Markdown : pour générer des fichiers de sortie html / pdf dans la logique des sorties ODS de SAS Shiny et/ou plotly : pour aller plus loin dans la visualisation interactive Caret : pour aller plus loin dans le machine learning Pratique : avoir un aperçu concret de ce que permettent ces packages à partir d'exemples déjà fournis - Programmation sous R Boucles et conditions sous R Fonctions sous R : une alternative au macro langage de SAS Fonctions de type apply : une autre alterna

Résultats de la formation

Attestation de formation

Conditions spécifiques d'accès à la formation

Connaissance du langage SAS

Formation 100% en ligne

Métier formé

Administration de base de données

Niveau d'étude visé

Sans le Bac

Type d'immersion professionnelle

Formation initiale

Organisme de formation

Data Value

Durée de la formation

19 mois

Prochaine(s) session(s)

  • 01/01/2024 - 31/07/2025