Guide complet de l'examen PL-300 - Power BI Data Analyst
Vue d'ensemble de la certification
L'examen PL-300 évalue vos compétences en tant qu'analyste de données Power BI. Cette certification reconnaît votre capacité à concevoir et déployer des solutions d'analyse avec Power BI, incluant la préparation des données, la modélisation, la visualisation et la sécurisation des ressources.
1. Préparer les données (25-30%)
1.1 Obtenir ou se connecter aux données
Identifier et se connecter à des sources de données ou à un modèle sémantique partagé
Power BI permet de se connecter à une multitude de sources de données : fichiers Excel, bases SQL Server, services cloud, API web, etc. Un modèle sémantique partagé est un dataset publié dans le service Power BI que plusieurs rapports peuvent réutiliser.
Points clés :
Utiliser "Obtenir des données" pour accéder aux connecteurs Comprendre la différence entre connexion en direct et import Savoir naviguer dans les sources de données disponibles Changer les paramètres de source de données
Les paramètres incluent les informations d'identification (authentification), les niveaux de confidentialité qui déterminent comment Power BI peut combiner les données de sources différentes, et les chaînes de connexion.
Niveaux de confidentialité :
Public : données accessibles à tous Organisationnel : données visibles dans l'organisation Privé : données confidentielles isolées Choisir entre DirectQuery et Import
Import : les données sont stockées dans le modèle Power BI, permettant des performances rapides mais nécessitant des actualisations périodiques.
DirectQuery : les requêtes sont envoyées directement à la source en temps réel, idéal pour les données qui changent constamment ou les très grands volumes.
Cas d'usage :
Import : données historiques, petits à moyens volumes DirectQuery : données temps réel, très grands volumes, restrictions de sécurité Créer et modifier des paramètres
Les paramètres permettent de créer des connexions flexibles et réutilisables. Ils peuvent contrôler des chemins de fichiers, des filtres, ou des valeurs dans les requêtes M.
Exemple d'utilisation :
Basculer entre environnements (dev/prod) Filtrer dynamiquement les données Créer des rapports paramétrables 1.2 Profiler et nettoyer les données
Évaluer les données
L'évaluation inclut l'analyse des statistiques (min, max, moyenne, écart-type) et des propriétés des colonnes (type de données, nombre de valeurs distinctes, valeurs nulles).
Outils disponibles :
Qualité des colonnes (% de valeurs valides/erreurs/vides) Distribution des colonnes (histogramme des valeurs) Profil des colonnes (statistiques détaillées) Résoudre les incohérences et problèmes de qualité
Les problèmes courants incluent :
Valeurs null : décider de les remplacer, supprimer ou conserver Valeurs inattendues : détecter les anomalies avec les statistiques Incohérences : variations d'orthographe, formats différents Doublons : identifier et supprimer les lignes en double Techniques de nettoyage :