Chapitre 4 · Expert · Leçon 24 / 26
Power Query
C'est quoi Power Query, et pourquoi ça change tout ?
Power Query est un moteur de transformation de données intégré à Excel depuis 2016. Son rôle : connecter Excel à des sources de données externes ou internes, nettoyer les données brutes, les restructurer, puis les charger dans une feuille sous forme d'un tableau propre. Le tout sans formule, sans macro, sans copier-coller manuel.
Dans le monde de l'informatique décisionnelle, ce type d'outil s'appelle un ETL : Extract (extraire les données), Transform (les nettoyer et les transformer), Load (les charger dans l'outil de travail). Power Query est l'ETL d'Excel. Tu extrais depuis un fichier CSV, une base de données, un site web ou un autre classeur. Tu transformes en quelques clics. Tu charges dans Excel, prêt à analyser.
La vraie révolution, c'est la reproductibilité. Imagine que tu reçois un rapport brut chaque lundi matin : 5 000 lignes, des colonnes mal nommées, des dates en texte, des doublons. Normalement, tu passes 45 minutes à le nettoyer à la main. Avec Power Query, tu enregistres toutes les étapes de nettoyage une seule fois. La semaine suivante, tu colles le nouveau fichier et tu cliques sur « Actualiser ». Le nettoyage se rejoue en deux secondes.
Exemple concret
Un contrôleur de gestion reçoit les extractions de ventes de trois régions dans des fichiers séparés, avec des formats légèrement différents (virgule vs point-virgule, noms de colonnes inconsistants, lignes de total à supprimer). Power Query combine les trois fichiers, normalise les colonnes, retire les lignes parasites, et charge le tout dans un tableau unique. Chaque mois, il remplace les fichiers dans un dossier et actualise. Terminé en 10 secondes au lieu de 30 minutes.
Power Query n'est pas un outil pour les experts. Son interface est graphique, chaque transformation est accessible depuis un menu clic droit ou un bouton dans le ruban. Tu verras que les cas d'usage les plus courants se règlent sans jamais ouvrir l'éditeur de code.
Power Query en vidéo
Découvre comment automatiser tes imports et transformations de données avec Power Query, étape par étape, directement dans Excel.
Où trouver Power Query dans Excel ?
Power Query se trouve dans l'onglet Données du ruban Excel. Le groupe qui t'intéresse s'appelle « Obtenir et transformer des données » (ou « Récupérer et transformer » selon ta version). C'est là que tout démarre.
Sur Microsoft 365 et Excel 2021, le bouton principal s'appelle « Obtenir des données ». Il ouvre un menu déroulant avec toutes les sources disponibles. C'est la version la plus complète, avec le plus de connecteurs.
Sur Excel 2016 et 2019, Power Query est intégré, mais l'interface est légèrement différente. Tu trouveras les boutons « Nouvelle requête », « À partir d'un fichier » et « À partir d'une base de données » dans le même onglet Données.
Sur Excel 2010 et 2013, Power Query existe en complément gratuit à télécharger sur le site de Microsoft. Une fois installé, un onglet « Power Query » apparaît dans le ruban, et le comportement est identique.
L'éditeur Power Query est une fenêtre séparée d'Excel. Quand tu l'ouvres, Excel continue de tourner en arrière-plan. Tu travailles dans l'éditeur, tu valides tes transformations, et tu reviens dans Excel avec les données chargées. Pense à l'éditeur comme à un atelier de nettoyage : tu y prépares les données, et tu les livres dans ta feuille Excel quand elles sont prêtes.
Note sur Mac
Power Query est disponible sur Mac depuis Excel pour Microsoft 365 (version 16.x). Les fonctionnalités sont identiques à Windows, mais certains connecteurs (notamment SQL Server, SharePoint) peuvent nécessiter des étapes supplémentaires selon ta configuration réseau.
Importer tes données pas à pas
On va prendre le cas le plus courant : importer un fichier CSV ou Excel et l'ouvrir dans l'éditeur Power Query pour commencer à le transformer. Voici les quatre étapes.
Ouvrir l'éditeur Power Query
Va dans l'onglet Données, puis clique sur « Obtenir des données » > « À partir d'un fichier » > « À partir d'un classeur Excel » (ou CSV, texte...). L'éditeur Power Query s'ouvre dans une nouvelle fenêtre.
Choisir la source et la table
Une boîte de dialogue liste les feuilles et tableaux disponibles dans le fichier. Sélectionne la table source. Tu vois un aperçu des données à droite. Clique sur « Transformer les données » pour ouvrir l'éditeur complet.
Appliquer tes transformations
L'éditeur affiche tes données en prévisualisation. Chaque action que tu fais (supprimer une colonne, changer un type, filtrer...) s'ajoute comme une étape dans le volet « Étapes appliquées » à droite.
Charger dans Excel
Quand les données sont propres, clique sur « Fermer et charger » dans le ruban de l'éditeur. Excel crée un nouveau tableau avec les données transformées. Toutes tes étapes sont mémorisées et rejouées à chaque actualisation.
Sources disponibles (non exhaustif)
- Fichiers locaux : CSV, Excel (.xlsx, .xlsm), texte (.txt), JSON, XML, PDF
- Bases de données : SQL Server, Access, Oracle, MySQL, PostgreSQL
- Services en ligne : SharePoint, OneDrive, Salesforce, Google Analytics
- Web : extraction de tableau depuis une page HTML (scraping léger)
L'interface de l'éditeur en détail
L'éditeur Power Query a quatre zones principales à connaître :
- 1Le ruban en haut : onglets Accueil, Transformer, Ajouter une colonne, Affichage. Les transformations les plus courantes sont dans Accueil et Transformer.
- 2Le volet gauche (Requêtes) : liste de toutes tes requêtes. Tu peux en avoir plusieurs dans le même fichier (une par source, des requêtes de fusion, etc.).
- 3La grille centrale : prévisualisation des données après les transformations. Ce que tu vois ici correspond exactement à ce qui sera chargé dans Excel.
- 4Le volet droit (Étapes appliquées) : la liste chronologique de toutes tes transformations. C'est le cœur de Power Query. On en parle dans la section suivante.
Les transformations courantes que tu utiliseras tout le temps
Power Query propose des dizaines de transformations. Voici les six que tu croiseras dans presque tous les projets de nettoyage de données. Chacune part d'un clic droit sur un en-tête de colonne ou d'un bouton du ruban, et s'ajoute comme une étape rejouable.
Fractionner une colonne. Une colonne « Prénom Nom » à séparer en deux ? Clic droit sur l'en-tête, puis Fractionner la colonne par délimiteur (l'espace). Power Query crée deux colonnes en une seconde. Le même réflexe règle les dates collées, les codes produits et les adresses sur une seule ligne.
Supprimer les doublons. Sélectionne la colonne d'identifiant, puis Accueil > Supprimer les lignes > Supprimer les doublons. Tu peux aussi dédoublonner sur une combinaison de colonnes, par exemple un même client le même jour, en sélectionnant plusieurs en-têtes avant l'action.
Dépivoter des colonnes. Tes données arrivent en tableau croisé, avec Jan, Fév, Mar en colonnes, alors qu'il te faut une colonne « Mois » et une colonne « Valeur » ? Sélectionne les colonnes de mois, clic droit > Dépivoter les colonnes. Le tableau bascule en format long, prêt pour un TCD ou un graphique.
Fusionner des tables. Tu as une table de commandes et une table clients à rapprocher ? Accueil > Fusionner des requêtes. Tu choisis la colonne de jointure (l'ID client), le type de jointure (gauche, intérieure...) et Power Query assemble les deux tables. C'est l'équivalent d'un RECHERCHEX, mais appliqué à toute la table d'un coup.
Remplacer des valeurs. Des cellules vides, des textes inconsistants (« N/A », « - », « nd »), des fautes de frappe répétées ? Accueil > Remplacer les valeurs. Tu saisis la valeur à trouver et la valeur de remplacement, et le changement s'applique à toutes les lignes en une seule étape.
Changer les types de données. Power Query détecte les types automatiquement, mais il se trompe parfois : une date importée en texte, un nombre avec des virgules mal interprété. Clique sur l'icône devant l'en-tête de colonne pour forcer le bon type, Date, Nombre entier, Texte ou Décimal. Un type correct dès le départ évite la plupart des erreurs de calcul en aval.
Autres transformations utiles
Supprimer les lignes vides et les lignes d'erreur
Accueil > Supprimer les lignes > Supprimer les lignes vides (ou les erreurs). Indispensable quand tu importes un export CSV avec des lignes parasites en fin de fichier.
Renommer les colonnes
Double-clique sur l'en-tête de colonne pour la renommer directement. Power Query génère une étape « Colonnes renommées ». Si tes données sources changent de noms, tu peux mettre à jour l'étape sans refaire tout le travail.
Réorganiser et supprimer des colonnes
Clic droit sur une colonne > Supprimer pour l'enlever. Glisse-dépose pour réorganiser. Sélectionne plusieurs colonnes avec Ctrl+Clic pour les supprimer ou les garder en une fois.
Ajouter une colonne personnalisée
Ajouter une colonne > Colonne personnalisée. Tu peux écrire une formule en langage M (ou utiliser des exemples depuis l'onglet « À partir d'exemples ») pour créer une colonne dérivée. Exemple : concaténer Prénom et Nom, calculer un écart par rapport à une cible.
Pivoter et dépivoter
En plus de dépivoter (colonnes vers lignes), tu peux pivoter (lignes vers colonnes) pour créer un tableau croisé. Le pivoter/dépivoter est l'une des transformations les plus puissantes quand tu dois adapter le format de tes données à un TCD ou un graphique.
Le volet « Étapes appliquées » : le moteur de la reproductibilité
À droite de l'éditeur Power Query, le volet « Étapes appliquées » liste chaque transformation dans l'ordre chronologique. C'est la fonctionnalité centrale : sans elle, Power Query serait juste un outil de nettoyage ponctuel. Avec elle, c'est un pipeline automatisé.
Chaque étape porte un nom généré automatiquement (« Source », « Type modifié », « Lignes filtrées »...). Tu peux renommer chaque étape pour que le pipeline soit lisible par quelqu'un d'autre. Clique sur l'icône crayon à gauche du nom pour le modifier.
Ce que tu peux faire avec chaque étape
Cliquer dessus pour voir l'état des données à ce moment précis. Pratique pour diagnostiquer une erreur : tu remontes étape par étape jusqu'à trouver où les données se dégradent.
Supprimer une étape en cliquant sur la croix à gauche. Si une transformation était erronée, retire-la et recommence sans tout refaire.
Modifier une étape en cliquant sur l'icône engrenage à droite du nom. La boîte de dialogue de la transformation s'ouvre et tu peux changer les paramètres.
Voir le code M en cliquant sur une étape et en regardant la barre de formule en haut. Chaque étape correspond à une ligne de code M. Tu peux l'éditer directement si tu connais la syntaxe.
Réorganiser les étapes par glisser-déposer. Attention : certaines étapes dépendent des précédentes (tu ne peux pas filtrer une colonne avant de l'avoir créée).
Conseil de pro
Renomme systématiquement tes étapes avec des noms métier : « Supprimer lignes vides », « Normaliser la colonne région », « Filtrer année en cours ». Quand tu reviens sur la requête six mois plus tard, ou qu'un collègue doit la modifier, le pipeline est lisible sans avoir à décoder le code M.
Actualiser tes données : l'opération centrale
Une fois ta requête chargée dans Excel, les données sources peuvent changer. L'actualisation rejoue toutes les étapes appliquées sur les nouvelles données et met à jour le tableau dans Excel. C'est cette mécanique qui rend Power Query si puissant en pratique.
Comment actualiser
Clic droit sur le tableau dans Excel > « Actualiser ». Le moyen le plus rapide quand tu es déjà dans la feuille.
Données > Actualiser tout dans le ruban. Actualise toutes les requêtes du classeur en une seule fois. Pratique si tu as plusieurs sources.
Actualisation automatique à l'ouverture : clic droit sur le tableau > Propriétés de la table > coche « Actualiser les données lors de l'ouverture du fichier ». Excel met à jour les données dès que tu ouvres le classeur.
Changer le chemin de la source
Si ton fichier source est déplacé ou renommé, la requête affiche une erreur. Pour mettre à jour le chemin : Données > Requêtes et connexions > clic droit sur la requête > Modifier > première étape « Source » dans le volet Étapes appliquées > modifier le chemin dans la barre de formule.
Il existe une meilleure pratique : définir le chemin de la source comme paramètre. Ainsi, tu changes le paramètre une seule fois et toutes les requêtes qui utilisent cette source se mettent à jour automatiquement. Le paramétrage est accessible via Accueil > Gérer les paramètres dans l'éditeur Power Query.
Combiner plusieurs fichiers d'un dossier
C'est l'une des fonctionnalités qui suscite le plus d'enthousiasme chez les utilisateurs qui la découvrent. Tu as un dossier avec 12 fichiers Excel (un par mois, par exemple) et tu veux tout consolider en une seule table ? Power Query le fait automatiquement, et il intègre les nouveaux fichiers au dossier dès la prochaine actualisation.
La procédure en six étapes
- 1
Données > Obtenir des données > À partir d'un fichier > À partir d'un dossier. Navigue vers le dossier qui contient tes fichiers.
- 2
Power Query liste tous les fichiers du dossier. Clique sur « Combiner et transformer les données » (ou « Combiner » selon ta version).
- 3
Une boîte de dialogue te demande de choisir un fichier exemple pour configurer les transformations. Sélectionne l'un de tes fichiers et choisis la feuille ou table à importer.
- 4
Power Query crée automatiquement une requête principale et une requête « Transformer le fichier exemple ». Cette dernière contient les transformations à appliquer à chaque fichier.
- 5
Applique tes transformations dans la requête exemple (supprimer des colonnes, changer les types, filtrer...). Elles seront appliquées à tous les fichiers.
- 6
Fermer et charger. Excel consolide tous les fichiers en une seule table. Une colonne « Source.Name » est ajoutée automatiquement avec le nom du fichier d'origine, pour que tu saches d'où vient chaque ligne.
Le mois suivant, tu ajoutes le nouveau fichier dans le dossier et tu actualises. Power Query le détecte automatiquement et l'intègre à la table consolidée. Aucune manipulation supplémentaire.
Condition indispensable
Tous les fichiers du dossier doivent avoir la même structure : mêmes colonnes, dans le même ordre, avec les mêmes noms d'en-tête. Si un fichier a une colonne de plus ou un nom légèrement différent, Power Query génèrera une erreur sur ce fichier. Assure-toi que tes exports sont standardisés.
Une intro légère au langage M
Chaque étape que tu crées dans l'interface graphique génère automatiquement du code dans le langage M (Power Query Formula Language). Tu n'as pas besoin d'écrire ce code toi-même pour commencer. Mais le connaître un minimum te permettra de débloquer des situations que l'interface seule ne peut pas gérer.
Pour voir le code M d'une requête, ouvre l'éditeur Power Query et clique sur Affichage > Éditeur avancé. Tu verras quelque chose qui ressemble à ça :
let
Source = Excel.Workbook(File.Contents("C:\donnees\ventes.xlsx"), null, true),
Feuil1_Sheet = Source{[Item="Feuil1",Kind="Sheet"]}[Data],
#"En-têtes promus" = Table.PromoteHeaders(Feuil1_Sheet, [PromoteAllScalars=true]),
#"Type modifié" = Table.TransformColumnTypes(#"En-têtes promus",{
{"Date", type date},
{"Montant", type number},
{"Region", type text}
}),
#"Lignes filtrées" = Table.SelectRows(#"Type modifié", each [Montant] > 0)
in
#"Lignes filtrées"Le code M a une structure simple : une série de variables assignées dans un bloc let, la dernière étant retournée dans le bloc in. Chaque ligne correspond à une étape du volet « Étapes appliquées ».
Trois usages du code M à connaître
1. Paramétrer une date dynamique
Pour filtrer automatiquement sur « les 30 derniers jours » sans modifier le filtre manuellement :
Table.SelectRows(TableSource, each [Date] >= Date.AddDays(DateTime.Date(DateTime.LocalNow()), -30))2. Conditionner une valeur
L'équivalent du SI Excel dans une colonne personnalisée :
if [Montant] > 1000 then "Grande commande" else "Commande standard"3. Extraire une partie de texte
Extraire les 4 premiers caractères d'un code produit :
Text.Start([Code_Produit], 4)La documentation officielle de Microsoft liste toutes les fonctions M avec des exemples. Pour débuter, la meilleure stratégie est de laisser l'interface générer le code et de lire ce qui a été créé. Tu apprendras la syntaxe par observation, sans avoir à mémoriser les fonctions une par une.
Quand utiliser Power Query, les formules ou un TCD ?
Les trois outils ne s'excluent pas. Ils ont des rôles distincts et se combinent souvent. Voici comment choisir selon la situation.
Power Query sert à nettoyer et structurer. C'est l'outil à sortir quand :
- tes données viennent d'une source externe (CSV, base de données, autre classeur) ;
- tu dois répéter les mêmes opérations de nettoyage régulièrement ;
- tu travailles avec plusieurs sources à consolider ;
- la structure des données doit être transformée (transposer, dépivoter, fusionner).
Les formules Excel servent à calculer dynamiquement. Elles prennent le relais quand :
- tu veux un résultat qui se recalcule selon les saisies de l'utilisateur ;
- tu dois faire des calculs conditionnels sur des données déjà propres (SOMME.SI.ENS, SI, RECHERCHEX) ;
- tu travailles sur un jeu de données relativement petit et stable.
Le tableau croisé dynamique sert à analyser et croiser. Tu y passes quand :
- tu dois agréger, regrouper et croiser des données (sommes par catégorie, comptages, moyennes) ;
- tu veux changer l'angle d'analyse rapidement sans modifier les données ;
- tes données sources sont déjà propres, ou nettoyées en amont par Power Query.
Le pipeline idéal
Source brute (CSV/base de données) → Power Query (nettoyer, structurer) → tableau Excel propre → TCD (agréger, croiser) → Graphique (visualiser). Les formules interviennent dans la couche intermédiaire si tu as besoin de calculs que le TCD ne couvre pas. C'est ce pipeline que les contrôleurs de gestion et les data analysts utilisent au quotidien.
Erreurs fréquentes avec Power Query et comment les corriger
Power Query affiche ses erreurs dans la grille de prévisualisation (cellules en rouge avec « Error ») et dans la barre d'état en bas. Voici les plus courantes et leurs solutions.
« DataFormat.Error : impossible de convertir en nombre »
Cause : une colonne contient des cellules vides ou du texte (ex. : « N/A ») et tu essaies de la convertir en type nombre. Solution : remplace d'abord les valeurs texte parasites par null (Remplacer les valeurs), puis change le type. Power Query gère les null sans planter.
« Expression.Error : la colonne X de la table est introuvable »
Cause : une étape référence une colonne qui n'existe plus (renommée, supprimée dans la source ou dans une étape précédente). Solution : identifie l'étape fautive dans le volet Étapes appliquées, clique sur l'engrenage et mets à jour la référence de colonne.
« File not found » ou chemin source introuvable
Cause : le fichier source a été déplacé ou renommé depuis la création de la requête. Solution : clique sur l'étape « Source » dans le volet Étapes appliquées, puis modifie le chemin dans la barre de formule. Pour éviter ce problème à l'avenir, place tes fichiers sources dans un dossier réseau stable ou utilise des paramètres de chemin.
Les dates sont importées comme du texte
Cause : Power Query interprète le séparateur de date selon les paramètres régionaux. Un fichier exporté avec des dates au format MM/JJ/AAAA peut être mal interprété en Europe. Solution : dans l'éditeur, sélectionne la colonne, Transformer > Analyser > Date (en spécifiant les paramètres régionaux si nécessaire). Ou utilise Remplacer les valeurs + Transformer > Type avec paramètre régional.
La combinaison de fichiers plante sur un fichier du dossier
Cause : l'un des fichiers du dossier a un format légèrement différent (nom de colonne différent, onglet manquant, ligne de titre en plus). Solution : identifie le fichier problématique via la colonne « Source.Name », ouvre-le et normalise sa structure, ou filtre-le depuis la liste des fichiers dans la première étape de la requête principale.
L'actualisation est très lente
Cause : soit la source de données est volumineuse, soit des étapes de transformation inefficaces forcent Power Query à charger tout le fichier avant de filtrer. Solution : applique les filtres tôt dans le pipeline (idéalement dans les premières étapes) pour réduire le volume de données avant les transformations coûteuses. Active aussi le « Query Folding » si ta source est une base de données SQL (les filtres sont exécutés côté serveur).
Astuce de débogage
Quand une requête génère des erreurs, remonte étape par étape dans le volet Étapes appliquées en cliquant sur chacune. La première étape qui affiche des cellules rouges est la source du problème. Cette méthode est bien plus rapide que de lire le message d'erreur global.
Questions fréquentes sur Power Query
Power Query est intégré nativement dans Excel 2016, 2019, 2021 et Microsoft 365. Dans Excel 2010 et 2013, il existait en tant que complément gratuit à télécharger. Si tu utilises Office 365, tu as accès à la version la plus à jour avec les dernières transformations.
Non. 90 % des transformations se font via l'interface graphique, sans écrire une seule ligne de code. Le langage M devient utile si tu veux des transformations très spécifiques ou paramétrables, mais tu peux parfaitement t'en sortir sans le toucher au départ.
Power Query est le moteur de transformation intégré dans Excel et dans Power BI. Il fonctionne de la même façon dans les deux outils : les étapes que tu apprends dans Excel s'appliquent directement dans Power BI. La différence, c'est ce que tu fais ensuite des données : tableau Excel ou rapport Power BI interactif.
Oui. Power Query est fait pour les gros volumes. Contrairement à une feuille Excel limitée à 1 048 576 lignes, Power Query peut lire et filtrer des fichiers de plusieurs millions de lignes avant de charger les données dans Excel. Tu charges seulement le résultat final, pas tout le fichier brut.
Non, les deux sont complémentaires. Power Query excelle pour importer, nettoyer et structurer des données de façon répétable. Les formules Excel prennent le relais pour les calculs dynamiques dans le tableau final (RECHERCHEX, SOMME.SI.ENS, SI...). Le bon réflexe : nettoyer avec Power Query, calculer avec les formules.
Pas automatiquement, mais presque. Tu actualises d'un clic droit sur le tableau et « Actualiser ». Tu peux aussi configurer une actualisation automatique à l'ouverture du fichier dans les propriétés de la connexion. Si les nouvelles données arrivent dans le même format, toutes les transformations s'appliquent instantanément.
C'est l'utilisation la plus courante. Tu nettoies et structures tes données avec Power Query, puis tu crées un TCD sur le tableau de sortie. Quand les données sources changent, tu actualises la requête et le TCD se met à jour en cascade. C'est ce qu'on appelle un pipeline de données : source brute → Power Query → TCD.
Tu veux pratiquer Power Query avec des cas réels ?
Le Dojo Club te donne accès à des exercices guidés, des lives experts chaque semaine et une communauté active pour progresser rapidement sur Excel, Power Query et Power BI.
Rejoindre le Dojo