Aller au contenu principal
✏️Fonctions de texte

Nettoyage de texte

Le nettoyage de texte regroupe les fonctions qui éliminent les caractères indésirables, les espaces en trop et les variations de casse dans les cellules. Les fonctions clés sont SUPPRESPACE (espaces en trop), EPURAGE (caractères non imprimables) et SUBSTITUE (remplacement de texte). Tu les utilises pour fiabiliser des données importées ou saisies manuellement avant de les exploiter dans des formules.

À quoi sert un nettoyage de texte dans Excel ?

Le nettoyage de texte te permet de corriger les imperfections dans tes données textuelles. Les fichiers importés depuis un ERP, un site web ou un fichier CSV contiennent souvent des espaces en double, des retours à la ligne invisibles, des caractères spéciaux ou des variations de casse (majuscules/minuscules mélangées). Ces anomalies empêchent les RECHERCHEV de fonctionner, faussent les tableaux croisés dynamiques et créent des doublons fantômes.

SUPPRESPACE élimine les espaces superflus en début, fin et milieu de texte. EPURAGE supprime les caractères non imprimables (codes ASCII 0 à 31) qui se glissent lors des imports. SUBSTITUE remplace un texte par un autre dans une chaîne, ce qui te permet de corriger des abréviations, supprimer des caractères spécifiques ou normaliser des formats. Combinées, ces trois fonctions transforment des données brutes en données exploitables.

Nettoyage de texte : exemples concrets

Exemple 1 : Data analyst : nettoyer un fichier CRM importé depuis un ERP

Tu es data analyst dans une entreprise de services B2B. Tu reçois chaque semaine un export CRM avec 3 000 lignes de contacts. Le problème : les noms contiennent des espaces en double ("Jean Dupont"), des caractères invisibles importés depuis l'ancien système, et des variations de casse aléatoires ("MARTIN", "martin", "Martin").

Ta formule de nettoyage en D2 : `=NOMPROPRE(SUPPRESPACE(EPURAGE(A2)))`. EPURAGE supprime d'abord les caractères non imprimables, SUPPRESPACE élimine ensuite les espaces en trop, et NOMPROPRE met la première lettre de chaque mot en majuscule. Tu copies la formule sur les 3 000 lignes et tu obtiens une colonne propre.

Sans ce nettoyage, un RECHERCHEV entre ton fichier CRM et ton fichier de facturation échouerait sur toutes les lignes où "Jean Dupont" ne correspond pas exactement à "Jean Dupont". Un simple espace en trop suffit à casser une correspondance.

Exemple 2 : Acheteur : normaliser les noms de fournisseurs pour éliminer les doublons

Tu es acheteur dans une chaîne de restauration collective. Ta base fournisseurs contient des variantes pour le même prestataire : "SAS Dupont & Fils", "Dupont et Fils", "DUPONT ET FILS SAS". Ton tableau croisé dynamique affiche trois lignes au lieu d'une, ce qui fausse tes analyses de dépenses.

Ta formule de normalisation en B2 : `=MAJUSCULE(SUPPRESPACE(SUBSTITUE(SUBSTITUE(A2;"&";"ET");"SAS ";"")))`. Le premier SUBSTITUE remplace "&" par "ET", le second retire "SAS " (avec l'espace), SUPPRESPACE nettoie les espaces résiduels, et MAJUSCULE uniformise la casse. Le résultat pour les trois variantes sera "DUPONT ET FILS".

Tu peux enchaîner autant de SUBSTITUE que nécessaire pour couvrir les cas récurrents. Une fois les noms normalisés, ton tableau croisé dynamique regroupe correctement les dépenses par fournisseur.

Astuces
  1. #1 SUPPRESPACE ne supprime que les espaces classiques (code 32). Les espaces insécables (code 160, fréquents dans les copier-coller du web) résistent. Utilise `=SUBSTITUE(A2;CAR(160);" ")` avant SUPPRESPACE pour les convertir.
  2. #2 Pour vérifier si une cellule contient des caractères invisibles, compare `=NBCAR(A2)` avec `=NBCAR(SUPPRESPACE(EPURAGE(A2)))`. Si les deux valeurs diffèrent, il y a du nettoyage à faire.
  3. #3 SUBSTITUE est sensible à la casse. Pour remplacer "paris" et "Paris" en une seule passe, convertis d'abord en majuscules : `=SUBSTITUE(MAJUSCULE(A2);"PARIS";"PARIS")`, ou fais deux SUBSTITUE imbriqués.

Après un nettoyage par formule, les cellules résultantes contiennent des formules, pas des valeurs. Avant de supprimer la colonne source, copie la colonne nettoyée et colle-la en valeurs (Ctrl+Maj+V > Valeurs) pour ne pas perdre le résultat.

Les erreurs courantes avec le nettoyage de texte

Nettoyer les espaces mais oublier les retours à la ligne

SUPPRESPACE élimine les espaces en trop mais ne touche pas aux retours à la ligne (CAR(10) et CAR(13)) ni aux tabulations (CAR(9)). Si tes données importées contiennent des sauts de ligne invisibles au milieu du texte, SUPPRESPACE ne les corrigera pas.

Tu te retrouves avec des cellules qui semblent propres mais qui contiennent des caractères cachés. Les RECHERCHEV échouent, les filtres ne regroupent pas correctement, et les comparaisons avec "=" renvoient FAUX sur des textes apparemment identiques.

Solution : Combine EPURAGE avec SUPPRESPACE : =SUPPRESPACE(EPURAGE(A2)). EPURAGE supprime les caractères non imprimables (dont les retours à la ligne). Pour cibler un caractère spécifique, utilise SUBSTITUE : =SUBSTITUE(A2;CAR(10);"") supprime les sauts de ligne.

Appliquer SUBSTITUE une seule fois quand le texte contient plusieurs occurrences à traiter

SUBSTITUE remplace toutes les occurrences d'un texte par défaut, mais si tu as plusieurs types de corrections à faire (remplacer "&" par "ET", supprimer "SAS", corriger "Ste" en "Société"), un seul SUBSTITUE ne suffit pas. Certains utilisateurs pensent que SUBSTITUE gère toutes les corrections en une passe.

Le résultat est un nettoyage partiel : tu corriges un problème mais tu en laisses d'autres intacts. Le tableau croisé dynamique ou le RECHERCHEV continue de trouver des doublons ou des non-correspondances.

Solution : Imbrique les SUBSTITUE : =SUBSTITUE(SUBSTITUE(SUBSTITUE(A2;"&";"ET");"SAS ";"");"Ste ";"Société "). Chaque couche traite un remplacement. Pour des nettoyages complexes avec plus de 4 ou 5 remplacements, envisage Power Query qui offre une interface plus lisible pour enchaîner les transformations.

Termes liés

Envie d'aller plus loin ?

Explore les 293 termes de notre lexique ou découvre nos formules Excel.