PEARSON calcule le coefficient de corrélation de Pearson entre deux ensembles de données. Ce coefficient, compris entre -1 et +1, mesure à la fois la force et la direction de la relation linéaire entre deux variables : plus il est proche de 1 ou de -1, plus la relation est forte.
Concrètement, c'est elle qui te permet de savoir si les dépenses publicitaires influencent vraiment les ventes, si l'ancienneté est liée au salaire dans ton entreprise, si deux actions boursières évoluent ensemble, ou si le prix d'un produit impacte le volume vendu. En quelques secondes, tu passes d'une intuition à un chiffre objectif.
Syntaxe de la fonction PEARSON
=PEARSON(matrice1; matrice2)Comprendre chaque paramètre de la fonction PEARSON
PEARSON attend deux plages, et l'ordre raconte ton hypothèse : matrice1 porte le X (la cause supposée, le budget pub, le prix, l'ancienneté), matrice2 porte le Y (l'effet, les ventes, le salaire). Aucun des deux n'est facultatif.
Le vrai piège n'est pas l'ordre mais l'alignement : les deux plages doivent avoir le même nombre de valeurs et être appariées ligne par ligne. Un décalage d'une seule ligne fausse tout le coefficient.
matrice1
: la première plage de données numériquesC'est typiquement la variable indépendante (X) : la cause supposée, celle que tu contrôles ou que tu observes en premier. Par exemple les dépenses publicitaires, la température, l'ancienneté, le prix.
Les deux matrices doivent avoir exactement le même nombre d'éléments. Si matrice1 a 12 valeurs (un an de données mensuelles), matrice2 doit aussi en avoir 12.
Astuce : Pour calculer R² (coefficient de détermination), élève simplement le résultat au carré : =PEARSON(A:A; B:B)^2. R² indique le pourcentage de variance de Y expliquée par X.
matrice2
: la deuxième plage de données numériquesC'est typiquement la variable dépendante (Y) : l'effet supposé, ce que tu cherches à expliquer. Par exemple les ventes, les clics, le chiffre d'affaires, le salaire.
matrice2 doit avoir la même taille que matrice1 et être parfaitement alignée : la première valeur de matrice1 correspond à la première valeur de matrice2, la deuxième à la deuxième, etc. Un décalage d'une seule ligne fausse entièrement le résultat.
Attention : PEARSON ne mesure que les relations linéaires. Une corrélation proche de 0 ne signifie pas forcément que les deux variables sont indépendantes : elles peuvent avoir une relation courbe (en U par exemple) que PEARSON ne détectera pas.
Pas envie d'écrire la formule PEARSON à la main ?
Génère-la avec notre IAExemples pratiques pas à pas
Marketing : mesurer l'impact du budget publicitaire sur les ventes
Tu es responsable marketing et tu dois justifier le budget publicitaire auprès de la direction. Plutôt qu'une intuition, tu veux un chiffre objectif qui prouve que l'investissement pub génère des ventes.
| A | B | C | |
|---|---|---|---|
| 1 | Mois | Budget pub (k€) | Ventes (k€) |
| 2 | Janvier | 10 | 120 |
| 3 | Février | 15 | 145 |
| 4 | Mars | 12 | 130 |
| 5 | Avril | 18 | 160 |
| 6 | Mai | 20 | 175 |
=PEARSON(B1:B5; C1:C5)Le coefficient de 0.987 traduit une corrélation très forte : plus tu investis en publicité, plus les ventes augmentent, de façon quasi linéaire. Avec un R² de 0.974 (le carré du coefficient), 97,4% de la variation des ventes est expliquée par le budget pub.
Astuce de pro : Un r élevé ne prouve pas que la pub cause les ventes : les deux peuvent être tirées par un troisième facteur (saisonnalité, croissance du marché). Utilise PEARSON pour identifier les pistes, puis approfondis avec des expériences A/B.
RH : analyser la relation entre ancienneté et salaire
Tu travailles aux RH et tu prépares une étude sur la politique de rémunération. Tu veux mesurer objectivement si les salaires dans ton entreprise progressent bien avec l'ancienneté, ou si des inégalités existent.
| A | B | C | |
|---|---|---|---|
| 1 | Employé | Expérience (ans) | Salaire (k€) |
| 2 | Alice | 2 | 35 |
| 3 | Bob | 5 | 45 |
| 4 | Claire | 8 | 58 |
| 5 | David | 12 | 72 |
=PEARSON(B1:B4; C1:C4)Le coefficient de 0.996 indique une relation quasi-linéaire entre expérience et salaire : la grille salariale est cohérente et prévisible. S'il était plus bas (par exemple 0.4), cela signalerait des écarts importants à examiner.
E-commerce : vérifier si le prix freine les ventes
Tu es responsable e-commerce et tu veux savoir si le prix de tes produits a un impact mesurable sur le volume de ventes. Cette analyse t'aidera à décider si une baisse de prix vaut vraiment le manque à gagner unitaire.
| A | B | C | |
|---|---|---|---|
| 1 | Produit | Prix (€) | Ventes/mois |
| 2 | Basique | 19 | 450 |
| 3 | Standard | 29 | 320 |
| 4 | Premium | 49 | 180 |
| 5 | Luxe | 79 | 95 |
=PEARSON(B1:B4; C1:C4)Le coefficient de -0.978 indique une forte corrélation négative : quand le prix monte, les ventes baissent de façon très régulière. C'est cohérent avec la théorie économique de l'élasticité-prix. Tu peux maintenant modéliser l'impact d'une variation de prix avec PREVISION.
Finance : évaluer la corrélation entre deux actions
Tu gères un portefeuille d'investissement et tu cherches à le diversifier. L'idée est de combiner des actifs qui ne s'effondrent pas en même temps : si deux actions évoluent toujours ensemble, elles offrent peu de protection mutuelle.
| A | B | C | |
|---|---|---|---|
| 1 | Jour | Action A (%) | Action B (%) |
| 2 | Lundi | +1.2 | +0.8 |
| 3 | Mardi | -0.5 | -0.3 |
| 4 | Mercredi | +0.7 | +0.5 |
| 5 | Jeudi | -0.2 | +0.1 |
| 6 | Vendredi | +1.5 | +1.1 |
=PEARSON(B1:B5; C1:C5)Le coefficient de 0.92 signifie que les deux actions sont très corrélées : quand l'une monte, l'autre monte aussi, et vice versa. Du point de vue de la diversification, elles offrent peu d'intérêt ensemble. Cherche des actifs avec un r proche de 0 voire négatif pour mieux protéger ton portefeuille.
Gestion du personnel : confirmer l'absence de corrélation
Tu vérifies s'il y a un lien entre la pointure des employés et leur score de performance. Il n'y en a évidemment aucun, mais cet exemple illustre comment PEARSON confirme l'absence de corrélation.
| A | B | C | |
|---|---|---|---|
| 1 | Employé | Pointure | Score perf. |
| 2 | Alice | 38 | 85 |
| 3 | Bob | 44 | 72 |
| 4 | Claire | 36 | 91 |
| 5 | David | 43 | 88 |
=PEARSON(B1:B4; C1:C4)Le coefficient de -0.12 est proche de 0 : la corrélation est quasi nulle, la pointure n'a aucun lien avec la performance. Cet exemple rappelle un principe fondamental : toujours vérifier la corrélation avec des données réelles avant de supposer un lien entre deux variables.
Envie de t'entraîner sur de vrais exercices Excel ?
M'entraînerLes erreurs fréquentes avec la fonction PEARSON
Avec PEARSON, deux soucis bloquent carrément le calcul et un troisième te trompe sans rien afficher. Le #N/A tombe quand tes deux plages n'ont pas le même nombre de valeurs, et le #DIV/0! apparaît dès qu'une plage ne contient qu'une valeur répétée : sans variabilité, la corrélation n'a aucun sens.
Le dernier ne déclenche aucune alerte : un coefficient élevé te pousse à conclure que X cause Y, alors qu'il ne mesure qu'un lien linéaire, pas une causalité.
Erreur #N/A : les deux plages n'ont pas la même taille
Les deux matrices passées à PEARSON n'ont pas le même nombre d'éléments. Excel ne peut pas calculer la corrélation si les paires de valeurs sont incomplètes.
Solution : Vérifie que matrice1 et matrice2 couvrent exactement le même nombre de cellules, avec les mêmes lignes de début et de fin. Utilise =NB(matrice1) et =NB(matrice2) pour confirmer qu'elles ont la même longueur.
Erreur #DIV/0! : une plage ne contient qu'une valeur répétée
Une des plages n'a aucune variabilité (toutes les valeurs sont identiques), ce qui rend le calcul de la corrélation mathématiquement impossible (division par zéro dans la formule de Pearson).
Solution : Assure-toi que tes données ont de la variabilité. Des valeurs constantes ne permettent pas de calculer une corrélation. Si le problème persiste, vérifie que les cellules ne contiennent pas du texte déguisé en nombre.
Confondre corrélation et causalité dans les conclusions
Un r élevé ne signifie pas que X cause Y. Il peut exister une variable cachée qui influence les deux, ou la corrélation peut être purement fortuite (corrélation fallacieuse).
Solution : Utilise PEARSON pour identifier des pistes, mais conclus à la causalité uniquement avec des expériences contrôlées ou des analyses de régression. Mentionne toujours cette nuance dans tes rapports.
PEARSON vs COEFFICIENT.CORRELATION vs DROITEREG vs PREVISION
Prends PEARSON quand tu veux juste un chiffre entre -1 et +1 qui dit si deux variables bougent ensemble. COEFFICIENT.CORRELATION donne exactement le même résultat : tu ne la rencontres que dans d'anciens fichiers.
Dès que tu veux aller plus loin, change d'outil : DROITEREG te sort la pente et l'ordonnée pour modéliser la relation, et PREVISION prédit directement une valeur de Y pour un X que tu lui donnes.
| Critère | PEARSON | COEFFICIENT.CORRELATION | DROITEREG | PREVISION |
|---|---|---|---|---|
| Ce que ça calcule | Coefficient de corrélation r | Idem PEARSON (ancien nom) | Pente et ordonnée de la droite de régression | Valeur prédite d'un Y pour un X donné |
| Résultat | Nombre entre -1 et +1 | Nombre entre -1 et +1 | Tableau de valeurs | Valeur numérique |
| Cas d'usage | Mesurer la force du lien | Compatibilité (ancien fichier) | Modéliser la relation | Prédire une valeur future |
| Complexité | ⭐ Simple | ⭐ Simple | ⭐⭐⭐ Avancé | ⭐⭐ Intermédiaire |
Questions fréquentes sur la fonction PEARSON
Quelle est la différence entre PEARSON et COEFFICIENT.CORRELATION ?
PEARSON et COEFFICIENT.CORRELATION sont strictement identiques : elles retournent toutes les deux le coefficient de corrélation de Pearson. COEFFICIENT.CORRELATION est l'ancien nom conservé pour la compatibilité, PEARSON est plus récent et plus court.
Utilise PEARSON dans tes nouvelles formules. Si tu travailles sur un fichier ancien qui utilise COEFFICIENT.CORRELATION, les deux fonctionnent sans différence de résultat.
Comment interpréter le coefficient de corrélation ?
r proche de 1 indique une forte corrélation positive : quand X augmente, Y augmente. r proche de -1 indique une forte corrélation négative : quand X augmente, Y diminue. r proche de 0 indique peu ou pas de corrélation linéaire.
En pratique, r > 0.7 ou r < -0.7 est considéré comme une corrélation forte, 0.4 à 0.7 comme modérée, et en dessous de 0.4 comme faible.
PEARSON mesure-t-elle la causalité ?
Non, jamais. Une corrélation ne prouve pas la causalité. Deux variables peuvent être corrélées sans que l'une cause l'autre : elles peuvent être toutes deux causées par un troisième facteur, ou la corrélation peut être purement fortuite.
Le seul moyen d'établir la causalité est une expérience contrôlée (groupe test / groupe contrôle) ou une analyse économétrique avec variables instrumentales.
Combien de points de données faut-il au minimum ?
Techniquement, 2 points suffisent mais le résultat sera toujours exactement +1 ou -1 (deux points définissent toujours une droite). Pour une analyse statistiquement significative, utilise au moins 30 points.
Plus tu as de données, plus le coefficient est fiable. Avec 5 ou 10 points, le résultat peut être très influencé par des valeurs atypiques.
PEARSON détecte-t-elle les relations non-linéaires ?
Non, PEARSON ne mesure que les relations linéaires. Une courbe parfaite en U peut avoir un coefficient de 0, même si la relation entre X et Y est parfaitement déterministe.
Pour les relations non-linéaires, utilise des graphiques de dispersion pour visualiser la forme de la relation, puis envisage des transformations (logarithme, carré) ou des méthodes non-paramétriques comme le coefficient de Spearman.
Pour aller plus loin
Les fonctions similaires : COVARIANCE, DROITEREG, PENTE, COEFFICIENT.CORRELATION, ORDONNEE.ORIGINE
Bloqué sur une formule Excel ?
Pose ta question à notre assistant Excel IA, il te sort la bonne formule en quelques secondes.
Essayer l'assistant IAGratuit · 10 questions par mois

