Fonction PEARSON ExcelCalculer le coefficient de corrélation
PEARSON calcule le coefficient de corrélation de Pearson (r) entre deux ensembles de données. Ce coefficient mesure la force et la direction de la relation linéaire entre deux variables, avec une valeur comprise entre -1 et +1.
Essentielle pour l'analyse de données, la fonction PEARSON t'aide à identifier les relations entre variables : les ventes sont-elles corrélées à la température ? Le budget pub influence-t-il les revenus ?
Syntaxe de la fonction PEARSON
=PEARSON(matrice1; matrice2)Les deux matrices doivent avoir le même nombre d'éléments. Le résultat est toujours entre -1 et +1.
Interprétation du coefficient
| Valeur de r | Interprétation |
|---|---|
| 0.9 à 1.0 | Corrélation positive très forte |
| 0.7 à 0.9 | Corrélation positive forte |
| 0.4 à 0.7 | Corrélation positive modérée |
| -0.4 à 0.4 | Corrélation faible ou inexistante |
| -0.7 à -0.4 | Corrélation négative modérée |
| -1.0 à -0.7 | Corrélation négative forte |
Comprendre chaque paramètre
matrice1
(obligatoire)La première plage de données numériques. Typiquement la variable indépendante (X). Exemple : les dépenses publicitaires, la température, l'âge.
matrice2
(obligatoire)La deuxième plage de données numériques. Typiquement la variable dépendante (Y). Exemple : les ventes, les clics, le chiffre d'affaires. Doit avoir la même taille que matrice1.
Astuce : Pour calculer R² (coefficient de détermination), élève simplement le résultat au carré : =PEARSON(A:A;B:B)^2. R² indique le % de variance expliquée.
Exemples pratiques pas à pas
Exemple 1 – Marketing : pub et ventes
Tu veux savoir si les dépenses publicitaires sont corrélées aux ventes mensuelles.
r = 0.987 : corrélation très forte. Plus tu investis en pub, plus les ventes augmentent.
| A | B | C | |
|---|---|---|---|
| 1 | Mois | Budget pub (k€) | Ventes (k€) |
| 2 | Janvier | 10 | 120 |
| 3 | Février | 15 | 145 |
| 4 | Mars | 12 | 130 |
| 5 | Avril | 18 | 160 |
| 6 | Mai | 20 | 175 |
=PEARSON(B1:B5; C1:C5)Exemple 2 – RH : expérience et salaire
Tu analyses la relation entre années d'expérience et salaire dans ton entreprise.
r = 0.996 : relation quasi-linéaire entre expérience et salaire.
| A | B | C | |
|---|---|---|---|
| 1 | Employé | Expérience (ans) | Salaire (k€) |
| 2 | Alice | 2 | 35 |
| 3 | Bob | 5 | 45 |
| 4 | Claire | 8 | 58 |
| 5 | David | 12 | 72 |
=PEARSON(B1:B4; C1:C4)Exemple 3 – E-commerce : prix et ventes
Tu vérifies si le prix affecte négativement le nombre d'unités vendues.
r = -0.978 : forte corrélation négative. Prix élevé = moins de ventes.
| A | B | C | |
|---|---|---|---|
| 1 | Produit | Prix (€) | Ventes/mois |
| 2 | Basique | 19 | 450 |
| 3 | Standard | 29 | 320 |
| 4 | Premium | 49 | 180 |
| 5 | Luxe | 79 | 95 |
=PEARSON(B1:B4; C1:C4)Exemple 4 – Finance : actions corrélées ?
Tu analyses si deux actions évoluent ensemble pour diversifier ton portefeuille.
r = 0.92 : les deux actions sont très corrélées, peu de diversification.
| A | B | C | |
|---|---|---|---|
| 1 | Jour | Action A (%) | Action B (%) |
| 2 | Lundi | +1.2 | +0.8 |
| 3 | Mardi | -0.5 | -0.3 |
| 4 | Mercredi | +0.7 | +0.5 |
| 5 | Jeudi | -0.2 | +0.1 |
| 6 | Vendredi | +1.5 | +1.1 |
=PEARSON(B1:B5; C1:C5)Exemple 5 – Pas de corrélation
Tu vérifies s'il y a un lien entre la pointure des employés et leurs performances.
r = -0.12 : aucune corrélation. La pointure n'a aucun lien avec la performance.
| A | B | C | |
|---|---|---|---|
| 1 | Employé | Pointure | Score perf. |
| 2 | Alice | 38 | 85 |
| 3 | Bob | 44 | 72 |
| 4 | Claire | 36 | 91 |
| 5 | David | 43 | 88 |
=PEARSON(B1:B4; C1:C4)Les erreurs fréquentes et comment les corriger
Erreur #N/A
Les deux plages n'ont pas le même nombre d'éléments.
Solution : Vérifie que matrice1 et matrice2 ont exactement le même nombre de cellules.
Erreur #DIV/0!
Une des plages ne contient qu'une seule valeur répétée (variance nulle).
Solution : Assure-toi que tes données ont de la variabilité. Des valeurs constantes ne permettent pas de calculer une corrélation.
Confondre corrélation et causalité
Un r élevé ne signifie pas que X cause Y. Il peut y avoir une variable cachée.
Solution : Utilise des expériences contrôlées ou des analyses de régression pour établir la causalité, pas juste PEARSON.
Questions fréquentes
Quelle est la différence entre PEARSON et COEFFICIENT.CORRELATION ?
PEARSON et COEFFICIENT.CORRELATION sont strictement identiques. Elles retournent toutes les deux le coefficient de corrélation de Pearson. COEFFICIENT.CORRELATION est l'ancien nom, PEARSON est plus récent et plus court.
Comment interpréter le coefficient de corrélation ?
r proche de 1 = forte corrélation positive (quand X augmente, Y augmente). r proche de -1 = forte corrélation négative (quand X augmente, Y diminue). r proche de 0 = pas de corrélation linéaire.
PEARSON mesure-t-elle la causalité ?
Non, jamais. Une corrélation ne prouve pas la causalité. Deux variables peuvent être corrélées sans que l'une cause l'autre (elles peuvent être toutes deux causées par un troisième facteur).
Combien de points de données faut-il au minimum ?
Techniquement, 2 points suffisent mais le résultat sera toujours ±1. Pour une analyse significative, utilise au moins 30 points. Plus tu as de données, plus le coefficient est fiable.
PEARSON détecte-t-elle les relations non-linéaires ?
Non, PEARSON ne mesure que les relations linéaires. Une courbe parfaite en U peut avoir un PEARSON de 0. Pour les relations non-linéaires, utilise le coefficient de Spearman ou des méthodes graphiques.
Fonctions statistiques connexes
Maîtrise l'analyse statistique
Tu sais maintenant calculer les corrélations avec PEARSON ! Rejoins Le Dojo Club pour découvrir toutes les techniques d'analyse de données dans Excel.
Essayer pendant 30 jours