La fonction COEFFICIENT.CORRELATION mesure la force et le sens de la relation entre deux séries de données. En clair, elle répond à la question : quand une variable change, l'autre change-t-elle aussi, et dans quelle direction ? Elle retourne un nombre entre -1 et 1 : proche de 1 pour une relation positive forte, proche de -1 pour une relation inverse forte, proche de 0 si les deux séries évoluent indépendamment.
Que tu sois data analyst, responsable marketing, chercheur ou commercial, cette fonction t'aide à découvrir des patterns cachés dans tes données : budget publicitaire et ventes, prix et demande, température et consommation d'énergie. Elle est aussi disponible sur Google Sheets sous le nom CORREL.
Syntaxe de la fonction COEFFICIENT.CORRELATION
=COEFFICIENT.CORRELATION(matrice1; matrice2)Comprendre chaque paramètre de la fonction COEFFICIENT.CORRELATION
Les deux matrices jouent un rôle symétrique : mathématiquement, intervertir matrice1 et matrice2 donne exactement le même coefficient. La vraie contrainte est ailleurs : chaque valeur de la première série doit avoir sa jumelle au même rang dans la seconde, et les deux plages doivent contenir le même nombre de points.
Par convention de lecture, place ce que tu soupçonnes être la cause (le budget pub, le prix) en premier, et l'effet (les ventes) en second.
matrice1
: ta première série de données, souvent appelée variable XIl peut s'agir de n'importe quelles valeurs numériques : montants de ventes, températures, nombre de visites, âges, scores.
Chaque valeur doit correspondre à une observation : si matrice1 contient les budgets pub de janvier à juin, matrice2 doit contenir les ventes des mêmes mois dans le même ordre.
Astuce : Assure-toi que tes deux matrices ont exactement le même nombre de valeurs. Excel ignore les cellules vides, mais avoir des données bien alignées évite les mauvaises surprises sur le résultat final.
matrice2
: ta deuxième série de données, souvent appelée variable YC'est celle que tu veux mettre en relation avec la première. Par exemple, si matrice1 contient des budgets publicitaires, matrice2 pourrait contenir les ventes correspondantes.
Mathématiquement, l'ordre des matrices ne change pas la valeur du coefficient : COEFFICIENT.CORRELATION(A; B) donne le même résultat que COEFFICIENT.CORRELATION(B; A). En pratique, place la cause probable en premier et l'effet probable en second pour faciliter la lecture.
Pas envie d'écrire la formule COEFFICIENT.CORRELATION à la main ?
Génère-la avec notre IAExemples pratiques pas à pas
Responsable marketing : budget pub vs ventes
Tu es responsable marketing dans une PME. Tu veux savoir si ton budget publicitaire mensuel a vraiment un impact sur tes ventes, ou si tu dépenses de l'argent pour rien. Tu analyses 6 mois de données.
| A | B | |
|---|---|---|
| 1 | Budget pub (k€) | Ventes (k€) |
| 2 | 5 | 42 |
| 3 | 8 | 51 |
| 4 | 6 | 45 |
| 5 | 12 | 68 |
| 6 | 7 | 49 |
| 7 | 10 | 61 |
=COEFFICIENT.CORRELATION(A2:A7; B2:B7)La fonction renvoie 0,96, soit une corrélation très forte et positive : le budget pub et les ventes montent quasiment ensemble. Tu peux présenter à ta direction des preuves solides que l'investissement publicitaire est associé à une hausse des ventes. Attention cependant : cela ne prouve pas que la pub en est la seule cause, d'autres facteurs (saisonnalité, qualité des produits) peuvent jouer.
Astuce de pro : Un coefficient de 0,96 correspond à un R² de 0,92 : cela signifie que le budget pub explique environ 92 % de la variation des ventes dans cet échantillon. Pour calculer R² directement, utilise COEFFICIENT.DETERMINATION.
Data analyst : prix vs demande
Tu es data analyst dans une entreprise e-commerce. Tu analyses l'impact du prix d'un produit sur le nombre d'unités vendues. L'intuition dit que plus c'est cher, moins ça se vend... tu veux en avoir la confirmation chiffrée.
| A | B | |
|---|---|---|
| 1 | Prix unitaire (€) | Unités vendues |
| 2 | 15 | 320 |
| 3 | 20 | 285 |
| 4 | 18 | 302 |
| 5 | 25 | 195 |
| 6 | 22 | 245 |
| 7 | 17 | 315 |
| 8 | 30 | 150 |
=COEFFICIENT.CORRELATION(A2:A8; B2:B8)Ici, le coefficient de -0,92 confirme une relation inverse très forte : quand le prix monte, les ventes baissent de façon prévisible. Cette information est précieuse pour optimiser ta stratégie de pricing et modéliser l'impact d'une variation de prix sur le chiffre d'affaires.
Responsable RH : ancienneté vs satisfaction
Tu es responsable RH et tu mènes une enquête de satisfaction. Tu te demandes si l'ancienneté dans l'entreprise influence le niveau de satisfaction (échelle de 1 à 10).
| A | B | |
|---|---|---|
| 1 | Ancienneté (années) | Satisfaction (/10) |
| 2 | 1 | 7 |
| 3 | 3 | 8 |
| 4 | 5 | 6 |
| 5 | 2 | 9 |
| 6 | 8 | 7 |
| 7 | 4 | 8 |
| 8 | 6 | 5 |
| 9 | 1 | 8 |
=COEFFICIENT.CORRELATION(A2:A9; B2:B9)La fonction renvoie -0,15, une valeur proche de zéro : l'ancienneté n'a pratiquement aucun impact sur la satisfaction. Les collaborateurs récents peuvent être aussi satisfaits (ou insatisfaits) que les anciens. Il faut chercher d'autres facteurs (type de poste, management, rémunération, équilibre vie pro/perso).
Gérant de commerce : température vs ventes de glaces
Tu es gérant d'un commerce de glaces artisanales. Tu soupçonnes que la météo influence tes ventes quotidiennes. Tu analyses la relation entre la température et le nombre de glaces vendues sur une semaine.
| A | B | |
|---|---|---|
| 1 | Température (°C) | Glaces vendues |
| 2 | 22 | 145 |
| 3 | 28 | 220 |
| 4 | 25 | 185 |
| 5 | 31 | 268 |
| 6 | 19 | 98 |
| 7 | 26 | 195 |
| 8 | 29 | 242 |
=COEFFICIENT.CORRELATION(A2:A8; B2:B8)Ici, le coefficient de 0,94 traduit une relation quasi parfaite : plus il fait chaud, plus tu vends. Cette information te permet d'optimiser ta gestion des stocks (surveille la météo à 3-5 jours et ajuste ta production en conséquence).
Envie de t'entraîner sur de vrais exercices Excel ?
M'entraînerLes erreurs fréquentes avec la fonction COEFFICIENT.CORRELATION
Ici, COEFFICIENT.CORRELATION renvoie rarement un message d'erreur : le danger, c'est un chiffre parfaitement crédible qui t'envoie sur une fausse piste. Un coefficient élevé te fait conclure à une cause alors que deux variables grimpent juste en même temps, ou bien il s'effondre près de zéro parce que la relation est courbe et non droite, ce que la fonction ne sait pas voir.
Le seul vrai accroc technique vient de deux plages qui n'ont pas le même nombre de valeurs. Et une poignée de valeurs extrêmes suffit à gonfler ou écraser le résultat.
Conclure qu'une variable cause l'autre à partir d'un fort coefficient
C'est l'erreur d'interprétation n°1. Une corrélation forte montre que deux variables évoluent ensemble, mais ne prouve pas qu'il y a un lien de cause à effet. Exemple classique : les ventes de glaces et les noyades sont corrélées (les deux augmentent en été), mais les glaces ne causent pas les noyades.
Solution : Reformule toujours ta conclusion : « X et Y évoluent ensemble » plutôt que « X cause Y ». Cherche une variable cachée qui pourrait expliquer les deux. Combine COEFFICIENT.CORRELATION avec une analyse graphique (nuage de points) pour visualiser la relation.
Erreur #N/A ou résultat faux avec des matrices de tailles différentes
Si matrice1 a 10 valeurs et matrice2 en a 8, Excel ne peut pas calculer une corrélation pair à pair et retourne une erreur ou un résultat incohérent.
Solution : Vérifie que tes deux plages couvrent exactement le même nombre de cellules. Utilise une formule comme =NB(A1:A10) et =NB(B1:B10) pour comparer les comptages avant de lancer le calcul.
Coefficient proche de 0 alors qu'une relation existe visiblement
COEFFICIENT.CORRELATION ne mesure que les relations linéaires. Si la relation entre tes variables est courbe (exponentielle, logarithmique, en U), le coefficient sera faible même si les variables sont fortement liées.
Solution : Crée d'abord un nuage de points pour visualiser la forme de la relation. Si elle est clairement non linéaire, transforme une des variables (ex. LN(x)) avant de calculer la corrélation, ou utilise d'autres techniques statistiques adaptées.
Coefficient biaisé par une ou deux valeurs extrêmes
Une seule valeur aberrante peut fausser complètement le coefficient de corrélation, le faisant paraître fort ou faible là où la relation générale est tout autre.
Solution : Commence toujours par visualiser tes données dans un nuage de points pour repérer les outliers. Calcule le coefficient avec et sans les valeurs suspectes pour mesurer leur impact, puis décide si elles représentent de vrais cas ou des erreurs de saisie.
COEFFICIENT.CORRELATION vs COVARIANCE.STANDARD vs DROITEREG
Prends COEFFICIENT.CORRELATION quand tu veux juste savoir si deux variables bougent ensemble et à quel point, sur une échelle lisible de -1 à +1 indépendante des unités. COVARIANCE.STANDARD mesure la même variation conjointe mais dans une valeur brute qui dépend des unités, donc impossible à interpréter telle quelle : réserve-la aux calculs statistiques en amont.
Dès que tu veux passer de « ça bouge ensemble » à « prédis-moi le Y pour tel X », c'est DROITEREG qu'il te faut, puisqu'elle te donne la pente et l'ordonnée de la droite.
| Critère | COEFFICIENT.CORRELATION | COVARIANCE.STANDARD | DROITEREG |
|---|---|---|---|
| Ce que ça mesure | Force et sens de la relation linéaire | Variation conjointe absolue | Pente et ordonnée de la droite de régression |
| Plage de résultats | -1 à +1 | Illimitée (dépend des unités) | Illimitée |
| Sensibilité aux unités | Aucune (normalisée) | Oui (produit des unités) | Oui |
| Cas d'usage typique | Comparer des relations entre variables | Entrée pour des calculs statistiques avancés | Prévoir une valeur Y à partir d'un X |
| Interprétation directe | Oui (proche 1 = fort, 0 = aucun, -1 = inverse) | Non (nécessite une mise à l'échelle) | Oui (slope + intercept) |
Questions fréquentes sur la fonction COEFFICIENT.CORRELATION
Comment interpréter un coefficient de corrélation de 0,8 ?
Un coefficient de 0,8 indique une forte corrélation positive : quand une variable augmente, l'autre augmente aussi dans la plupart des cas. Plus tu te rapproches de 1, plus la relation est forte et prévisible. Avec 0,8, environ 64 % de la variation est expliquée (0,8² = 0,64).
Corrélation signifie-t-elle causalité ?
Non. C'est l'erreur la plus fréquente. Une corrélation montre qu'il existe un lien entre deux variables, mais ne prouve pas que l'une cause l'autre.
Par exemple, les ventes de glaces et les noyades sont corrélées (les deux augmentent en été), mais les glaces ne causent pas les noyades. La température est la variable cachée qui influence les deux.
Que signifie un coefficient de -0,9 ?
Un coefficient négatif proche de -1 indique une forte corrélation inverse : quand une variable augmente, l'autre diminue de façon prévisible. Par exemple, le prix d'un produit et la quantité vendue ont souvent une corrélation négative : plus c'est cher, moins ça se vend.
COEFFICIENT.CORRELATION fonctionne-t-il sur Google Sheets ?
Oui. Sur Google Sheets, la fonction s'appelle CORREL avec la même syntaxe. La valeur retournée est identique, seul le séparateur peut changer (virgule ou point-virgule selon tes paramètres régionaux).
Combien de données faut-il pour un résultat fiable ?
Techniquement, tu peux calculer une corrélation avec seulement 3 points, mais le résultat sera peu fiable. Pour une analyse sérieuse, vise au moins 20-30 paires de valeurs. Plus tu as de données, plus ton coefficient est significatif et résistant aux valeurs aberrantes.
Pour aller plus loin
Bloqué sur une formule Excel ?
Pose ta question à notre assistant Excel IA, il te sort la bonne formule en quelques secondes.
Essayer l'assistant IAGratuit · 10 questions par mois

