Il n’y a rien de pire que d’analyser une base de données contenant des doublons, car cela fausse les résultats, complique l’interprétation des données et alourdit les fichiers. Heureusement, Excel dispose d’une fonctionnalité intuitive et efficace pour supprimer ces doublons en quelques clics.
Dans cet article, nous allons voir comment utiliser cette fonctionnalité à travers un exemple simple et concret : le nettoyage d’une liste de contacts contenant des doublons.
Pourquoi supprimer les doublons dans Excel ?
Les doublons peuvent poser plusieurs problèmes :
- Erreurs d’analyse : les doublons peuvent fausser les calculs, influencer les moyennes et donner une mauvaise interprétation des tendances, ce qui peut entraîner de mauvaises décisions.
- Perte de temps : la vérification manuelle peut être longue et fastidieuse. Sans parler des erreurs humaines dues à la pénibilité et à la répétitivité de la tâche.
- Fichiers volumineux : les bases de données peuvent vite devenir lourdes et longues à traiter si elles contiennent trop de doublons.
Vous ne voyez pas encore l’importance de cette fonctionnalité ? Voici quelques situations courantes où les doublons posent problème :
Bases de données client : s’assurer qu’un client n’est pas enregistré plusieurs fois, ce qui pourrait fausser les analyses de fidélisation et de ventes.
Listes de contacts : éviter les envois d’email en double et assurer une meilleure gestion des clients.
Catalogues produits : supprimer les références dupliquées pour éviter des erreurs de stock ou de prix.
Où se trouve la fonction « Supprimer les doublons » dans Excel ?
Excel propose un outil aussi simple qu’efficace pour supprimer les doublons :
1. Sélectionnez la colonne à analyser.
2. Allez dans l’onglet Données puis dans la partie Outils de données, cliquez sur Supprimer les doublons.

3. Validez pour supprimer les doublons identifiés.
C’est aussi simple que ça !
Exemple concret : Nettoyer une liste de contacts avec doublons
Prenons ce dernier exemple de base de données et supprimons les clients qui sont en doublon dans ce fichier. J’ai 100 clients dans ce fichier. Mais la méthode reste la même s’il y a 1000 ou 10 000 clients. Par chance, je me suis aperçu en parcourant la liste que certains noms revenaient 2 fois. Plutôt que de trier la liste nom par nom, ce qui prendrait déjà un certain temps pour 100 clients mais imaginez cela pour 10 000 lignes. J’y passerai des soirées entières. Et bien que j’adore Excel, trier des lignes pour supprimer les noms en double ne me passionne pas trop.
On pourrait supprimer les doublons par nom ou par prénom mais on prend le risque de supprimer ceux qui ont le même prénom ou le même nom, ce qui peut arriver dans ce genre de cas. On va alors travailler sur la colonne qui distingue tous les clients : la colonne Nom complet.
Étapes pour supprimer les doublons
1. Sélectionnez la plage de données contenant les noms complets. Pour aller plus vite, je sélectionne directement la colonne C en cliquant dessus.

2. Dans l’onglet Données, cliquez sur le bouton Supprimer les doublons.

3. Une fenêtre s’ouvre et vous offre 2 choix :
- Étendre la sélection : C’est le choix qu’il faut faire ! Nos données sont liées par lignes, c’est-à-dire qu’une ligne correspond à un client. Excel va prendre en compte toutes les colonnes du tableau et va supprimer les lignes entières correspondant au nom complet en doublon.
- Continuer avec la sélection en cours : Excel ne va pas prendre en compte les autres colonnes du tableau et va donc supprimer uniquement les noms en double dans la colonne choisi, d’est moins intéressant pour nous.

4. Cliquez sur Supprimer les doublons. Le logiciel a pris en compte toutes les colonnes de votre tableau. Ici, les données ont des en-têtes. Donc je laisse la case Mes données ont des en-têtes cochée. Sinon, il considérera que la ligne 1 est à prendre en considération pour la suppression des doublons.

4. Cliquez maintenant sur OK : Excel affiche un message indiquant combien de doublons ont été supprimés et combien d’entrées uniques il reste.

Si je vais à la dernière ligne de mon tableau, j’ai maintenant 80 clients uniques alors que j’en avais bien 100 avant la suppression des doublons.
Bonnes pratiques et alternatives
Ayant moi-même passé des heures à jongler avec des bases de données remplies de doublons, je sais à quel point il est frustrant de faire face à des erreurs imprévues. Voici quelques conseils pratiques pour vous éviter de vous retrouver dans la même situation lors de la suppression des doublons :
- Faire une copie du fichier avant d’effectuer l’opération pour conserver les données d’origine. En effet, après la suppression des doublons, on ne voit plus les lignes qui ont été enlevées. Afin d’éviter des erreurs de suppression de données importantes, il vaut mieux garder une copie du fichier d’origine.
- Utiliser des TCD pour détecter les doublons avant de les supprimer. Il s’agit d’une fonction un peu avancée que je souhaite détailler dans un autre article donc je ne vais pas développer plus que ça la méthode mais simplement vous montrer le résultat. Je crée un TCD qui me donne directement le nombre d’occurrences du champ choisi. Je peux donc en un seul coup d’oeil voir quels sont les lignes en double. Je crée un autre TCD qui me donne le nombre de clients dans ma base de données. Y compris, ceux en double. Pratique, non ?

A gauche, on voit bien que j’ai 20 clients en double pour un total de 100 clients. Après avoir supprimer automatiquement les doublons, on peut voir dans les tableaux de droite que je n’ai plus un seul doublon et que j’ai 80 clients dans ma base de données nettoyée.
Ce qu’il faut retenir
Supprimer les doublons dans Excel est une tâche essentielle pour garantir la fiabilité des données. Comme vous l’avez vu, cette méthode, ultra simple, vous fera gagner un temps précieux et vous évitera des erreurs d’analyse. Que vous gériez une liste de clients, un catalogue produit ou une base de données plus complexe, la fonctionnalité « Supprimer les doublons » s’adapte à de nombreuses situations.
De plus, en appliquant les bonnes pratiques détaillées dans cet article, vous éviterez les erreurs que j’ai commises et optimiserez la gestion de vos données.
Et vous, avez-vous déjà été confronté à des problèmes de doublons dans Excel ? Partagez votre expérience en commentaire !
À vos tableurs !
Merci pour cet article détaillé sur la suppression des doublons dans Excel. Tes explications sont claires et les étapes bien illustrées. Cette fonctionnalité est essentielle pour maintenir des données propres et fiables. Hâte de découvrir tes prochains articles !
En effet, sans données propres, il est difficile d’interpréter les résultats.
C’est impressionnant de voir à quel point Excel peut être optimisé pour gagner du temps. Supprimer les doublons est une fonctionnalité qui peut être précieuse dans bien des contextes. Même si ce n’est pas un sujet que j’utilise souvent, je suis sûr que beaucoup de personnes trouveront tes conseils très utiles.
Super merci pour cette astuces que je ne connaissais pas. Je vais immédiatement la testé et j’attends avec impatience ton prochain article avec la méthode TDC.
Merci pour ton retour !
Merci Rudy pour cet excellent article. La semaine dernière, j’ai recherché des doublons entre 2 bases
En fait, j’avais une base de clients et la base des désinscriptions qui concernaient les prospects et les clients.
Je voulais savoir quels clients s’étaient désinscrits, le surlignage dans ce cas peut-être intéressant.
C’est un autre cas de recherche de doublons. J’utilise aussi la fonction nb.si qui est bien pratique et ensuite je classe.
En effet, lorsqu’on cherche à connaître les doublons dans 2 bases de données, la technique est un peu différente et il existe plusieurs façons de faire comme la fonction nb.si, la fonction recherchev ou encore les TCD.