C'est quoi le deep web, et est-ce la même chose que le dark web ?

Réponse rapide

Le deep web, c'est tout ce qui est sur Internet et que les moteurs de recherche n'indexent pas — votre boîte mail, votre banque en ligne, les outils internes d'entreprise, les articles payants, tout ce qui est derrière une connexion ou un paywall — c'est énorme, totalement banal, et quasiment sans rapport avec le dark web.

Ce que ce n'est PAS

Le deep web n'est PAS le dark web. Il n'est PAS caché, illégal ou dangereux par nature. Ce n'est PAS « l'endroit où vont les choses quand on les supprime ». Et ce n'est PAS non plus un petit recoin — selon la plupart des estimations le deep web est bien plus grand que le web « de surface » indexé, simplement parce que la plupart des services modernes vivent derrière une connexion.

Pour aller plus loin

L’Internet que la plupart des gens imaginent — et que les moteurs cartographient — n’est qu’une petite fraction de ce qui existe en ligne. L’expression deep web désigne tout ce qui existe sur Internet normal mais n’est pas atteignable en tapant une requête dans Google : pages derrière une connexion, pages derrière un paywall, outils internes, bases de données privées, API machine-à-machine, contenu généré dynamiquement que le robot Google ne peut pas ou ne veut pas parcourir.

Les trois couches, clairement séparées :

  • Web de surface. Public, indexé par Google / Bing / DuckDuckGo. Wikipédia, sites d’actualité, articles de blog, pages marketing, profils publics.
  • Deep web. Accessible via des navigateurs normaux, des adresses normales, mais non indexé parce que les moteurs ne peuvent pas franchir la connexion ou le paywall. Votre boîte mail, votre banque, vos outils professionnels, votre espace patient, le journalisme payant, le Notion interne, chaque Google Doc que vous avez ouvert.
  • Dark web. Un réseau séparé, bien plus petit — construit sur Tor, I2P ou des systèmes équivalents — où les sites ont des adresses en .onion (ou équivalent) et ne répondent qu’à ces réseaux de confidentialité. On y accède avec Tor Browser, pas votre navigateur habituel. Voir dark web pour ce qui s’y passe vraiment.

Pourquoi cette confusion compte : la couverture médiatique utilise régulièrement « deep web » et « dark web » de façon interchangeable, et le mot « deep » sonne mystérieux. Le vrai deep web est la partie la moins mystérieuse d’Internet — c’est là que vit déjà chaque page protégée par compte, par paywall, ou interne au travail. Votre bulletin de salaire sur votre portail RH est du deep web. Le tableau de notes scolaires de votre enfant est du deep web. Il n’y a rien de plus inquiétant dans cela que dans l’existence d’une porte de bureau qui se ferme à clé.

La raison pour laquelle les moteurs n’indexent pas le deep web est technique et délibérée. Pour lire votre boîte mail, un moteur aurait besoin de votre mot de passe — qu’il n’a pas. Pour lire un article payant, l’éditeur devrait l’autoriser — ce qu’il refuse explicitement. Pour lire le wiki interne de votre entreprise, l’entreprise devrait le publier — ce qui en saperait l’objet. La propriété « non indexé » est une caractéristique de chaque service à compte sur Terre.

Un petit chevauchement mérite d’être noté : du contenu qui était autrefois sur le web de surface se retrouve sur le deep web après suppression ou protection par mot de passe, et les données fuitées apparaissent parfois à la fois sur les places de marché du dark web (où les acheteurs les trouvent) et sur le deep web (quand des journalistes ou chercheurs les rediffusent dans des archives protégées). Ce recoupement est réel mais mineur. Au quotidien, le deep web est où vit déjà presque toute la vie en ligne de chacun, le dark web est un autre réseau, et les confondre fait craindre la mauvaise chose.

On nous pose aussi

Quelle est la différence entre web de surface, deep web et dark web ? +

Trois couches. Le **web de surface** est tout ce qu'indexent les moteurs — sites publics, Wikipédia, sites d'actualité, blogs publics. Le **deep web** est tout ce qui existe sur Internet normal mais qui n'est pas indexé — votre interface bancaire, votre messagerie, Google Docs, un Notion interne, les articles payants. Le **dark web** est un espace bien plus petit et entièrement séparé : des sites qui ne répondent que sur des réseaux de confidentialité comme Tor (adresses en .onion). Le deep web fait partie d'Internet normal derrière une connexion ; le dark web est un autre réseau auquel on accède avec un navigateur dédié.

Les sites du deep web sont-ils dangereux ? +

Pas plus que n'importe quel autre site où vous vous connectez. « Deep web » décrit simplement le fait technique qu'un moteur n'indexe pas une page. Votre boîte Gmail est du deep web. Votre espace patient hospitalier est du deep web. Votre Slack pro est du deep web. Le risque n'est pas « le deep web est louche » — ce sont les risques normaux de tout service auquel on se connecte : mot de passe, phishing, prise de compte.

Quelle est la taille du deep web par rapport au web de surface ? +

Bien plus grande. Une estimation de 2001 affirmait que le deep web était 400 à 500 fois plus grand que le web de surface — ce chiffre précis n'est plus cité, mais l'ordre de grandeur tient toujours. Chaque compte de stockage cloud, chaque CRM, chaque tableau de bord bancaire, chaque outil interne d'entreprise est du deep web. Les moteurs n'en voient presque rien parce qu'ils ne peuvent pas se connecter.

Comment « accéder » au deep web ? +

Vous le faites, chaque fois que vous vous connectez à quelque chose. Pas de navigateur spécial à installer, pas d'adresse spéciale à taper. Se connecter à Gmail accède au deep web. Lire un article payant du Monde accède au deep web. Utiliser l'interface en ligne de votre banque accède au deep web. La question « comment accéder au deep web » signifie en général « comment accéder au dark web », ce qui est une autre question avec une autre réponse (parfaitement légitime mais différente) : installer Tor Browser.

Mes données sont-elles « sur le deep web » ? +

Toutes. Vos dossiers médicaux, votre historique bancaire, vos documents professionnels, vos messages vivent sur des services qui font partie du deep web — c'est ce que veut dire « deep web ». Le cadre qui compte pour la sécurité n'est pas « est-ce sur le deep web » (oui, par définition) mais « est-ce sur un service de confiance, le mot de passe est-il unique, la double authentification est-elle activée ».

Aussi expliqué