Internet est dans nos vies depuis bientôt 30 ans. Tout le monde semble le connaître, savoir ce qu’il s’y trouve et pour une bonne partie de la population le proverbe néo-universaliste affirmant que « [l’]on peut tout trouver sur Internet » n’est qu’une vaste pantalonnade. Ce n’est pas Monsieur Michu qui vous dira le contraire lui qui à tant de mal à trouver des sites coch… de vente de cochonailles. Mais ce que la plupart des internautes ignorent encore c’est que derrière le Web que nous offrent les différents moteurs de recherches à disposition, il existe un gigantesque continent obscur peuplé de populations loufoques et/ou dangereuses. Venez mesdames et messieurs et entrez dans le Deeeep Weeeeb !

chat

Chapitre I : Indexation

Tout commence à l’aube du réseau, lorsque l’on décide de la façon dont les utilisateurs pourront se retrouver dans la toile. Des milliers de sites et pseudo-sites trainent déjà un peu partout et le web est déjà le reflet de la société, affichant des visages aussi angéliques que malfaisants. Il était très difficile d’accéder à des sites lorsqu’il fallait connaitre l’adresse complète dès l’origine, et donc, par l’extérieur. Ainsi commença l’indexation. L’indexation c’est ce que fait, continuellement, un moteur de recherche. Il scanne le net grâce à divers algorithmes, retient les sites plébiscités ou non par les utilisateurs, change le score d’un domaine en fonction des pots de vins reçus par la société… Mais le moteur ne retient pas toutes les entités présente sur le réseau, loin de là. Tout moteur de recherche confondus (les bases de données étant par ailleurs souvent plus ou moins identiques) on estime que seul 25% du web est indexé. En pratique, cela veut tout simplement dire que lorsque vous entrez un mot clé, même si vous avez 25 000 000 de résultats, ne soyez pas sur de tous les avoirs (évidemment avec le mot clé pyjama, il y a plus de chance de tout trouver… quoique.). On appelle ces 25% le web surfacique (surface web).

Pour des raisons politico-économiques et éventuellement éthiques, les moteurs se refuseraient donc à indexer les trois quarts du web mondial. Mais que cache t-on aux utilisateurs lambdas ? Que peut il y avoir de si effrayant derrière la muraille de Mountain View ?

Chapitre II : Dissimulation

On appelle en règle générale web profond (ou deep web) les 75% restant. Cela dit une grande partie tient du web opaque, un web indexable mais non indexé, notamment la grande partie du web qui n’apparait pas parce que les sites sont trop massifs pour indexer la totalité des pages.
Indexable n’est pas vraiment le mot exact et pour cause. En théorie tout le web est indexable, mais on à choisi de privilégier certains protocoles seulement, on désigne ici les sociétés de services. La plupart des navigateurs ne sont ainsi pas programmé pour accéder à la partie obscure d’internet, inutile alors de l’indexer… la grande majorité des utilisateurs n’y poserons jamais les yeux.

Mais il y a plusieurs façons de voir cette dissimulation. Certes, le complotiste mineur, caché derrière ses routeurs et son écran vous dira que LE GOUVERNEMENT VOUS MENT, que la NSA VOUS ESPIONNE (ok, ça c’est vrai) et que le deep web est L’AVENIR DE L’HUMANITÉ. Il y a probablement du vrai la dedans. Mais on ne peut pas non plus se le cacher, le deep web est aussi la vrai poubelle du net, à coté, 4chan est un aspirateur de table.

Chapitre III : Accession

Pour vous prouver mes dires, je me suis rendu en terra obscura, car si les navigateurs standards ne permettent pas d’y accéder, il en est tout autre pour certains navigateurs spécialisés. Évidemment, comme dans toute exploration aventureuse, il faut penser à se protéger : proxy, par-feu, cryptage et j’en passe, je ne ferais pas ici un tutoriel détaillé, Internet (le visible) en recèle des milliers. Je dirais juste que j’utilise ici le Tor Browser, qui outre de permettre d’accéder au deep web, utilise le réseau TOR, The Onion Router, un maillage de machines à travers le monde permettant de se rendre anonyme.
Le deep web n’a pas de moteur de recherche standardisé tel que nous le connaissons, et même si certains émergent peu à peu, ils rechignent eux aussi à indexer la totalité du territoire. Pour découvrir ce qu’est en substance le deep web, il faut se diriger vers le Hidden Wiki, plus semblable à un annuaire qu’à un réel wiki par ailleurs.

hidden wiki

Ici se trouve des milliers d’adresses répertoriés en catégories. Et il suffit de parcourir la page d’accueil pour découvrir que oui, on peut vraiment tout trouver sur internet. Les domaines en .onion (l’extension du deep web) offre des services variés tels que la vente de drogue, d’armes, le hack à la demande et l’assassinat sur gage… Oui, vu comme ça, ça peut paraître plutôt sombre comme zone. Mais le deep web c’est aussi un espace de liberté où les valeurs tolérantes (et anarchiques) du web sont encore vivantes. On peut trouver des sites d’artistes, évidemment des milliers de fichiers (plus ou moins légaux certes, mais quelle meilleure manière de conserver la diversité culturelle ?), c’est aussi le repère de tout ceux qui luttent contre un web brutal et belliqueux. En tout état de cause le deep web, c’est ça, un réel reflet de la société, non aseptisé, qui contient autant de bon que de mauvais et une infinité de nuances de gris. Alors, n’ayez pas peur du deep web, aider le à bien grandir.

 

PS : il faut quand même admettre qu’il faut bien chercher, pour trouver du politiquement correct dans le deep web, alors soyez sûrs de vous mêmes avant de l’explorer. Tout ce que l’éthique journalistique vous cache habituellement s’y trouve. Tout ce que votre maman vous cache s’y trouve.