Plongeons dans les profondeurs de l’Internet

TENDANCE ■ « Plongeons dans les profondeurs de l’Internet » : Il est maintenant temps d’éclaircir notre compréhension du Deep Web, Dark Web ou encore TOR.

  • Plongeons dans les profondeurs de l’Internet

    Plongeons dans les profondeurs de l’Internet

Depuis sa création à la fin des années 1980, l’Internet, le réseau informatique mondial, ne cesse de nous surprendre avec des nouveautés technologiques et métiers mais également de nous perdre sous une montagne de nouveaux termes et concepts émergents. Ces dernières années, les médias ont beaucoup parlé du Deep Web, du Dark Web ou encore du réseau TOR. Afin de mieux comprendre ces termes, débutons par le commencement, le Surface Web (Web de surface).

Pour faciliter la compréhension, Internet peut être représenté sous la forme d’un iceberg. Derrière cette image se cachent deux concepts fondamentaux décrivant l’Internet que l’on connaît aujourd’hui, le « Surface Web » et le « Deep Web » (Web profond). Le second étant beaucoup plus abondant que le premier.

Du Surface Web au Deep Web

Le premier représente donc toutes les pages Web accessibles via les moteurs de recherche, c’est-à-dire les pages Web indexées. Vous y trouverez par exemple www.youtube.com, www.agencedevoyage... Vous l’aurez compris, le second, le Deep Web, représente les pages Web non indexées. Bien que le nom « Deep Web » fasse très « hacker hollywoodien », nous y sommes tous déjà allés au moins une fois. L’exemple le plus simple est celui des réseaux sociaux. En effet, bien que la page www.facebook.com soit indexée, le contenu des autres pages ne l’est pratiquement pas, à tel point que vous ne trouverez pas la vidéo des dernières vacances de votre ami Roland en tapant sur Google « vidéo vacances Roland Liechtenstein », même si cette page Web existe bel et bien (www.facebook.com/monamiRoland/video12345678). Le Deep Web est très vaste, beaucoup plus vaste que le Surface Web qui selon les chiffres de Google indexe 60 trillions de pages Web. Difficile d’imaginer une telle quantité de pages représentant le Deep Web. Finalement, ce dernier contient, en plus des vidéos Facebook de notre ami Roland, des pages Web visibles à des abonnés, des données médicales, des publications scientifiques, des informations gouvernementales, etc.

Et le Dark Web dont parlent les films, c’est quoi ?

On y arrive. En effet, on entend également parler du Dark Web (Web sombre), notamment pour certaines activités illégales (drogue, terrorisme, etc.). Le Dark Web est ce que l’on peut appeler une sous-classe de Deep Web. Tout comme ce dernier, les pages n’y sont pas indexées dans les moteurs de recherche. En plus de cela, elles ne sont pas accessibles via un navigateur normal comme les pages Web des Surface et Deep Web : les pages du Dark Web ont un accès limité. Il s’agit de réseaux à l’accès restreint au sein de l’Internet mondial. Il en existe plusieurs, dont le plus connu est The Onion Router, ou TOR (littéralement « le routeur oignon »). Il faudrait un article entier sur TOR pour décrire son fonctionnement tant il est subtil. L’idée derrière celui-ci est de créer un tunnel secret et aléatoire de votre ordinateur jusqu’à votre destination (le site Web que vous voulez atteindre) afin de conserver un anonymat complet. Mais comme l’accès y est restreint, pour utiliser ce réseau vous devrez vous équiper d’un navigateur spécifique (TOR browser, qui est facile d’utilisation, https://www.torproject.org/). Ce navigateur vous permettra de surfer sur Internet (Surface et Deep Web) en total anonymat vis-à-vis de votre fournisseur d’accès à Internet, de Google ou encore de la NSA. Vous pourrez également accéder au Dark Web, sachant qu’il vous faudra connaître les noms exacts des pages Web à visiter car elles ne sont pas indexées dans les moteurs de recherche.

L’indexation des pages Web

Afin de saisir la différence entre le Surface et Deep Web, il est important de comprendre comment les moteurs de recherche scannent les pages Web de l’Internet. Google, Bing, Yahoo, DuckDuckGo et autres moteurs de recherche explorent l’Internet et ses pages Web en suivant les liens de page en page. Grâce à des algorithmes poussés, ils trient les pages Web en fonction de leur contenu, auteur, etc., et enregistrent ces données dans un index qui sera utilisé pour retrouver les pages Web en fonction de ce que l’utilisateur tapera dans la barre de recherche. C’est pourquoi l’on nomme ce processus l’indexation des pages Web.