Le web profond ou web invisible ou encore web caché (en anglais deep web) est la partie du web accessible en ligne, mais non indexée par des moteurs de recherche classiques généralistes, certains moteurs, tels que BASE, prennent cependant en compte cette partie du réseau. La terminologie web profond est opposée à web surfacique.
Le web profond n'est ni le web sombre, ni un réseau d'anonymisation (les services web auxquels on peut accéder via des outils tels Tor, Freenet, I2P, etc.), ni le web opaque (indexable, mais non indexé) bien que, selon les conceptions, on peut considérer que ces deux derniers (voire les trois) en font partie.
Récemment, deux termes sont apparus dans nos conversations quotidiennes, et il n’est pas surprenant qu’il y ait un buzz médiatique, une grande confusion et une grande curiosité autour d’eux. L’un des termes dont nous parlons est celui du web profond et l’autre celui de Tor. Pour tous ceux qui sont curieux, ces termes représentent l’accès à des univers d’informations qui restent encore à découvrir. Pour tous ceux ayant des intentions malicieuses, ce sont de nouvelles opportunités d’exploiter des cibles vulnérables. Pour tous les experts en matière de sécurité informatique, ces mêmes termes représentent le futur de leur métier. Et pour presque tous parmi nous, ces termes ouvrent le passage à des régions inexplorées.
Qu’est-ce que le web profond ?
Le terme du « web profond » (ou « Deep Web » en anglais) a été défini pour la première fois en 2001 par Michael K- Bergman de Bright Planet, mais ses origines remontent jusqu’en 1994, lorsque Jill Ellsworth y a fait référence en l’appelant le « web invisible ». De nos jours, le « web profond »représente des sites web non indexés par les moteurs de recherches majeurs tels que Google, Bing et Yahoo. Les sites web du web profond existent au-dessous de la surface de la toile connue et indexée et dans sa totalité, le web profond est en fait vastement plus large que la toile à la surface. Le web profond est d’une taille énorme, ne cesse d’augmenter et n’est pas complètement accessible. Ce qui n’est pas étonnant , c’est qu’il soit également un nid de malwares et d’activités criminelles.
De nouveaux termes apparaissent comme des vagues dans l’océan, Chaque jour, il y a de nouveaux termes. Tandis que certains d’entre-eux disparaissent pratiquement immédiatement, d’autres entrent dans le domaine public même si la plupart des internautes n’ont aucune idée ce qu’ils veulent dire, sans parler de comprendre les rapports techniques. C’est un problème éternel dans le monde de la sécurité informatique.
Somme toute, le web profond comprend un bon nombre de sous-sections, dont l’une est le réseau Tor. Tor est un outil dont se servent ceux qui souhaitent rester anonymes sur Internet et le réseau existe en fait depuis 2002. Tor n’est pas encore entré dans le domaine public, mais le terme s’emploie de plus en plus, et cela est dû sans aucun doute aux médias qui ne cessent de nous parler d’Edward Snowden et de la NSA. Pour cette raison, les termes de Tor et du web profond sont souvent entremêlés et utilisés l’un pour l’autre, mais il est important de comprendre qu’il n’en est pas ainsi. Le réseau Tor est simplement une partie du web profond et étant librement accessible à toute personne munie d’un ordinateur, il est simplement plus connu que les autres parties.
D’autres territoires du web profond
À part le réseau Tor, le web profond est composé d’un bon nombre de sous-sections connues et inconnues. En bas, vous trouverez une liste des plus grandes sections.
Le web dynamique
La majorité du web profond connu est composé de contenus dynamiquement générés lorsque des utilisateurs lancent des requêtes dans des bases de données, ce qui n’a rien à voir avec des réseaux criminels clandestins. Les pages web de la surface de la toile sont visibles parce qu’elles sont statiques, plus ou moins permanentes et ainsi indexables. Les pages web dynamiques, par contre, n’existent que lorsqu’elles sont générées suite à la requête d’un utilisateur spécifique, telles qu’une requête envoyée à un moteur de recherche ou lors de l’envoi d’un formulaire. Cela rend l’indexage assez difficile d’un point de vue technique, comme les pages web dynamiques « n’existent » pas toujours et changent régulièrement de forme.
Le web privé
Le terme du web profond s’applique également aux sites web qui n’existent qu’au sein d’intranets privés (tels que ceux que vous avez peut-être à votre poste de travail) et aux sites qui se trouvent sur la toile normale, mais sont protégés par des mots de passe. La nature privée de ces deux types de sites web empêche les webcrawlers, les programmes automatisés dont se servent les moteurs de recherche afin d’indexer le web connu et statique, d’y avoir accès. Naturellement, tous ceux qui créent et distribuent des malwares créent des intranets privés et site web protégés par des mots de passe sur la toile normale afin de collaborer en secret.
L’Internet des Objets
L’Internet des Objets (Internet of Things, IoT) peut également être considéré comme une section du web profond, quoiqu’il ait des parties qui ont été indexées par des entreprises travaillant sur le domaine de la sécurité telles que Shodan. L’Internet des Objets est essentiellement une sous-section de la Toile, créée par des machines pour des machines. C’est l’Internet des réfrigérateurs intelligents et des thermostats automatisés, l’Internet des lampadaires sensibles aux mouvements et les machines régulatrices industrielles. À proprement parler, l’Internet des Objets est une toile pleine de données en langage de machines, et mise à part le fait qu’elle soit non indexée, elle n’est pas sécurisée, ce qui en fait une cible potentielle pour les pirates informatiques.
Plongeons encore plus profondément avec Tor
Une des meilleurs manières pour mieux comprendre toute sorte de technologie est en y jouant. Il en va de même pour le web profond, et plus précisément Tor. Tor est un navigateur permettant aux internautes de naviguer en tout anonymat, y compris sur la toile à la surface du WWW avec ces domaines .com, .org, .edu etc., mais également sur les sites web : .ONION qui n’existent que sur la réseau Tor. Vous avez bien lu : .ONION. T.o.r. est un acronyme, en toutes lettres : “The Onion Router »-Network. Tor doit son nom à la navigation rendue anonyme à travers une série de nœuds en plusieurs couches dont la structure ressemble à un oignon. Normalement, lorsque vous vous connectez sur un site web, vous passez du point A au point B, et il est bien possible d’identifier ces deux points par leur adresse IP unique. Sur Tor, lorsque vous visitez un site web, votre trajet passe plutôt du point A au point Z en passant par des arrêts intermédiaires. Ce passage est bien sûr moins rapide, mais il permet de voiler l’adresse IP de tout point ou nœud dans ce passage, tout en maintenant tout ordinateur associé anonyme.
C’est pourquoi Tor est un outil excellent pour tous ceux qui souhaitent protéger leur vie privée, sans oublier tout programmateur malveillant et autres criminels. Tor peut par exemple permettre à des journalistes politiquement motivés ou à des lanceurs d’alerte de se prononcer contre les injustices commises par un gouvernement oppressif, mais également aux terroristes de communiquer tout en restant anonymes. Ce qui est encore pire, c’est que Tor peut faciliter le trafic d’armes, de stupéfiants ou d’autres marchandises illégales. Dans ses coins les plus sombres, Tor permet même de distribuer des contenus pornographiques illégaux. Tout en tenant compte de tout ceci, vous vous demanderez probablement pourquoi vous devriez aller explorer Tor et pourquoi nous vous le conseillons. Il semble un lieu dangereux, peuplé par des criminels et des pirates informatiques, et c’est exactement l’image qu’en font les médias. Ce qui rend les choses encore plus compliquées , c’est que les domaines Tor sont essentiellement voilés à l’œil humain. À part avoir .ONION comme suffixe, la plupart des domaines Tor apparaissent sous forme d’une série aléatoire de chiffres et de lettres, ce qui donne des adresses comme suit : https://L3g2uèpl4kpjq6kuf7c4m.onion/#sthash.HhMqNOSA.dpuf.
Cela veut dire que lorsque vous tombez sur un nouveau domaine .ONION, vous n’avez aucune chance de savoir où vous finirez et lorsque vous cliquez dessus, vous pouvez finir à un lieu où vous n’aviez pas l’intention d’aller. Néanmoins, une balade sur le réseau Tor peut s’avérer une expérience riche d’enseignements. Du moins, cette balade peut vous montrer à quel point la partie à laquelle l’internaute lambda à accès sur la toile est petite et quels dangers celle-ci peut présenter, de même qu’une balade dans un quartier chaud de votre ville peut vous ouvrir les yeux.
En principe, la balade sur le réseau Tor n’a qu’une seule règle : télécharger Tor depuis le site web officiel de Tor.
Une fois que vous vous lancez dans cette aventure, n’oubliez jamais : chaque fois que vous cliquez, c’est à vos risques et périls.
Les dangers du web profond et ses malwares
Activités criminelles
Il est vrai que des criminels se servent de Tor, mais tous ceux qui se servent de Tor ne sont pas forcément criminels. Nombreux sont ceux qui s’en servent afin de protéger leur identité sur Internet. N’oubliez pas, Tor est une application destinée à la navigation dont on peut se servir afin de naviguer soit sur la surface visible de la toile soit sur le réseau Tor du web profond. Vous êtes susceptibles de tomber sur des activités criminelles et/ou devenir témoin dans les deux environnements, mais il est vrai que la plupart des criminels sérieux prennent des mesures supplémentaires et minutieuses afin de voiler leurs activités des yeux des citoyens lambda.
Malwares du web profond
La plupart d’entre nous se demandent sûrement : Mon ordinateur peut-il être infecté rien qu’en entrant dans le réseau Tor ?
La réponse brève et simple à cette question est : Oui, mais cela n’est pas spécifiquement dû à Tor. Votre ordinateur est susceptible d’attraper une infection causée par des malwares à travers le réseau Tor pour la même raison que s’il attrapait une infection causée par Internet Explorer en naviguant sur la toile normale du WWW : les pirates informatiques hébergent leurs malwares sur des domaines. On pourrait croire que la motivation pour un pirate est d’autant plus grande d’héberger un logiciel malveillant sur un domaine .ONION étant donné que son identité reste anonyme, mais vous êtes en fait plus susceptible de tomber sur des malwares sur la toile normale du WWW, puisque qu’il y a plus de personnes qui l’utilisent et que l’auteur de malware lambda cherche à tirer des profits financiers en infectant le plus grand nombre d’ordinateurs possible.
Il ne faut tout de même pas sous-estimer l’importance du web profond et du réseau Tor en termes de malwares. De même qu’à tout autre criminel, le web profond et le réseau Tor permettent aux auteurs et distributeurs de malwares de rester anonymes, ce qui est très attirant pour eux, car ils tiennent à collaborer en secret avec leur équipe.
Ce qui est peut-être le plus important, c’est que Tor permet également aux pirates de connecter les ordinateurs infectés à un serveur Command & Control via la toile ! Cette troisième possibilité est basée sur la manipulation du fichier svchosts.exe
, qui contrôle comment votre ordinateur se connecte à Internet. En principe, cette méthode passe par l’installation cachée du navigateur Tor et puis par la reconfiguration du fichier svchosts.exe
de sorte que votre ordinateur se connecte sur un serveur malveillant sur le réseau Tor sans que vous ne vous en rendiez compte. Une connexion pareille permet de commander, contrôler ou surveiller votre ordinateur de manière anonyme ou de le connecter à un botnet.
Escroqueries du web profond
En fin de compte, tous ceux qui s’aventurent pour explorer n’importe quelle région du web profond devraient être au courant des escroqueries potentielles face auxquelles ils peuvent se trouver. Peu importe si vous explorez le réseau Tor ou interagissez avec quelqu’un d’autre sur un intranet non indexé ou un site web protégé par un mot de passe, il est essentiel de ne jamais oublier qu’il est pratiquement impossible de tracer cette interaction. Cela veut dire que votre vis-à-vis est capable de vous duper et de s’en sortir sans dommage si vous vous décidez à transférer des fonds ou de donner vos données personnelles.
La protection sur le web profond
Le bouclier de protection et l’épée à double tranchant
Malgré l’aspect dangereux du web profond, il est possible de l’explorer en toute sécurité. Un Anti Virus et Un Pare Feu vous protège contre les malwares qu’importe où vous vous les rencontrez. Les malwares du web profond s’appuient sur les mêmes signatures et montrent les mêmes types de comportement que tout autre logiciel malveillant ; ils se trouvent simplement dans un autre environnement. Les vrais dangers du web profond sont ceux qui existent hors du royaume des malwares. Le web profond est un lieu aux sombres profondeurs et chaque côté positif offre également l’opportunité de passer à des activités criminelles. Ce qui est triste, c’est qu’il en va de même pour la plupart des technologies découvertes au cours de l’histoire humaine : c’est une épée à double tranchant.
La leçon la plus importante que vous pouvez tirer de cette introduction au web profond est probablement la suivante : ce n’est qu’une introduction. Le réseau Tor n’est rien d’autre qu’une masse énorme d’informations qui existent et augmentent au-dessous de la surface de la toile que nous connaissons. Une balade dans cette sous-section est absolument optionnelle, mais il est obligatoire pour tous ceux qui tiennent à maintenir intacte leur sécurité numérique de connaître son existence. Tor et ses bénéfices nous permettent de naviguer sur la surface de la toile en tout anonymat et de garder notre vie privée à l’abri neámmoins il ne s’agit là que d’un moyen parmi d’autres.
Comme l’océan que représente Internet continue à croître, les opportunités de nous interconnecter avec de nouvelles personnes, dont les intentions seront bonnes, malicieuses ou neutres, augmenteront. Néanmoins, de nouveaux territoires requièrent un nouveau langage et nous espérons que vous comprenez maintenant de quoi on parle en utilisant les termes du web profond et du réseau Tor. Un monde connecté devrait être un monde libre de malwares, et la connaissance de ce monde représente déjà la moitié du chemin, c’est déjà à moitié gagné !.