Memex – Le moteur d’exploration du DarkNet de la DARPA

2
152

La DARPA, le laboratoire de recherche de l’armée américaine a mis au point un programme capable de mener des recherches thématiques dans des pages Web non indexées par les moteurs habituels. 95% du Web fait parti du DarkNet.

L’ensemble des moteurs de recherche exploitent environ 5% des contenus du Web. Pour contrer cela, l’armée américaine a développé Memex, un moteur de recherche qui peut rechercher des données dans 100% du Web, y compris le Deep Web. Pari technique hors normes offrant des possibilités d’actions inimaginables !

Présenté en 2014, cet outil « révolutionnaire » est utilisé depuis plus d’un an par les forces de l’ordre des États-Unis pour traquer toutes sortes de criminels. Memex est un moteur de recherche très particulier, qui permet d’inspecter la partie invisible de la Toile, que les autres moteurs de recherche n’indexent pas, ou mal. On appelle cette partie de l’internet le Deep Web. Et s’il est impossible de le mesurer avec précision, il serait gigantesque, bien plus vaste que la Toile que l’on peut explorer par le biais d’outils comme Google. La DARPA pour Defense Advanced Research Projects Agency, est l’un des laboratoires de recherche de l’armée américaine. En disposant d’un tel moteur de recherche surpuissant, l’armée américaine peut donc traquer les cybercriminels évoluant sur le Deep Web.

darpa-memex

Le Darknet ou Deep Web est inconnu du grand public mais représente pourtant 95% du Web. Cette partie du Net est invisible du commun des mortels et n’est pas référencée par les moteurs de recherche commerciaux, ni, bien entendu, indexée par Google.

"L'Internet est beaucoup, beaucoup plus grand que les gens ne le pensent. 
Selon certaines estimations Google, Microsoft Bing et Yahoo nous donnes accès 
à environ 5% du contenu sur le Web."

C’est ce qu’à expliqué le spécialiste Chris White, dans une interview accordée à CBS. Ces pages sont un des principaux outils des différents réseaux criminels qui auraient ainsi publié pas moins 60 millions de pages ces deux dernières années, selon la Darpa.

640.1029052

Cette nouvelle arme a permis aux autorités américaines de démanteler un réseau de prostitution et de trafic humain à l’échelle mondiale. Il a déjà été testé lors du Super Bowl, afin de surveiller les réseaux de prostitution. Memex était capable de repérer de nombreuses pages cachées faisant la promotion de services sexuels, puis de récupérer des données permettant d’identifier le lieu de leur publication: géolocalisation d’un appareil, adresse IP, numéro de téléphone ou une adresse mentionnée dans la réclame. Elles étaient ensuite compilées, recoupées puis associées aux photos de femmes figurant sur ces pages. De cette manière, Memex pouvait repérer les mouvements de différentes prostituées sur une carte, et faciliter le travail de la police.

640.1029064

Memex est capable d’indexer ce Web invisible pour aider les enquêtes dans les activités illégales trafic de drogue, de prostitution ou encore de pédophilie. Il peut aussi comprendre les liens entre les différentes pages et présenter les informations obtenues sous formes de graphiques, cartes, frises, etc. « Il s’agit d’un bel exemple de la manière dont le Big Data peut aider à protéger les personnes vulnérables », estime Barack Obama dans le cadre de son rapport sur le Big Data, publié en janvier. Coût du projet estimé entre 10 et 20 millions de dollars.

En parallèle, Europol a pu démanteler un réseau international de prostitution entre la Roumaine et l’Espagne, lors d’une action conjointe entre les forces de Police, dans la journée du 9 février 2015.

2 Commentaires

  1. Il ne faut pas confondre Darknet, Deep Web, Dark Internet etc. Chacun présentant un concept différent. Ensuite, il faut relativiser la capacité dindexation de MEMEX qui est loin de pouvoir indexer 100% du Deep Web.

Les commentaires sont fermés.