Bright Data triomphe en justice contre Elon Musk et Meta – Sa plateforme IA à 100 millions de dollars défie désormais les géants de la tech
Bright Data, entreprise israélienne spécialisée dans le scraping web, a remporté des victoires judiciaires retentissantes contre Meta et X (Twitter) d'Elon Musk en 2024. Ces succès ont établi un précédent juridique crucial concernant l'accès aux données publiques sur internet. Mercredi dernier, la société a dévoilé une suite complète d'infrastructures IA baptisée Deep Lookup et Browser.ai, dotée d'un budget de 100 millions de dollars, pour fournir aux systèmes d'intelligence artificielle un accès illimité aux données web en temps réel.
Selon Or Lenchner, PDG de Bright Data, l'intelligence des modèles linguistiques modernes n'est plus limitée par leurs capacités algorithmiques mais par leur accès aux données. « Nous avons passé la dernière décennie à nous battre pour un accès ouvert aux données publiques du web », a-t-il déclaré dans une interview exclusive avec VentureBeat. Les nouveaux produits de l'entreprise visent précisément à résoudre ce problème critique pour l'industrie de l'IA.
Les récentes décisions judiciaires ont confirmé que les données accessibles sans connexion constituent des informations publiques pouvant être légalement collectées. Ces verdicts ont des implications majeures pour l'écosystème IA qui dépend largement du scraping web pour entraîner ses modèles. Fait révélateur, Meta et X étaient eux-mêmes clients de Bright Data tout en poursuivant l'entreprise en justice, illustrant l'attitude contradictoire des géants technologiques face à cette pratique.
Deep Lookup fonctionne comme un moteur de recherche en langage naturel capable de répondre à des requêtes complexes en temps réel. Contrairement aux chatbots classiques, il excelle dans les requêtes commençant par « trouver tous » et s'appuie sur une archive web de plus de 200 milliards de pages HTML. Browser.ai, quant à lui, est présenté comme « le premier navigateur infaillible et natif pour l'IA », spécialement conçu pour les agents autonomes.
Avec plus de 20 000 clients dont des entreprises du Fortune 500, Bright Data a dépassé les 100 millions de dollars de revenus annuels récurrents. La société mise sur son vaste portefeuille de brevets (5 500 revendications) et son réseau de proxy (150 millions d'adresses IP) pour maintenir son avantage concurrentiel face aux tentatives de blocage des sites web.
En matière de conformité, Bright Data applique strictement le RGPD européen et le CCPA californien, notifiant automatiquement les personnes dont les données personnelles sont collectées et leur offrant la possibilité de les faire supprimer. Cette approche éthique a été validée par les tribunaux américains et constitue un argument commercial majeur auprès des clients entreprises.
Alors que les géants technologiques cherchent à restreindre l'accès aux données tout en développant leurs propres systèmes d'IA, Lenchner prédit un web « de plus en plus fermé ». Dans ce contexte, des infrastructures indépendantes comme celle de Bright Data pourraient devenir essentielles pour préserver l'équilibre concurrentiel dans l'écosystème IA. « Nous sommes une entreprise d'infrastructure », souligne le PDG, « et nous n'avons pas l'intention de faire autre chose ».
Deep Lookup est actuellement en version bêta pour les clients professionnels, tandis que Browser.ai et les serveurs MCP sont déjà disponibles sur la plateforme existante de Bright Data.