Bright Data triomphe en justice contre Elon Musk et Meta – Sa plateforme IA à 100 millions de dollars défie désormais les géants de la tech

Bright Data beat Elon Musk and Meta in court — now its $100M AI platform is taking on Big Tech

Bright Data triomphe en justice contre Elon Musk et Meta – Sa plateforme IA à 100 millions de dollars défie désormais les géants de la tech

Bright Data, entreprise israélienne spécialisée dans le scraping web, a remporté des victoires judiciaires retentissantes contre Meta et X (Twitter) d'Elon Musk en 2024. Ces succès ont établi un précédent juridique crucial concernant l'accès aux données publiques sur internet. Mercredi dernier, la société a dévoilé une suite complète d'infrastructures IA baptisée Deep Lookup et Browser.ai, dotée d'un budget de 100 millions de dollars, pour fournir aux systèmes d'intelligence artificielle un accès illimité aux données web en temps réel.

Selon Or Lenchner, PDG de Bright Data, l'intelligence des modèles linguistiques modernes n'est plus limitée par leurs capacités algorithmiques mais par leur accès aux données. « Nous avons passé la dernière décennie à nous battre pour un accès ouvert aux données publiques du web », a-t-il déclaré dans une interview exclusive avec VentureBeat. Les nouveaux produits de l'entreprise visent précisément à résoudre ce problème critique pour l'industrie de l'IA.

Les récentes décisions judiciaires ont confirmé que les données accessibles sans connexion constituent des informations publiques pouvant être légalement collectées. Ces verdicts ont des implications majeures pour l'écosystème IA qui dépend largement du scraping web pour entraîner ses modèles. Fait révélateur, Meta et X étaient eux-mêmes clients de Bright Data tout en poursuivant l'entreprise en justice, illustrant l'attitude contradictoire des géants technologiques face à cette pratique.

Deep Lookup fonctionne comme un moteur de recherche en langage naturel capable de répondre à des requêtes complexes en temps réel. Contrairement aux chatbots classiques, il excelle dans les requêtes commençant par « trouver tous » et s'appuie sur une archive web de plus de 200 milliards de pages HTML. Browser.ai, quant à lui, est présenté comme « le premier navigateur infaillible et natif pour l'IA », spécialement conçu pour les agents autonomes.

Avec plus de 20 000 clients dont des entreprises du Fortune 500, Bright Data a dépassé les 100 millions de dollars de revenus annuels récurrents. La société mise sur son vaste portefeuille de brevets (5 500 revendications) et son réseau de proxy (150 millions d'adresses IP) pour maintenir son avantage concurrentiel face aux tentatives de blocage des sites web.

En matière de conformité, Bright Data applique strictement le RGPD européen et le CCPA californien, notifiant automatiquement les personnes dont les données personnelles sont collectées et leur offrant la possibilité de les faire supprimer. Cette approche éthique a été validée par les tribunaux américains et constitue un argument commercial majeur auprès des clients entreprises.

Alors que les géants technologiques cherchent à restreindre l'accès aux données tout en développant leurs propres systèmes d'IA, Lenchner prédit un web « de plus en plus fermé ». Dans ce contexte, des infrastructures indépendantes comme celle de Bright Data pourraient devenir essentielles pour préserver l'équilibre concurrentiel dans l'écosystème IA. « Nous sommes une entreprise d'infrastructure », souligne le PDG, « et nous n'avons pas l'intention de faire autre chose ».

Deep Lookup est actuellement en version bêta pour les clients professionnels, tandis que Browser.ai et les serveurs MCP sont déjà disponibles sur la plateforme existante de Bright Data.

Bright Data đánh bại Elon Musk và Meta ở tòa - Giờ đây nền tảng AI 100 triệu USD thách thức các đại gia công nghệ

Bright Data, công ty Israel chuyên thu thập dữ liệu web, đã giành chiến thắng pháp lý trước Meta và X (Twitter) của Elon Musk vào năm 2024. Những phán quyết này tạo tiền lệ quan trọng về quyền truy cập dữ liệu công khai trên internet. Mới đây, họ đã ra mắt bộ giải pháp cơ sở hạ tầng AI trị giá 100 triệu USD mang tên Deep Lookup và Browser.ai, cung cấp cho hệ thống AI khả năng tiếp cận không giới hạn với dữ liệu web thời gian thực.

Theo CEO Or Lenchner, trí thông minh của các mô hình ngôn ngữ hiện đại không còn bị giới hạn bởi thuật toán mà bởi khả năng tiếp cận dữ liệu. "Chúng tôi đã dành 10 năm qua để đấu tranh cho quyền truy cập mở vào dữ liệu web công khai", ông chia sẻ trong cuộc phỏng vấn độc quyền với VentureBeat. Các sản phẩm mới được thiết kế để giải quyết chính điểm nghẽn này của ngành công nghiệp AI.

Các vụ kiện đã xác lập nguyên tắc pháp lý: dữ liệu xem được mà không cần đăng nhập là thông tin công khai có thể thu thập hợp pháp. Điều đáng chú ý, chính Meta và X vừa là khách hàng của Bright Data vừa kiện công ty này, phơi bày thái độ mâu thuẫn của các gã khổng lồ công nghệ với việc thu thập dữ liệu web.

Deep Lookup hoạt động như công cụ tìm kiếm ngôn ngữ tự nhiên, giải quyết các truy vấn phức tạp theo thời gian thực. Khác với chatbot thông thường, nó chuyên xử lý yêu cầu bắt đầu bằng "tìm tất cả" dựa trên kho lưu trữ hơn 200 tỷ trang web. Trong khi đó, Browser.ai được quảng cáo là "trình duyệt không thể chặn, sinh ra dành cho AI", thiết kế riêng cho các tác nhân tự động.

Với hơn 20.000 khách hàng gồm cả các tập đoàn Fortune 500, Bright Data đạt doanh thu định kỳ hàng năm vượt 100 triệu USD. Công ty dựa vào danh mục 5.500 bằng sáng chế và mạng lưới proxy 150 triệu địa chỉ IP để duy trì lợi thế cạnh tranh trước các nỗ lực chặn truy cập từ website.

Về mặt pháp lý, Bright Data tuân thủ nghiêm ngặt GDPR của châu Âu và CCPA của California, tự động thông báo cho cá nhân khi thu thập thông tin và cung cấp tùy chọn xóa dữ liệu. Cách tiếp cận đạo đức này đã được tòa án Mỹ kiểm chứng và trở thành điểm bán hàng quan trọng.

Trước xu hướng các đại gia công nghệ hạn chế dữ liệu trong khi phát triển AI riêng, CEO Lenchner dự đoán tương lai web sẽ "ngày càng khép kín". Trong bối cảnh đó, cơ sở hạ tầng độc lập như của Bright Data có thể trở thành yếu tố then chốt duy trì cân bằng cạnh tranh trong hệ sinh thái AI. "Chúng tôi là công ty cơ sở hạ tầng", ông nhấn mạnh, "và không có ý định làm gì khác ngoài việc này".

Hiện Deep Lookup đang trong giai đoạn beta cho khách hàng doanh nghiệp, trong khi Browser.ai và máy chủ MCP đã có sẵn trên nền tảng hiện tại của Bright Data.