Pourquoi Bhashini ne rivalise pas avec OpenAI ou les startups indiennes d'IA

Why Bhashini isn’t Competing with OpenAI or Indian AI Startups

Pourquoi Bhashini ne rivalise pas avec OpenAI ou les startups indiennes d'IA

Publié le 16 juin 2025 dans la rubrique IA. Pourquoi Bhashini ne rivalise pas avec OpenAI ou les startups indiennes d'IA. 'Nous ne cherchons pas à devenir la plus grande entreprise d'IA—nous construisons une infrastructure publique qui rend cette croissance possible.' par Mohit Pandey. Lorsqu'on pense à développer l'IA, on imagine généralement les géants de la tech ou les startups milliardaires comme OpenAI ou Anthropic. Mais en Inde, l'approche est différente. Le gouvernement prend les devants en finançant et en mettant en place l'infrastructure nécessaire pour toute la population. Depuis trois ans, Bhashini, piloté par l'État, a discrètement développé des modèles linguistiques, des plateformes de traduction et des outils qui traitent désormais 10 millions de demandes de traduction quotidiennes, avec une application téléchargée plus d'un million de fois. Pourtant, ce n'est que le début. La mission phare de l'IA linguistique en Inde ne cherche pas à surpasser OpenAI ou les startups locales. Elle pose les bases pour leur développement. 'Voyez Bhashini comme NPCI', explique Amitabh Nag, PDG de Bhashini et directeur d'IndiaAI, dans le podcast What’s the Point. 'Nous ne cherchons pas à devenir la plus grande entreprise d'IA—nous construisons une infrastructure publique qui rend cette croissance possible', dit-il. Mais il ne s'agit pas seulement d'échelle. C'est une question d'accès. Alors qu'OpenAI et d'autres acteurs occidentaux ciblent l'Inde, on s'interroge sur la capacité des initiatives locales comme Bhashini à rivaliser. Nag balaie ces craintes. 'Ce n'est pas un conflit. Si vous résolvez un problème avec un cas d'usage solide, vous survivrez à OpenAI et à tous les autres', affirme-t-il. Le 'moment ChatGPT de l'Inde' n'est pas un produit. Le pari le plus ambitieux de Bhashini est la traduction parole-parole. 'L'idée est d'avoir un système qui vous rend multilingue d'un clic', explique Nag. 'Détection automatique de la langue, identification du locuteur, diarisation—tout fait partie du processus.' Sur certains critères, les systèmes vocaux de Bhashini surpassent déjà OpenAI en latence. 'Nous étions les premiers à parler de précision à 100% et de systèmes axés sur la voix quand l'industrie doutait encore', souligne-t-il. 'Nous y sommes presque. Mais il ne s'agit pas de créer une réplique. Nous avons dû commencer par créer les données numériques elles-mêmes en langues indiennes—ce que personne d'autre n'avait fait.' 'Bhashini est utile quand je veux parler à un chauffeur de taxi en kannada sans connaître la langue. Ça marche, et à un prix abordable', dit-il. 'ChatGPT peut traduire, certes—mais ce n'est pas le propos. Nous construisons quelque chose pour l'Inde.' La mission de Bhashini s'ancre dans l'intérêt public, pas la domination marchande. 'Si quelqu'un d'autre peut faire mieux, tant mieux. L'idée est de créer une saine concurrence et de montrer ce qui est possible.' Cela a conduit à des initiatives comme Bhasha Daan, où les citoyens contribuent à des corpus parallèles via des applis pour former des modèles dans des langues peu dotées comme le bodo, le manipuri, le khasi, le mizo, ou même des écritures comme le kaithi, encore utilisées dans les registres fonciers du Bihar. Bhashini existe précisément parce que les acteurs privés ne s'y aventureraient pas. 'Essayez de convaincre une startup de développer pour le bodo', lance Nag. 'C'est pourquoi le gouvernement est intervenu.' Pas le Hugging Face de l'Inde, mais bien plus. Un des projets ambitieux de Nag est AI Kosh—le dépôt de modèles et de jeux de données de Bhashini. Bien que cela ressemble à une version indienne de Hugging Face, Nag nuance. 'Nous construisons quelque chose de plus profond. Voyez cela comme la monnaie de l'IA pour l'Inde.' AI Kosh hébergera non seulement des données et modèles, mais permettra des pipelines complets de cas d'usage, agissant comme un KoshaGraph pour les futurs systèmes d'IA. 'Internet en Inde n'est pas devenu un simple moteur de pub—c'est un outil d'inclusion. L'IA suivra cette voie.' Bhashini n'est pas seul. Il collabore avec des startups, des labos et des plateformes comme AI4Bharat. 'Certains bâtissent des cadres de gouvernance, d'autres des modèles de base. Tout est complémentaire. À terme, le puzzle s'assemblera.' Le prochain front de Bhashini concerne les villes de second et troisième rang, notamment dans des États comme le Madhya Pradesh, l'Uttar Pradesh, le Jharkhand, le Bihar et le Nord-Est. 'Nous approchons les gouvernements locaux avec des protocoles d'accord, non comme une directive descendante, mais comme une co-création', explique Nag. 'L'idée est que les États adoptent, affinent et s'approprient les modèles avec le temps.' La souveraineté ne se limite pas aux données. L'Inde insiste sur une IA construite localement, contrairement aux pays occidentaux. Nag compare cela à l'éducation d'un enfant. 'L'IA apprend comme un enfant—elle absorbe valeurs, culture et comportements de son environnement. Si nous voulons que nos modèles respectent nos nuances linguistiques, nos codes culturels, nous devons les construire nous-mêmes', explique-t-il. Par exemple, un enfant du Telangana s'adresse à ses aînés différemment qu'au Tamil Nadu. 'Il s'agit d'encoder les fondamentaux de notre société dans les systèmes d'IA.' C'est pourquoi l'appli Bhashini reste en bêta—volontairement. 'Elle fonctionne bien dans 35+ langues ; nous en avons ajouté une hier', dit-il. Le statut bêta reflète moins une immaturité qu'une amélioration continue. 'Bêta signifie que nous progressons—ce n'est pas une bêta traditionnelle', précise Nag.

Tại sao Bhashini không cạnh tranh với OpenAI hay các startup AI Ấn Độ

Đăng ngày 16 tháng 6 năm 2025 trong chuyên mục AI. Tại sao Bhashini không cạnh tranh với OpenAI hay các startup AI Ấn Độ. 'Chúng tôi không muốn trở thành công ty AI lớn nhất—chúng tôi đang xây dựng hạ tầng công để tạo nền tảng cho sự phát triển đó.' bởi Mohit Pandey. Khi nghĩ về phát triển AI, người ta thường nghĩ ngay đến các đại gia công nghệ hay startup tỷ đô như OpenAI hay Anthropic. Nhưng tại Ấn Độ, cách tiếp cận khác biệt. Ở đây, chính phủ đi đầu trong việc cung cấp ngân sách và thiết lập hạ tầng nền tảng cho toàn dân. Trong 3 năm qua, Bhashini do nhà nước dẫn dắt đã âm thầm xây dựng các mô hình ngôn ngữ, nền tảng dịch thuật và công cụ hiện xử lý 10 triệu yêu cầu dịch mỗi ngày, với ứng dụng Bhashini vượt mốc triệu lượt tải. Nhưng đó mới chỉ là khởi đầu. Sứ mệnh AI ngôn ngữ quốc gia này không nhằm vượt mặt OpenAI hay làn sóng startup AI Ấn Độ. Nó đặt nền móng cho họ. 'Hãy coi Bhashini như NPCI', Amitabh Nag, CEO Bhashini kiêm Giám đốc IndiaAI, phát biểu trên podcast What’s the Point. 'Chúng tôi không muốn thành công ty AI lớn nhất—chúng tôi xây hạ tầng công để tạo điều kiện phát triển', ông nói. Nhưng không chỉ là quy mô. Đây là vấn đề tiếp cận. Khi OpenAI và các hãng phương Tây nhắm vào Ấn Độ, nhiều người băn khoăn liệu các sáng kiến địa phương như Bhashini có cạnh tranh nổi không. Nag bác bỏ lo ngại này. 'Đây không phải cuộc đối đầu. Nếu bạn giải quyết vấn đề bằng trường hợp ứng dụng mạnh, bạn sẽ tồn tại cùng OpenAI, cùng bất kỳ ai', ông khẳng định. 'Khoảnh khắc ChatGPT của Ấn Độ' không phải một sản phẩm. Cược lớn nhất của Bhashini là dịch thoại-thoại. 'Ý tưởng là có hệ thống một nút bấm giúp bạn đa ngôn ngữ', Nag giải thích. 'Tự động nhận diện ngôn ngữ, xác định người nói, tách lời—tất cả đều nằm trong quy trình.' Ở một số tiêu chí, hệ thống thoại của Bhashini đã vượt OpenAI về độ trễ. 'Chúng tôi đi đầu nói về độ chính xác 100% và hệ thống ưu tiên giọng nói khi ngành còn nghi ngại', ông nhấn mạnh. 'Chúng tôi không còn xa. Nhưng không phải để tạo bản sao. Chúng tôi phải bắt đầu từ việc tạo dữ liệu số bằng chính ngôn ngữ Ấn Độ—điều chưa ai trên thế giới làm.' 'Bhashini hữu ích khi tôi muốn nói chuyện với tài xế taxi bằng tiếng Kannada dù không biết ngôn ngữ này. Nó hoạt động, với chi phí phải chăng', ông nói. 'ChatGPT có thể dịch, đúng—nhưng đó không phải vấn đề. Chúng tôi đang xây dựng thứ gì đó cho Ấn Độ.' Sứ mệnh Bhashini bắt nguồn từ lợi ích công, không phải thống trị thị trường. 'Nếu ai đó làm tốt hơn, càng tốt. Ý tưởng là tạo cạnh tranh lành mạnh và chứng minh điều khả thi.' Điều này dẫn đến các sáng kiến như Bhasha Daan, nơi người dân đóng góp kho ngữ liệu song ngữ qua ứng dụng di động để huấn luyện mô hình cho các ngôn ngữ ít tài nguyên như Bodo, Manipuri, Khasi, Mizo, hay cả chữ viết Kaithi vẫn dùng trong hồ sơ đất đai Bihar. Bhashini tồn tại chính vì các công ty tư nhân không mặn mà. 'Thử thuyết phục startup phát triển cho tiếng Bodo xem', Nag nói. 'Đó là lý do chính phủ vào cuộc.' Không phải Hugging Face của Ấn Độ, mà sâu sắc hơn. Một trong những dự án đầy tham vọng Nag đang lãnh đạo là AI Kosh thuộc IndiaAI Mission—kho lưu trữ mô hình và dữ liệu của Bhashini. Dù trông giống phiên bản Ấn của Hugging Face, Nag không nghĩ vậy. 'Chúng tôi xây dựng thứ sâu sắc hơn. Hãy coi như đồng tiền AI của Ấn Độ.' AI Kosh không chỉ chứa dữ liệu và mô hình, mà còn cho phép xây dựng cả pipeline ứng dụng, hoạt động như KoshaGraph cho hệ thống AI tương lai. 'Internet ở Ấn không trở thành công cụ quảng cáo—nó thành phương tiện hòa nhập. AI sẽ đi theo con đường đó.' Bhashini không đơn độc. Nó hợp tác cùng startup, phòng nghiên cứu và nền tảng như AI4Bharat. 'Có nơi xây khung quản trị, nơi phát triển mô hình nền tảng. Tất cả bổ sung cho nhau. Cuối cùng, mảnh ghép sẽ khớp.' Tiếp theo, Bhashini nhắm đến các thành phố cấp 2 và 3, đặc biệt ở bang như Madhya Pradesh, Uttar Pradesh, Jharkhand, Bihar và vùng Đông Bắc. 'Chúng tôi tiếp cận chính quyền bang bằng thỏa thuận hợp tác, không phải chỉ thị từ trên xuống, mà như hoạt động đồng sáng tạo', Nag giải thích. 'Ý tưởng là để các bang áp dụng, tinh chỉnh và sở hữu mô hình theo thời gian.' Chủ quyền không chỉ là dữ liệu. Ấn Độ nhấn mạnh việc tự xây AI trong khi các nước phương Tây không khẩn trương như vậy. Nag ví von với nuôi dạy trẻ để giải thích. 'AI học như trẻ con—nó hấp thụ giá trị, văn hóa và hành vi từ môi trường. Nếu muốn mô hình tôn trọng sắc thái ngôn ngữ, hành vi xã hội và mã văn hóa của chúng ta, ta phải tự xây dựng chúng', ông nói. Ví dụ, trẻ từ Telangana xưng hô với người lớn khác trẻ Tamil Nadu. 'Đó là về việc mã hóa nền tảng xã hội vào hệ thống AI.' Đây cũng là lý do ứng dụng Bhashini vẫn trong giai đoạn beta—nhưng có chủ đích. 'Nó hoạt động tốt với 35+ ngôn ngữ; hôm qua vừa thêm một ngôn ngữ nữa', ông cho biết. Nhãn beta không phải dấu hiệu non nớt mà thể hiện cải tiến liên tục. 'Beta nghĩa là chúng tôi đang trên đường hoàn thiện—không phải beta truyền thống', Nag làm rõ.