Cette Startup de Y Combinator Profite de la Ruée Vers les Données Audio pour l'IA

This Y Combinator Startup Is Cashing In On The Feeding Frenzy For Audio AI Training Data

Cette Startup de Y Combinator Profite de la Ruée Vers les Données Audio pour l'IA

Avec un modèle commercial relativement simple de génération de données audio, David AI a trouvé une clientèle vorace parmi les plus grands noms de la tech. Aujourd'hui, avec une levée de fonds de 25 millions de dollars en Série A, la startup dépasse une valorisation de 100 millions de dollars.

Tomer Cohen et Ben Wiley, fondateurs de David AI, se sont rencontrés en travaillant ensemble chez Scale AI. Ils ont créé leur entreprise une semaine seulement avant la date limite de candidature pour Y Combinator été 2024, soumettant leur dossier à la dernière minute.

Un an plus tard, David AI s'est imposé comme un fournisseur majeur de données audio pour l'entraînement des intelligences artificielles. Le tour de table de 25 millions de dollars, mené par Alt Capital et Amplify Partners avec la participation de First Round Capital, Y Combinator et BoxGroup, valorise désormais l'entreprise à plus de 100 millions de dollars.

Cohen, ancien analyste chez McKinsey, explique que l'idée de David AI est née de la conviction que la prochaine étape de l'IA serait son intégration dans le monde réel, au-delà des interfaces clavier. Leur startup fournit ainsi des données audio de haute qualité pour entraîner les modèles vocaux d'IA.

David AI ne se contente pas de collecter et raffiner des données audio existantes - l'entreprise les conçoit et produit également. Elle dispose déjà d'environ 100 000 heures d'audio couvrant plus de 15 langues, avec des métadonnées précises sur les dialectes et accents.

Leur modèle est simple : payer des individus pour lire des scripts ou converser, puis enregistrer ces interactions. 'Les laboratoires d'IA veulent se concentrer sur les algorithmes, pas sur ce travail opérationnel de niche', souligne Cohen.

Cette approche porte ses fruits. En moins d'un an, David AI a atteint un taux de revenus annuels à huit chiffres, comptant parmi ses clients la plupart des 'Magnificent Seven' de la tech (Alphabet, Amazon, Apple, Meta...), bien que l'entreprise ne les nomme pas explicitement.

Liz Wessel, partenaire chez First Round Capital, explique cette réussite par la transition actuelle de l'IA textuelle vers l'IA vocale. Elle a mené le tour d'amorçage de 5 millions de dollars en janvier et croit toujours au potentiel de David AI face à la pénurie de données.

Sarah Catanzaro, investisseuse chez Amplify Partners, abonde : 'Les entreprises sont avides de données aujourd'hui. La beauté de David AI, c'est qu'elle répond à ce besoin urgent des développeurs d'IA vocale... avec une solution remarquablement simple : si ils ont besoin de données, vendez-leur des données, sans compliquer inutilement les choses.'

Startup Y Combinator Này Đang Kiếm Bộn Tiền Từ Cơn Sốt Dữ Liệu Âm Thanh Cho AI

Với mô hình kinh doanh đơn giản là tạo dữ liệu âm thanh, David AI đã thu hút được những khách hàng lớn nhất trong làng công nghệ. Giờ đây, sau khi huy động thành công 25 triệu USD vòng Series A, công ty đã đạt định giá hơn 100 triệu USD.

Tomer Cohen và Ben Wiley, hai nhà sáng lập David AI, gặp nhau khi cùng làm việc tại Scale AI. Chỉ một tuần trước hạn nộp hồ sơ cho Y Combinator mùa hè 2024, họ quyết định thành lập công ty và hoàn thành hồ sơ vào phút chót.

Một năm sau, David AI đã trở thành nhà cung cấp dữ liệu âm thanh hàng đầu cho AI. Vòng gọi vốn Series A 25 triệu USD do Alt Capital và Amplify Partners dẫn đầu, với sự tham gia của First Round Capital, Y Combinator và BoxGroup, đưa định giá công ty vượt mốc 100 triệu USD.

Cohen, cựu chuyên viên phân tích kinh doanh tại McKinsey, và Wiley cùng nảy ra ý tưởng về một AI có thể tương tác với thế giới thực thay vì chỉ qua bàn phím. Điều này dẫn đến sự ra đời của David AI, công ty chuyên cung cấp dữ liệu âm thanh chất lượng cao để huấn luyện các mô hình giọng nói AI.

David AI không chỉ thu thập và tinh chỉnh dữ liệu âm thanh từ thực tế mà còn tự thiết kế và sản xuất chúng. Đến nay, công ty đã tích lũy khoảng 100.000 giờ âm thanh với hơn 15 ngôn ngữ, kèm theo metadata về phương ngữ và giọng điệu.

Mô hình kinh doanh của David AI khá đơn giản: trả tiền cho người đọc kịch bản hoặc trò chuyện và ghi âm lại. Cohen cho biết các phòng lab AI thường muốn tập trung vào phát triển thuật toán hơn là những công việc vận hành kỹ thuật chi tiết như vậy.

Chiến lược này đã thành công. Chưa đầy một năm sau khi thành lập, David AI đã đạt doanh thu hàng năm tám con số, với phần lớn khách hàng đến từ nhóm 'Big Tech' như Alphabet, Amazon, Apple, Meta...

Liz Wessel, đối tác tại First Round Capital, nhận định nhu cầu dữ liệu âm thanh cho AI đang bùng nổ. Bà dẫn đầu vòng gọi vốn 5 triệu USD hồi tháng 1 và tiếp tục tin tưởng vào tiềm năng của David AI trước tình trạng khan hiếm dữ liệu AI hiện nay.

Sarah Catanzaro, nhà đầu tư tại Amplify Partners, đồng tình: 'Các công ty đang rất khát dữ liệu. David AI giải quyết nhu cầu cấp thiết này một cách đơn giản - bán dữ liệu cho họ mà không cần phức tạp hóa vấn đề.'