Le codage, l'application phare du génératif IA ? Une étude remet en question ses bénéfices réels

Coding has emerged as genAI’s killer use case. But what if its benefits are a mirage?

Le codage, l'application phare du génératif IA ? Une étude remet en question ses bénéfices réels

Le codage assisté par IA générative est souvent présenté comme son cas d'usage ultime. Mais de nouvelles recherches suggèrent que ses avantages pourraient être surestimés, révélant même un impact négatif sur la productivité des développeurs.

Jeremy Kahn, rédacteur en chef IA chez Fortune, analyse cette tendance dans sa newsletter Eye on AI. La semaine dernière, l'échec de l'acquisition de Windsurf par OpenAI pour 3 milliards de dollars a marqué l'actualité, tandis que Google embauchait l'équipe dirigeante de cette startup spécialisée dans les outils de codage IA.

Cette transaction s'inscrit dans une série de 'quasi-acquisitions' récentes dans le secteur, comme les accords de Meta avec Scale AI ou Microsoft avec Inflection. Google aurait dépensé 2,4 milliards de dollars pour le talent et la technologie de Windsurf, tandis que la startup Cognition rachetait les restes de l'entreprise.

Les tensions croissantes entre OpenAI et Microsoft, qui n'ont pu s'entendre sur l'accès à la technologie Windsurf, mériteraient une analyse approfondie. Ces acquisitions atypiques semblent également conçues pour contourner les obstacles réglementaires.

Pourtant, le véritable sujet concerne l'efficacité réelle des assistants de codage IA. Alors que GitHub Copilot de Microsoft et Cursor (évalué à 10 milliards) sont présentés comme des succès, trois nouvelles études jettent le doute sur leurs bénéfices concrets.

L'organisation à but non lucratif METR a mené une étude randomisée avec 16 développeurs expérimentés utilisant Cursor Pro avec les modèles Claude d'Anthropic. Contrairement à leurs prévisions d'un gain de productivité de 24%, les résultats montrent que l'IA a en réalité ralenti leur travail de 19%.

Les développeurs n'ont accepté que 44% du code généré par l'IA, et 75% d'entre eux ont dû relire minutieusement chaque ligne. Plus de la moitié ont effectué des modifications majeures au code proposé, remettant en question l'efficacité réelle de ces outils.

Lập trình - ứng dụng đột phá của AI sinh sôi? Nghiên cứu mới hé lộ lợi ích có thể chỉ là ảo ảnh

Công cụ lập trình hỗ trợ bởi AI sinh sôi (genAI) thường được ca ngợi là ứng dụng thành công nhất. Nhưng nghiên cứu mới đây chỉ ra những lợi ích này có thể bị thổi phồng, thậm chí cho thấy tác động tiêu cực đến năng suất lập trình viên.

Jeremy Kahn, biên tập viên AI của Fortune, phân tích xu hướng này trong bản tin Eye on AI. Tuần trước, thương vụ OpenAI thâu tóm startup công cụ lập trình AI Windsurf với giá 3 tỷ USD đổ bể, trong khi Google chiêu mộ đội ngũ lãnh đạo công ty này.

Giao dịch này nằm trong chuỗi 'thâu tóm không chính thức' gần đây như thương vụ của Meta với Scale AI hay Microsoft với Inflection. Google được cho là chi 2,4 tỷ USD cho nhân tài và công nghệ của Windsurf, trong khi startup Cognition mua lại phần còn lại.

Căng thẳng gia tăng giữa OpenAI và Microsoft - khi hai bên không thể thống nhất về quyền truy cập công nghệ Windsurf - xứng đáng một bài phân tích riêng. Những thương vụ kiểu này cũng có vẻ nhằm né tránh rào cản pháp lý.

Tuy nhiên, vấn đề cốt lõi là hiệu quả thực sự của trợ lý lập trình AI. Dù GitHub Copilot của Microsoft hay Cursor (định giá 10 tỷ USD) được coi là thành công, ba nghiên cứu mới đặt dấu hỏi về lợi ích thực tế.

Tổ chức phi lợi nhuận METR thực hiện thử nghiệm ngẫu nhiên với 16 lập trình viên kỳ cựu sử dụng Cursor Pro tích hợp mô hình Claude của Anthropic. Trái với dự đoán tăng 24% năng suất, kết quả cho thấy AI khiến họ chậm hơn 19%.

Các lập trình viên chỉ chấp nhận 44% code do AI tạo ra, 75% phải kiểm tra từng dòng code. Hơn một nửa phải sửa đổi lớn, đặt nghi vấn về hiệu quả thực sự của các công cụ này.