Amazon S3 Vectors : Le premier stockage cloud natif pour vecteurs à grande échelle (préversion)

Introducing Amazon S3 Vectors: First cloud storage with native vector support at scale (preview)

Amazon S3 Vectors : Le premier stockage cloud natif pour vecteurs à grande échelle (préversion)

Aujourd'hui, nous annonçons la préversion d'Amazon S3 Vectors, une solution de stockage de vecteurs durable conçue pour réduire jusqu'à 90 % les coûts liés au téléchargement, au stockage et à l'interrogation de vecteurs. Il s'agit du premier stockage d'objets cloud offrant un support natif pour les jeux de données vectorielles volumineux, avec des performances de requête en moins d'une seconde, rendant ainsi abordable le stockage de données prêtes pour l'IA à grande échelle.

La recherche vectorielle est une technique émergente utilisée dans les applications d'IA générative pour trouver des points de données similaires à une donnée donnée, en comparant leurs représentations vectorielles à l'aide de métriques de distance ou de similarité. Les vecteurs sont des représentations numériques de données non structurées créées à partir de modèles d'embedding. Vous pouvez utiliser ces modèles pour générer des embeddings vectoriels de vos données et les stocker dans S3 Vectors afin d'effectuer des recherches sémantiques.

S3 Vectors introduit les "vector buckets", un nouveau type de bucket avec un ensemble dédié d'API pour stocker, accéder et interroger des données vectorielles sans avoir à provisionner d'infrastructure. Lorsque vous créez un vector bucket, vous organisez vos données vectorielles dans des index vectoriels, simplifiant ainsi l'exécution de requêtes de recherche par similarité. Chaque vector bucket peut contenir jusqu'à 10 000 index vectoriels, chaque index pouvant stocker des dizaines de millions de vecteurs.

Lors de l'ajout de données vectorielles à un index, vous pouvez également associer des métadonnées sous forme de paires clé-valeur à chaque vecteur, permettant de filtrer les futures requêtes selon des critères tels que des dates, catégories ou préférences utilisateur. S3 Vectors optimise automatiquement les données vectorielles au fil des opérations d'écriture, de mise à jour et de suppression, garantissant ainsi le meilleur rapport performance-prix, même à grande échelle.

S3 Vectors est intégré nativement avec Amazon Bedrock Knowledge Bases, y compris dans Amazon SageMaker Unified Studio, pour la création d'applications RAG (Retrieval-Augmented Generation) économiques. Grâce à son intégration avec Amazon OpenSearch Service, vous pouvez réduire les coûts de stockage en conservant les vecteurs rarement interrogés dans S3 Vectors, puis les transférer rapidement vers OpenSearch en cas de besoin ou pour des opérations de recherche en temps réel à faible latence.

Avec S3 Vectors, vous pouvez désormais stocker de manière économique les embeddings vectoriels représentant de grandes quantités de données non structurées (images, vidéos, documents, fichiers audio), permettant des applications d'IA générative évolutives comme la recherche sémantique, la recherche par similarité, RAG, ou la construction de mémoires d'agents. Vous pouvez également développer des applications pour divers cas d'usage sectoriels : recommandations personnalisées, analyse automatisée de contenu, traitement intelligent de documents, sans la complexité et les coûts liés à la gestion de bases de données vectorielles.

Pour créer un vector bucket, sélectionnez "Vector buckets" dans le panneau de navigation gauche de la console Amazon S3, puis cliquez sur "Create vector bucket". Saisissez un nom et choisissez le type de chiffrement (SSE-S3 par défaut, ou SSE-KMS). Consultez le guide utilisateur S3 pour plus de détails sur la gestion des vector buckets.

Créez ensuite un index vectoriel dans votre bucket en spécifiant un nom, la dimensionnalité des vecteurs (tous les vecteurs d'un index doivent avoir la même dimension) et la métrique de distance (cosinus ou euclidienne - choisissez celle recommandée par votre modèle d'embedding). Après création de l'index, vous pouvez y insérer, lister et interroger des vecteurs.

Amazon S3 Vectors: Giải pháp lưu trữ đám mây đầu tiên hỗ trợ vector bản địa quy mô lớn (bản xem trước)

Hôm nay, chúng tôi công bố bản xem trước Amazon S3 Vectors - giải pháp lưu trữ vector chuyên dụng giúp giảm tới 90% chi phí tải lên, lưu trữ và truy vấn vector. Đây là dịch vụ lưu trữ đối tượng đám mây đầu tiên hỗ trợ bản địa các tập dữ liệu vector lớn với khả năng truy vấn dưới một giây, giúp doanh nghiệp dễ dàng lưu trữ dữ liệu sẵn sàng cho AI ở quy mô khổng lồ.

Tìm kiếm vector là kỹ thuật mới nổi trong ứng dụng AI generative, giúp tìm điểm dữ liệu tương đồng bằng cách so sánh biểu diễn vector thông qua các phép đo khoảng cách hoặc độ tương tự. Vector chính là biểu diễn số hóa của dữ liệu phi cấu trúc được tạo từ các mô hình embedding. Bạn có thể dùng mô hình embedding để tạo vector đặc trưng cho dữ liệu và lưu trữ trong S3 Vectors để thực hiện tìm kiếm ngữ nghĩa.

S3 Vectors giới thiệu khái niệm "vector bucket" - loại bucket mới với bộ API chuyên biệt để lưu trữ, truy cập và truy vấn dữ liệu vector mà không cần cung cấp hạ tầng. Khi tạo vector bucket, bạn tổ chức dữ liệu vector trong các chỉ mục vector (vector index), giúp đơn giản hóa việc chạy truy vấn tìm kiếm tương đồng. Mỗi vector bucket chứa tối đa 10.000 chỉ mục vector, mỗi chỉ mục lưu trữ hàng chục triệu vector.

Khi thêm dữ liệu vector vào chỉ mục, bạn có thể đính kèm metadata dạng cặp key-value cho từng vector để lọc truy vấn sau này theo điều kiện như ngày tháng, danh mục hoặc sở thích người dùng. S3 Vectors tự động tối ưu dữ liệu vector trong quá trình ghi, cập nhật, xóa để đảm bảo hiệu suất giá cả tốt nhất, ngay cả khi tập dữ liệu mở rộng.

S3 Vectors tích hợp sẵn với Amazon Bedrock Knowledge Bases (kể cả trong Amazon SageMaker Unified Studio) để xây dựng ứng dụng RAG (Retrieval-Augmented Generation) tiết kiệm chi phí. Nhờ tích hợp với Amazon OpenSearch Service, bạn có thể giảm chi phí lưu trữ bằng cách lưu các vector ít truy vấn trong S3 Vectors, sau đó nhanh chóng chuyển sang OpenSearch khi nhu cầu tăng hoặc cần hỗ trợ tìm kiếm thời gian thực độ trễ thấp.

Với S3 Vectors, giờ đây bạn có thể lưu trữ hiệu quả các vector embedding đại diện cho khối lượng lớn dữ liệu phi cấu trúc (hình ảnh, video, tài liệu, file âm thanh), mở đường cho các ứng dụng AI generative mở rộng như tìm kiếm ngữ nghĩa, tìm kiếm tương đồng, RAG và xây dựng bộ nhớ agent. Bạn cũng có thể phát triển ứng dụng cho nhiều trường hợp sử dụng đa ngành: đề xuất cá nhân hóa, phân tích nội dung tự động, xử lý tài liệu thông minh mà không cần quản lý phức tạp các cơ sở dữ liệu vector.

Để tạo vector bucket, chọn mục "Vector buckets" trong bảng điều hướng trái của bảng điều khiển Amazon S3, sau đó chọn "Create vector bucket". Nhập tên bucket và chọn loại mã hóa (mặc định là SSE-S3, hoặc SSE-KMS). Tham khảo Hướng dẫn sử dụng S3 để biết thêm chi tiết quản lý vector bucket.

Tiếp theo, tạo chỉ mục vector trong bucket bằng cách chỉ định tên, số chiều vector (tất cả vector trong cùng chỉ mục phải cùng kích thước) và phép đo khoảng cách (cosin hoặc euclid - chọn loại được mô hình embedding khuyến nghị). Sau khi tạo chỉ mục, bạn có thể chèn, liệt kê và truy vấn vector.