24 czerwca 20264 min czytania

NVIDIA i AWS rozszerzają współpracę w zakresie infrastruktury AI na skalę produkcyjną

NVIDIA i AWS wprowadzają nowe instancje EC2 G7 z GPU Blackwell oraz przyspieszenie wektorowe w OpenSearch dla łatwiejszego wdrażania AI.

Źródło zdjęcia: NVIDIA Blog

NVIDIA i Amazon Web Services ogłosiły rozszerzenie współpracy mającej na celu ułatwienie wdrażania sztucznej inteligencji na skalę produkcyjną. Partnerstwo obejmuje nowe instancje Amazon EC2 G7 z procesorami graficznymi NVIDIA RTX PRO 4500 Blackwell oraz integrację biblioteki NVIDIA cuVS z Amazon OpenSearch. Szczegóły współpracy przedstawiono w oficjalnym komunikacie NVIDIA.

Nowe rozwiązania mają odpowiedzieć na kluczowe wyzwania związane z budowaniem systemów AI na dużą skalę, w tym zapewnienie niskich opóźnień, szybkiego wyszukiwania wektorowego i wydajnej infrastruktury bez zwiększania złożoności operacyjnej.

Kluczowe wnioski

Nowe instancje Amazon EC2 G7 z GPU NVIDIA RTX PRO 4500 Blackwell oferują do 4,6 razy lepszą wydajność inferencji AI w porównaniu z poprzednimi generacjami G6.
NVIDIA cuVS stała się domyślną technologią indeksowania wektorowego w Amazon OpenSearch Serverless, przyspieszając wyszukiwanie nawet 10-krotnie przy jednocześnie czterokrotnie niższych kosztach.
AWS uzyskało status NVIDIA Exemplar Cloud dla procesorów GB300, gwarantując optymalizację wydajności dla zadań treningowych AI.
Rozwiązania obsługują konfiguracje od jednego do ośmiu GPU z łączną pamięcią do 256 GB i storage lokalny do 7,6 TB.
Infrastruktura jest dostępna przez Amazon SageMaker AI, Deep Learning AMIs i inne usługi AWS.

Nowa generacja instancji EC2 G7 z architekturą Blackwell

Instancje Amazon EC2 G7 wyposażone w procesory graficzne NVIDIA RTX PRO 4500 Blackwell Server Edition zostały zaprojektowane z myślą o różnorodnych obciążeniach produkcyjnych. Oprócz inferencji AI obsługują również grafiki, przetwarzanie przestrzenne i analizy danych z przyspieszeniem GPU.

W porównaniu z poprzednią generacją G6, nowe instancje oferują nie tylko 4,6-krotną poprawę wydajności inferencji AI, ale również 2,1-krotnie lepszą wydajność graficzną. Znacząco przyspieszone zostały także analizy danych w Amazon EMR z wykorzystaniem biblioteki NVIDIA cuDF dla Apache Spark.

Platforma obsługuje konfiguracje od jednego do ośmiu GPU z 700 Gbps siecią EFA i do 7,6 TB lokalnego storage NVMe SSD. Dostępne będą również wersje bare metal, co pozwala zespołom na precyzyjne dopasowanie infrastruktury do konkretnych potrzeb zamiast nadmiarowego provisioningu zasobów.

GPU-accelerated wyszukiwanie wektorowe jako standard

Najnowsza generacja Amazon OpenSearch Serverless wprowadza GPU-accelerated indeksowanie wektorowe napędzane przez NVIDIA cuVS jako domyślny wybór obliczeniowy dla wszystkich kolekcji wektorowych. To przełomowa zmiana dla zespołów budujących systemy RAG (retrieval-augmented generation), wyszukiwanie semantyczne, systemy rekomendacyjne i aplikacje agentyczne AI.

Wykorzystanie NVIDIA cuVS przekształca GPU-powered wyszukiwanie wektorowe z wyspecjalizowanego projektu optymalizacyjnego w standardową możliwość AWS. Bezpośredni wpływ na klientów obejmuje indeksowanie wektorowe do 10 razy szybsze przy jednej czwartej kosztów w porównaniu z rozwiązaniami opartymi wyłącznie na CPU. Dzięki temu budowanie baz danych wektorowych na skalę miliardową staje się praktyczne w czasie poniżej godziny.

Certyfikacja wydajności i przyszłość współpracy

AWS osiągnęło status NVIDIA Exemplar Cloud dla procesorów GB300 w kontekście obciążeń treningowych. Status ten oznacza spełnienie rygorystycznych progów wydajnościowych, które NVIDIA stosuje do benchmarkingu obciążeń AI względem swojej architektury referencyjnej.

To osiągnięcie jest wynikiem głębokiej współpracy inżynieryjnej między zespołami AWS i NVIDIA w ramach inicjatywy NVIDIA Exemplar Clouds. Deweloperzy i liderzy AI mogą mieć pewność, że korzystają ze spójnej, wysokowydajnej infrastruktury chmurowej dla treningów na dużą skalę.

Łącznie przedstawione rozwiązania wzmacniają każdą warstwę stosu infrastruktury AI w AWS, oferując wydajność na skalę produkcyjną bez zwiększania obciążenia operacyjnego dla zespołów odpowiedzialnych za jej obsługę.

#infrastruktura AI #Blackwell #NVIDIA #AWS #OpenSearch

Udostępnij

Źródła

NVIDIA AI Blog

Poprzedni

Wielkie zwolnienia w branży tech w 2026: Oracle, Google i Meta wskazują AI jako przyczynę redukcji etatów

Następny

MoEngage przejmuje Aampe za dziesiątki milionów dolarów, stawiając na agentów AI w marketingu

Podobne Publikacje

Etyka i Bezpieczeństwo

Ponad 2000 osób próbowało zhakować asystenta AI — wszystkie próby się nie powiodły

Eksperyment hackmyclaw.com pokazał, że nawet 6000 wyrafinowanych ataków prompt injection nie było w stanie złamać zabezpieczeń Claude Opus 4.6.

4 min26 czerwca

Narzędzia i Aplikacje

Systemy AI mają zapobiec śmiertelnym starciom ze słoniami w Indiach

W Indiach nowe systemy ostrzegawcze z AI skracają czas reakcji z godzin do sekund, by uniknąć tragicznych starć między ludźmi a słoniami.

3 min23 czerwca

Biznes i Rynek

Yann LeCun nazywa xAI Elona Muska porażką i ostrzega przed pęknięciem bańki AI

Pionier sztucznej inteligencji skrytykował firmę Muska za problemy kadrowe i przewiduje kryzys w branży AI z powodu nierentownego modelu biznesowego.

4 min22 czerwca

Kluczowe wnioski

Nowe instancje Amazon EC2 G7 z GPU NVIDIA RTX PRO 4500 Blackwell oferują do 4,6 razy lepszą wydajność inferencji AI w porównaniu z poprzednimi generacjami G6.

NVIDIA cuVS stała się domyślną technologią indeksowania wektorowego w Amazon OpenSearch Serverless, przyspieszając wyszukiwanie nawet 10-krotnie przy jednocześnie czterokrotnie niższych kosztach.

AWS uzyskało status NVIDIA Exemplar Cloud dla procesorów GB300, gwarantując optymalizację wydajności dla zadań treningowych AI.

Rozwiązania obsługują konfiguracje od jednego do ośmiu GPU z łączną pamięcią do 256 GB i storage lokalny do 7,6 TB.

Infrastruktura jest dostępna przez Amazon SageMaker AI, Deep Learning AMIs i inne usługi AWS.

Nowa generacja instancji EC2 G7 z architekturą Blackwell

GPU-accelerated wyszukiwanie wektorowe jako standard

Certyfikacja wydajności i przyszłość współpracy