NVIDIA i AWS wprowadzają nowe instancje EC2 G7 z GPU Blackwell oraz przyspieszenie wektorowe w OpenSearch dla łatwiejszego wdrażania AI.

Źródło zdjęcia: NVIDIA Blog
NVIDIA i Amazon Web Services ogłosiły rozszerzenie współpracy mającej na celu ułatwienie wdrażania sztucznej inteligencji na skalę produkcyjną. Partnerstwo obejmuje nowe instancje Amazon EC2 G7 z procesorami graficznymi NVIDIA RTX PRO 4500 Blackwell oraz integrację biblioteki NVIDIA cuVS z Amazon OpenSearch. Szczegóły współpracy przedstawiono w oficjalnym komunikacie NVIDIA.
Nowe rozwiązania mają odpowiedzieć na kluczowe wyzwania związane z budowaniem systemów AI na dużą skalę, w tym zapewnienie niskich opóźnień, szybkiego wyszukiwania wektorowego i wydajnej infrastruktury bez zwiększania złożoności operacyjnej.
Instancje Amazon EC2 G7 wyposażone w procesory graficzne NVIDIA RTX PRO 4500 Blackwell Server Edition zostały zaprojektowane z myślą o różnorodnych obciążeniach produkcyjnych. Oprócz inferencji AI obsługują również grafiki, przetwarzanie przestrzenne i analizy danych z przyspieszeniem GPU.
W porównaniu z poprzednią generacją G6, nowe instancje oferują nie tylko 4,6-krotną poprawę wydajności inferencji AI, ale również 2,1-krotnie lepszą wydajność graficzną. Znacząco przyspieszone zostały także analizy danych w Amazon EMR z wykorzystaniem biblioteki NVIDIA cuDF dla Apache Spark.
Platforma obsługuje konfiguracje od jednego do ośmiu GPU z 700 Gbps siecią EFA i do 7,6 TB lokalnego storage NVMe SSD. Dostępne będą również wersje bare metal, co pozwala zespołom na precyzyjne dopasowanie infrastruktury do konkretnych potrzeb zamiast nadmiarowego provisioningu zasobów.
Najnowsza generacja Amazon OpenSearch Serverless wprowadza GPU-accelerated indeksowanie wektorowe napędzane przez NVIDIA cuVS jako domyślny wybór obliczeniowy dla wszystkich kolekcji wektorowych. To przełomowa zmiana dla zespołów budujących systemy RAG (retrieval-augmented generation), wyszukiwanie semantyczne, systemy rekomendacyjne i aplikacje agentyczne AI.
Wykorzystanie NVIDIA cuVS przekształca GPU-powered wyszukiwanie wektorowe z wyspecjalizowanego projektu optymalizacyjnego w standardową możliwość AWS. Bezpośredni wpływ na klientów obejmuje indeksowanie wektorowe do 10 razy szybsze przy jednej czwartej kosztów w porównaniu z rozwiązaniami opartymi wyłącznie na CPU. Dzięki temu budowanie baz danych wektorowych na skalę miliardową staje się praktyczne w czasie poniżej godziny.
AWS osiągnęło status NVIDIA Exemplar Cloud dla procesorów GB300 w kontekście obciążeń treningowych. Status ten oznacza spełnienie rygorystycznych progów wydajnościowych, które NVIDIA stosuje do benchmarkingu obciążeń AI względem swojej architektury referencyjnej.
To osiągnięcie jest wynikiem głębokiej współpracy inżynieryjnej między zespołami AWS i NVIDIA w ramach inicjatywy NVIDIA Exemplar Clouds. Deweloperzy i liderzy AI mogą mieć pewność, że korzystają ze spójnej, wysokowydajnej infrastruktury chmurowej dla treningów na dużą skalę.
Łącznie przedstawione rozwiązania wzmacniają każdą warstwę stosu infrastruktury AI w AWS, oferując wydajność na skalę produkcyjną bez zwiększania obciążenia operacyjnego dla zespołów odpowiedzialnych za jej obsługę.
Eksperyment hackmyclaw.com pokazał, że nawet 6000 wyrafinowanych ataków prompt injection nie było w stanie złamać zabezpieczeń Claude Opus 4.6.
W Indiach nowe systemy ostrzegawcze z AI skracają czas reakcji z godzin do sekund, by uniknąć tragicznych starć między ludźmi a słoniami.

Pionier sztucznej inteligencji skrytykował firmę Muska za problemy kadrowe i przewiduje kryzys w branży AI z powodu nierentownego modelu biznesowego.