The National Times - Graid Technology bringt ein agentenbasiertes KI-Speicherportfolio auf den Markt, um Engpässe bei KV-Caches zu beseitigen

Graid Technology bringt ein agentenbasiertes KI-Speicherportfolio auf den Markt, um Engpässe bei KV-Caches zu beseitigen


Graid Technology bringt ein agentenbasiertes KI-Speicherportfolio auf den Markt, um Engpässe bei KV-Caches zu beseitigen
Graid Technology bringt ein agentenbasiertes KI-Speicherportfolio auf den Markt, um Engpässe bei KV-Caches zu beseitigen

Von Edge-Inferenz bis NVIDIA STX: speziell entwickelte KV-Cache-Infrastruktur für konsistente Leistung in großem Maßstab.

Textgröße ändern:

SUNNYVALE, CA / ACCESS Newswire / 21. April 2026 / Graid Technology, der Pionier im Bereich GPU-beschleunigter NVMe-Speicher, hat heute sein Agentic AI Storage Portfolio vorgestellt: eine speziell entwickelte Familie von KV-Cache-Lösungen, die darauf ausgelegt ist, den Speicherengpass zu beseitigen, der „Always-on"-Produktions-KI ausbremst. Das Portfolio umfasst drei Bereitstellungsebenen: KV-Cache-Server, KV-Cache-Rack und KV-Cache-Plattform, die alle auf der SupremeRAID™-Technologie basieren. Die KV-Cache-Plattform, die höchste Stufe des Portfolios, ist auf die STX-Referenzarchitektur von NVIDIA abgestimmt, wobei die native BlueField-4-DPU-Ausführung für das zweite Halbjahr 2026 geplant ist.

Da agentische KI vom Experimentierstadium in die Produktion übergeht, haben sich die Infrastrukturannahmen, die der Single-Shot-Inferenz zugrunde lagen, als unhaltbar erwiesen. Modelle, die kontinuierliche mehrstufige Aufgaben ausführen und den Kontext über stundenlangen Betrieb hinweg aufrechterhalten, erzeugen KV-Cache-Anforderungen, die den GPU-HBM überlasten. Die Folge: Latenzspitzen von bis zu 18-fach, eine GPU-Auslastung von nur 50 % sowie Fehler auf Modellebene, darunter Halluzinationen und eine Verschlechterung der Schlussfolgerungsfähigkeit, die schwer zu erkennen und kostspielig zu beheben sind.

SupremeRAID™geht dieses Problem direkt an, indem es bis zu 32 NVMe-Laufwerke zu einem einzigen virtuellen Pool mit 280 GB/s bündelt, die CPU über GPU Direct Storage umgeht und KV-Cache-Lesevorgänge mit 1,3 ms liefert - 77-mal schneller als bei Standard-NVMe. Die drei Portfolio-Stufen machen diese Fähigkeit für jede Bereitstellungsgröße verfügbar:

KV-Cache-Server - NVMe-Beschleunigung auf Einzelknotenebene für einzelne Inferenzserver und Edge-AI-Bereitstellungen. Ab sofort verfügbar.

KV-Cache-Rack - Rack-Scale-Lösungen, die von Partnern validiert und gemeinsam mit führenden Server-OEM-Partnern für Multi-GPU-Cluster in Unternehmen entwickelt wurden. Jetzt verfügbar.

KV-Cache-Plattform - Speziell für die STX-Referenzarchitektur von NVIDIA entwickelt, mit nativer BlueField-4-DPU-Ausführung und einer auf Rack-Ebene skalierbaren Speichererweiterung in der Roadmap.

„Vor einem Jahr, auf der GTC 2025, prognostizierte Jensen Huang, dass Speicher erstmals GPU-beschleunigt werden würde. In diesem Jahr hat NVIDIA dieses Konzept mit STX und CMX in eine Architektur umgesetzt", sagte Leander Yu, CEO von Graid Technology. „Unser KV-Cache-Portfolio ist genau für diesen Moment konzipiert und liefert die Speicherleistung, die agentische KI erfordert, und das zu den Kosten einer Speicherebene."

Für Unternehmen und Infrastrukturteams, die den Einsatz von agentischer KI evaluieren, sind die vollständige Bereitstellungsarchitektur, technische Spezifikationen und Details zur NVIDIA STX-Kompatibilität im Solution Brief verfügbar: Graid Technology Agentic AI Storage Portfolio: Speziell entwickelte KV-Cache-Lösungen für Inferenz in großem Maßstab

Weitere Informationen zu den KI-Angeboten von Graid Technology finden Sie unter graidtech.com/ai

Medienanfragen:

Andrea Eaken, Sr. Direktor für Marketing, Americas & EMEA

[email protected]

____________________________________

Über Graid Technology

Graid Technology entwickelt die Speicherinfrastruktur für die Zukunft von KI, Unternehmen und Hochleistungsrechnen. Als Entwickler von SupremeRAID™, dem weltweit ersten und einzigen GPU-basierten RAID, und als globaler Verfechter von Intel® Virtual RAID on CPU (Intel® VROC) bietet Graid Technology flexible RAID-Lösungen, die die NVMe-Leistung maximieren und gleichzeitig einen ausfallsicheren, skalierbaren Datenschutz für moderne Dateninfrastrukturen gewährleisten. Graid Technology hat seinen Hauptsitz im Silicon Valley und verfügt über weltweite Niederlassungen sowie Forschungs- und Entwicklungszentren in Taiwan. Das Unternehmen treibt RAID-Innovationen für die nächste Generation datenintensiver Workloads voran. Weitere Informationen finden Sie unter graidtech.com.

QUELLE: Graid Technology Inc.

P.Jones--TNT

Empfohlen

Auftakt zum SpaceX-Börsengang: Musk stellt Mars-Mission in Aussicht

Tech-Milliardär Elon Musk hat zum Börsenstart seines Raumfahrtkonzerns SpaceX eine Mars-Mission in Aussicht gestellt. SpaceX wolle Menschen zum Mond bringen, "zum Mars und letztlich darüber hinaus", sagte Musk am Freitag im SpaceX-Hauptquartier in Texas vor jubelnden Mitarbeitern. Sein Ziel sei es, "Star Trek Wirklichkeit werden zu lassen".

KI statt Krake: Fans setzen nun oft auf Tech statt Tier bei WM-Vorhersagen

KI statt Krake: Bei den Vorhersagen für die derzeitige Fußball-Weltmeisterschaft setzen viele Fans statt auf Tier-Orakel auf die Künstliche Intelligenz. Allerdings sind die Prognosen der sogenannten Chatbots unterschiedlich. So sagen ChatGTP des Unternehmens OpenAI und Claude von Anthropic Spanien als Weltmeister voraus, Le Chat der französischen Firma Mistral hingegen tippt auf Frankreich, und die chinesischen Programme Deepseek und Qwen sehen Argentinien als Favoriten.

Internationale Referenzstudie: Entwicklung des Erdklimas immer besorgniserregender

Die Folgen der Erderwärmung werden laut einer Studie immer besorgniserregender. Mehr als 70 Wissenschaftler aus 17 Ländern, darunter Experten des Weltklimarats IPCC, erklärten am Donnerstag, die Erde sei "ein Patient, der immer stärker beunruhigende Symptome zeige". Zusätzlich werde das Klima heute "durch geopolitische Entscheidungen geschwächt oder bedroht", erklärte die französische Klima-Expertin und frühere Leiterin einer IPCC-Arbeitsgruppe, Valérie Masson-Delmotte.

Millionen Kadaver: Chinesische Forscher entdecken größten Wal-Friedhof der Welt

Forscher aus China haben am Grund des Indischen Ozeans den größten Wal-Friedhof der Welt entdeckt. Er sei "erstaunt" gewesen über die vielen Kadaver, die zum Teil Millionen Jahre alt sind, erklärte der Forscher Xiaotong Peng am Mittwoch der Nachrichtenagentur AFP. Er war 2023 mehrfach mit einem kleinen Tauchboot zur Fundstätte vor der Westküste Australiens hinabgetaucht.

Textgröße ändern: