EdgeCortix stellt SAKURA-II vor, einen KI-Beschleuniger für den Edge mit beeindruckender Leistung von 60 TOPS (INT8) und einem geringen Stromverbrauch von 8 Watt. Der Chip ist für komplexe KI-Aufgaben wie die Verarbeitung großer Sprachmodelle (LLM), großer Visionsmodelle (LVM) und transformatorbasierter multimodaler Anwendungen sowie für Anwendungen am Netzwerkrand wie IoT-Geräte und autonome Fahrzeuge konzipiert .
Es ermöglicht Flexibilität hinsichtlich der Hardware und die Möglichkeit der Integration in beide PCIe-Erweiterungskarten mit einer oder zwei SAKURA-II-Chips, oder auch in M.2 2280 Modulen (PCIe x8 oder x16 Schnittstelle) Wenn Sie möchten. Somit können Leistungen von bis zu 120 TOPS mit INT8 bzw. 60 TFLOPS mit BF16 erreicht werden.
Die KI-Plattform bietet auch einen Teil davon Modernste Software mit einer MERA-Suite für Programmierung und Optimierung, eine heterogene Kompilierungsplattform, fortschrittliche Quantifizierungstechniken und Modellkalibrierungsfunktionen. Es bietet außerdem die Integration mit gängigen Entwicklungs-Frameworks wie PyTorch, TensorFlow Lite und ONNX sowie Zugriff auf eine umfangreiche Bibliothek hochmoderner Transformationsmodelle und Faltungsmodelle.
Darüber hinaus hat das Unternehmen EdgeCortix auch darüber nachgedacht, seine KI-Beschleuniger-Designs weiterzuentwickeln in SoCs anderer Unternehmen wie AMD integriert werden.
Technische Spezifikationen des IA SAKURA-II
Da der Technische Spezifikationen von EdgeCortix SAKURA-II, sind die folgenden:
- NPU mit DNA-II oder Dynamic Neural Accelerator-Architektur der zweiten Generation.
- Leistung bis zu 60 TOPS mit INT8 oder 30 TFLOPS mit BF16.
- DRAM-Speicher mit zwei 64-Bit-Kanälen vom Typ LPDDR4x (8 GB, 16 GB, 32 GB integriert) mit einer Bandbreite von bis zu 68 GB/s.
- Integrierter 20 MB SRAM-Speicher.
- Wirkungsgrad von bis zu 90 % Auslastung, bei einem Energieverbrauch von 8 W.
- BGA-Verpackung.
Wenn wir uns darauf beziehen SAKURA-II-Modul mit M.2-Formathaben wir:
- DRAM-Speicher
- 8 GB (2x Bänke mit 4 GB LPDDR4)
- 16 GB (2x Bänke mit 8 GB LPDDR4)
- PCIe Gen 3.0 x4-Schnittstelle
- Maximale Leistung von 60 TOPS auf INT8, 30 TFLOPS auf BF16
- 10W Modulleistung
- Abmessungen M.2 2280 (22x80mm)
Für PCIe-ErweiterungskarteDie Spezifikationen für den KI-Beschleuniger lauten wie folgt:
- PCIe Gen 3.0 x8-Schnittstelle
- Für SAKURA-II-Single-Chip-Modell:
- 16 GB DRAM-Speicher (2x Bänke mit 8 GB LPDDR4)
- Leistung von 60 TOPS auf INT8, 30 TFLOPS auf BF16
- 10 W Leistung.
- Für das Modell mit zwei SAKURA-II-Chips:
- 32 GB DRAM-Speicher (2x Bänke mit 16 GB LPDDR4)
- Leistung von 120 TOPS auf INT8, 60 TFLOPS auf BF16
- Potenz von 20W
- 1x Steckplatz
- Inklusive Kühlkörper
In Bezug auf die preiseWenn Sie sich fragen, werden sie ab dem zweiten Quartal 2024 eintreffen mit:
- M.2 8 GB: 249 $
- M.2 16 GB: 299 $
- PCIe 1xSAKURA-II: 429 $
- PCIe 2xSAKURA-II: 749 $