ASUS Sunucular, Yapay Zekâ Performansında 26 Adet MLPerf Inference v2.0 ile Rekor Kırdı

Samuag

New member
ASUS, geçtiğimiz Aralık ayında katıldığı MLCommons Association bünyesinde birinci sonuçlarını yayınladı. Şirket, epeyce sayıda testte yeni performans rekorlarına imza attı.

Bilhassa en son MLPerf Inference 2.0 testlerinde ASUS, kapalı bilgi merkezi kategorisindeki altı farklı yapay zeka çıkarım vazifesinde tıpkı GPU yapılandırmasına sahip öbür tüm sunucuları geride bırakarak 26 adet rekor kırdı. Bu rekorların 12’si, sekiz adet 80 GB NVIDIA® A100 Tensor Core GPU içeren ASUS ESC8000A-E11 sunucuyla; 14’ü ise dört adet 24 GB NVIDIA A30 Tensor Core GPU içeren ASUS ESC4000A-E11 sunucuyla kırıldı.


Bu çığır açan sonuçlar ASUS sunucularının yapay zeka alanındaki performans liderliğini gözler önüne serdi. ASUS sunucuları, yapay zekadan yararlanmak isteyen kurumlara büyük katkı sağlıyor ve data merkezlerine en uygun performansı sunuyor.

MLPerf Inference 2.0 testi, en sık kullanılan altı yapay zeka çıkarımı iş yükünü kapsıyor. Bunlar içinde manzara sınıflandırma (ResNet50), obje tespiti (SSD-ResNet34), tıbbi manzara bölümlendirme (üç boyutlu-Unet), konuşma tanımlama (RNN-T), doğal lisan sürece (BERT) ve tavsiye (DLRM) iş yükleri bulunuyor.

ESC8000A-E11 aşağıdakiler de dahil olmak üzere birfazlaca alanda performans liderliğini elde etti:

  • ResNet50’de bir saniye arasında 298.105 görüntüyü sınıflandırdı
  • SSD-ResNet34’te bir saniye arasında 7.462,06 imajda obje tanımladı
  • üç boyutlu-UNet’te bir saniye arasında 24,3 tıbbi manzarayı işledi
  • BERT’te bir saniye arasında 26.005,7 soruyu ve yanıtı tamamladı
  • DLRM’de bir saniye arasında 2.363.760 tahmin yaptı
ESC8000A-E11 sonuçları

KısımnazaranvModelSonuçlarHassaslıkSenaryoÜniteler
Kapalı Bilgi MerkeziManzara
sınıflandırma
ResNet5021001199,00Sunucusorgu/s
298105Çevrimdışıörnek/s
Obje tespiti
(geniş)
SSD-ResNet347096,1099,00Sunucusorgu/s
7462,06Çevrimdışıörnek/s
Tıbbi görüntülemeüç boyutlu-UNet24,399,00Çevrimdışıörnek/s
24,399,90Çevrimdışıörnek/s
Konuşmadan metneRNN-T94.996,999,00Sunucusorgu/s
102.738Çevrimdışıörnek/s
Doğal lisan süreceBERT23.489,599,00Sunucusorgu/s
26.005,7Çevrimdışıörnek/s
11.491,399,90Sunucusorgu/s
13.168,2Çevrimdışıörnek/s
TavsiyeDLRM1.601.30099,00Sunucusorgu/s
2.363.760Çevrimdışıörnek/s
1.601.30099,90Sunucusorgu/s
2.363.760Çevrimdışıörnek/s

ESC4000A-E11 aşağıdakiler de dahil olmak üzere birfazlaca alanda performans liderliğini elde etti:

  • ResNet50’de bir saniye arasında 73.814,5 görüntüyü sınıflandırdı
  • SSD-ResNet34’te bir saniye arasında 1.957,18 imgede obje tanımladı
  • üç boyutlu-UNet’te bir saniye arasında 6,83 tıbbi imgeyi işledi
  • RNNT’te bir saniye arasında 27.299,2 adet konuşma tespit edip dönüştürdü
  • BERT’te bir saniye arasında 6.896,01 soruyu ve karşılığı tamamladı
  • DLRM’de bir saniye arasında 574.371 tahmin yaptı
ESC4000A-E11 sonuçları

KısımnazaranvModelSonuçlarHassaslıkSenaryoÜniteler
Kapalı Data Merkeziİmaj
sınıflandırma
ResNet5068.19299,00Sunucusorgu/s
73.814,5Çevrimdışıörnek/s
Obje tespiti
(geniş)
SSD-ResNet341.886,7599,00Sunucusorgu/s
1.957,18Çevrimdışıörnek/s
Tıbbi görüntülemeüç boyutlu-UNet6,8399,00Çevrimdışıörnek/s
6,8399,90Çevrimdışıörnek/s
Konuşmadan metneRNN-T17.391,499,00Sunucusorgu/s
27.299,2Çevrimdışıörnek/s
Doğal lisan süreceBERT6.367,9799,00Sunucusorgu/s
6.896,01Çevrimdışıörnek/s
2.917,6699,90Sunucusorgu/s
3.383,03Çevrimdışıörnek/s
TavsiyeDLRM560.15899,00Sunucusorgu/s
574.371Çevrimdışıörnek/s
560.15899,90Sunucusorgu/s
574.371Çevrimdışıörnek/s

NVIDIA sertifikalı 4U ESC8000A-E11 model (sekiz adet 80 GB NVIDIA A100 PCIe Tensor Core GPU ve iki adet AMD EPYC 7763 CPU ile yapılandırılan) sunucuyla elde edilen 12 rekor, bu modelin yapay zeka ve makine tahsili için sunduğu üstün ölçeklendirilebilme kapasitesini ortaya koydu. CPU ve GPU için bağımsız hava tünellerine sahip gelişmiş termal tasarım, hava soğutmalı bilgi merkezlerine son derece verimli bir soğutma tahlili sunuyor.

Pazardaki en kompakt yapılı 2U model olan NVIDIA sertifikalı ESC4000A-E11 (dört adet 24 GB NVIDIA A30 PCIe Tensor Core GPU veiki adet AMD EPYC 7763 CPU ile yapılandırılan) ise MPLerf Inference 2.0’da 14 adet rekora imza attı. Biroldukca farklı grafik hızlandırıcıyı kullanma imkanı sağlayan ve NVIDIA NVLink yüksek süratli dahili GPU ilişkisine dayanak veren bu model, azamî yapay zeka performansı sunuyor.