NVIDIA Ampere A100 250W TDP GPU บน PCIe 4.0 ที่สร้างขึ้นสำหรับ AI, Data Science และ Supercomputing เปิดตัวพร้อมกับประสิทธิภาพที่สัญญาไว้ 90 เปอร์เซ็นต์ของรุ่น 400W
NVIDIA ได้เปิดตัว A100 ซึ่งเป็น GPU ที่รองรับ PCIe 4.0 อย่างเป็นทางการโดยใช้สถาปัตยกรรม Ampere รุ่นใหม่ แม้ว่าจะมีโปรไฟล์ TDP 250W ที่ต่ำกว่า แต่ NVIDIA ก็สัญญาว่า GPU PCIe 4.0 Ampere A100 จะสามารถให้ประสิทธิภาพสูงสุดถึง 90 เปอร์เซ็นต์ของประสิทธิภาพของ GPU 400W A100 HGX เต็มรูปแบบ ตัวแปรที่สามของตระกูล Ampere A100 GPU ที่กำลังเติบโต A100 PCIe มีไว้สำหรับเซิร์ฟเวอร์ที่ใช้ Artificial Intelligence (AI), Data Science และ Supercomputing clusters
NVIDIA เปิดตัว A100 GPU รุ่น PCI-Express 4.0 GPU ขึ้นอยู่กับสถาปัตยกรรมขนาดเล็กแอมป์ 7 นาโนเมตร นอกจากนี้ บริษัทยังได้ประกาศระบบขับเคลื่อน A100 หลายระบบจากผู้ผลิตเซิร์ฟเวอร์ชั้นนำ เช่น Asus, Dell, Cisco, Lenovo และอื่นๆ ตัวเร่ง GPU 250W A100 PCIe 4.0 นั้นค่อนข้างคล้ายกับตัวแปร 400W TDP เต็มรูปแบบและ NVIDIA ก็มีแนวโน้มที่จะมีประสิทธิภาพใกล้เคียงกันแม้จะมีโปรไฟล์ TDP ลดลงอย่างมาก
NVIDIA A100 Ampere GPU ใน PCIe 4.0 Form-Factor พร้อมการกำหนดค่า GPU 400W A100 HGX เดียวกัน แต่ที่ 250W:
NVIDIA ได้ประกาศตัวเร่งความเร็ว GPU PCIe 4.0 A100 PCIe Ampere GPU มีให้สำหรับกรณีการใช้งานอุตสาหกรรมที่หลากหลายโดยมีระบบตั้งแต่ A100 PCIe GPU ตัวเดียวไปจนถึงเซิร์ฟเวอร์ที่ใช้การ์ดสองใบพร้อมกันผ่านช่องสัญญาณ NVLINK 12 ช่องที่ให้แบนด์วิดท์การเชื่อมต่อระหว่างกันรวม 600 GB / s ตัวเร่ง GPU 250W TDP A100 PCIe ไม่เปลี่ยนแปลงมากนักในแง่ของการกำหนดค่าหลักเมื่อเทียบกับ GPU 400W A100 HGX
https://twitter.com/storagereview/status/1275132949709688833
GA100 GPU มีข้อกำหนดของตัวแปร 400W A100 HGX ที่มี 6912 CUDA cores จัดเรียงใน 108 SM หน่วย, 432 Tensor Cores และ 40 GB ของหน่วยความจำ HBM2 ที่ให้แบนด์วิดธ์หน่วยความจำเดียวกันที่ 1.55 TB/s (ปัดเศษเป็น 1.6 TB/ s). อย่างไรก็ตามการปรับใช้แพ็คเกจ GPU บนไฟล์ มาตรฐาน PCIe 4.0 มีข้อเสียของตัวเองในการลด TDP อย่างมีนัยสำคัญ ตามรายงานนี้หมายถึงการลงโทษประสิทธิภาพ 10 ถึง 50 เปอร์เซ็นต์ตามปริมาณงาน ยิ่งไปกว่านั้นรุ่น 250W TDP ของ A100 GPU นั้นเหมาะกับการระเบิดระยะสั้นมากกว่าการโหลดแบบต่อเนื่อง
NVIDIA A100 Ampere GPU ใน PCIe 4.0 Form-Factor Performance:
เนื่องจากการลดลงอย่างมากในโปรไฟล์ TDP อาจสันนิษฐานได้ว่าการ์ดจะมีนาฬิกาที่ต่ำกว่าเพื่อชดเชยอินพุต TDP ที่น้อยลง อย่างไรก็ตามเมตริกประสิทธิภาพที่ NVIDIA เปิดตัวออกมานั้นน่าแปลกใจอย่างแท้จริงเนื่องจากมีความใกล้เคียงกับตัวแปร 400W TDP ประสิทธิภาพ FP64 ยังคงได้รับการจัดอันดับที่ 9.7/19.5 TFLOPs, ประสิทธิภาพ FP32 ได้รับการจัดอันดับที่ 19.5 /156/312 TFLOPs (Sparsity), ประสิทธิภาพของ FP16 ได้รับการจัดอันดับที่ 312/624 TFLOPs (Sparsity) และ INT8 ได้รับการจัดอันดับที่ 624/1248 TOPs ( ความเบาบาง).
การคำนวณทางคณิตศาสตร์อย่างง่ายระบุและ NVIDIA รับรองว่า GPU แบบ PCIe 4.0 250W A100 ที่ใช้แอมแปร์สามารถให้ประสิทธิภาพ 90 เปอร์เซ็นต์ของการ์ด A100 HGX (400W) ในแอพพลิเคชั่นเซิร์ฟเวอร์ชั้นนำ นี่เป็นเรื่องที่สมเหตุสมผลเนื่องจากใช้เวลาน้อยกว่าสำหรับตัวแปรใหม่ในการทำงานที่กล่าวถึงข้างต้นให้เสร็จสิ้น อย่างไรก็ตาม ตัวเลขควรจะใช้ได้ในช่วงเวลาสั้นๆ เท่านั้น ในสถานการณ์ที่ซับซ้อนและต้องการความสามารถของ GPU อย่างต่อเนื่อง GPU 250W PCIe 4.0 สามารถส่งมอบประสิทธิภาพของ GPU 400W A100 HGX ได้ถึง 90 เปอร์เซ็นต์ถึง 50 เปอร์เซ็นต์
สถาปัตยกรรมขนาดเล็กของ Ampere จะเป็นประโยชน์ต่อ A100 ใหม่อย่างแน่นอน NVIDIA สัญญาว่าจะเพิ่มประสิทธิภาพอย่างน้อย 20X เหนือรุ่นก่อนที่ใช้ Volta PCIe 4.0 A100 GPU มีเทคโนโลยี GPU แบบหลายอินสแตนซ์ ซึ่งหมายความว่า A100 ตัวเดียวสามารถแบ่งพาร์ติชันเป็น GPU แยกกันได้มากถึงเจ็ดตัวเพื่อจัดการงานคอมพิวเตอร์ที่แตกต่างกัน แม้ว่าสิ่งนี้จะช่วยเพิ่มการแบ่งกลุ่ม แต่ก็มี NVLink รุ่นที่ 3 ซึ่งช่วยให้สามารถรวม GPU หลายตัวเข้ากับ GPU ขนาดยักษ์ตัวเดียวได้