AMD MI1000 Instinct Accelerator 7nm GPU สำหรับ HPC เปิดตัวอย่างเป็นทางการ ด้วยประสิทธิภาพจุดลอยตัวที่มีความแม่นยำสูงถึง 11.5 Teraflops

GPU ตัวแรกของ AMD ที่ใช้สถาปัตยกรรม CDNA นั้น MI100 เป็นทางการ MI100 Instinct Accelerator GPU ถูกอ้างว่าเป็น “ GPU HPC ที่เร็วที่สุดในโลก” ด้วยประสิทธิภาพจุดทศนิยมแบบ double-precision ที่มีความแม่นยำสูงถึง 11.5 เทราฟลอป GPU อ้างว่าบรรจุหน่วยคำนวณได้มากเป็นสองเท่าของรุ่นก่อนในขณะที่อยู่ภายในขีดจำกัดกำลังไฟ 300 วัตต์เท่าเดิม

AMD ประกาศเปิดตัวผลิตภัณฑ์ใหม่ เครื่องเร่งความเร็วแบบสัญชาตญาณ MI100 GPU ใช้เอ็นจิ้น CDNA ซึ่งแตกต่างจากสถาปัตยกรรม RDNA เล็กน้อยซึ่งขับเคลื่อนกราฟิกการ์ด AMD Radeon RX 6000 Series ล่าสุด MI100 Instinct Accelerator ต่อจาก MI50 และ MI60 Instinct accelerator ที่เปิดตัวเมื่อสองปีที่แล้ว แม้จะมีช่วงเวลาค่อนข้างเล็กระหว่างรุ่น แต่สถาปัตยกรรม GPU และ Compute Engine ใหม่ช่วยให้ GPU ของ AMD เกินความคาดหมาย

AMD MI1000 Instinct Accelerator 7nm GPU สำหรับ HPC Industry Specifications and Features:

MI100 GPU เป็นเครื่องแรกที่รวมสถาปัตยกรรม Compute DNA (CDNA) ของ AMD GPU มี 210 หน่วยคำนวณที่จัดเรียงเป็นสี่อาร์เรย์ สถาปัตยกรรม CDNA เป็นวิวัฒนาการที่ก้าวกระโดดอย่างมีนัยสำคัญเมื่อเทียบกับสถาปัตยกรรม GCN และประกอบด้วยเอ็นจิ้นหลักของเมทริกซ์ใหม่ที่เพิ่มปริมาณการประมวลผลสำหรับรูปแบบตัวเลขที่แตกต่างกัน

AMD อ้างว่าเทคโนโลยี AMD matrix core ใหม่ช่วยให้ MI100 มีประสิทธิภาพจุดลอยตัวที่มีความแม่นยำครึ่งหนึ่งสูงสุด 7 เท่าเมื่อเทียบกับ MI50 บริษัทอ้างว่า MI100 Instinct Accelerator นำเสนอเมทริกซ์ความแม่นยำเดียวสูงสุด 46.1 เทราฟลอป (FP32), 23.1 เทราฟลอปสูงสุดความแม่นยำเดียว (FP32), 184.6 เทราฟลอปส์ประสิทธิภาพจุดทศนิยมแบบครึ่งความแม่นยำ (FP16) และ 92.3 เทราฟลอปสูงสุดของประสิทธิภาพ bfloat16 .

MI100 ยังได้รับ Infinity Fabric Technology ของ AMD ด้วย ซึ่งอ้างว่าเสนอแบนด์วิดท์ I/O พีคแบบเพียร์ทูเพียร์ประมาณ 2 เท่า เหนือ PCIe 4.0 พร้อมแบนด์วิดท์รวมสูงสุด 340 GB/s ต่อการ์ด ในการปรับใช้ในชีวิตจริง MI100 GPU สามารถกำหนดค่าด้วยกลุ่ม GPU สี่ตัวในตัวสูงสุดสองกลุ่ม โดยแต่ละกลุ่มให้แบนด์วิดท์ I/O เพียร์ทูเพียร์สูงสุด 552 Gbps

ในทำนองเดียวกัน หน่วยความจำ HBM2 ขนาด 8GB สี่กองให้หน่วยความจำ HBM2 ขนาด 32GB ทั้งหมดบน MI100 GPU แต่ละตัว ด้วยความเร็วสัญญาณนาฬิกา 1.2 GHz หน่วยความจำมีแบนด์วิดท์หน่วยความจำ 1.23 Tbps การสนับสนุน MI100 สำหรับเทคโนโลยี PCIe Gen 4.0 ช่วยให้แบนด์วิดท์ข้อมูลการขนส่งทางทฤษฎีสูงสุด 64 Gbps ระหว่าง CPU และ GPU

AMD MI100 Accelerator GPU ดีกว่า NVIDIA A100 GPU หรือไม่?

อย่างเคร่งครัดบนกระดาษ MI100 GPU ของ AMD นั้นดูดีกว่า NVIDIA A100 GPU ซึ่งได้รับการจัดอันดับที่ 9.7 เทราฟลอปของประสิทธิภาพทางทฤษฎีสูงสุด อย่างไรก็ตาม ในความเป็นจริง NIVIDIA A100 ให้ประสิทธิภาพการทำงานของ FP64 Linpack ที่สูงกว่า

สถาปัตยกรรม CDNA และ RDNA ของ AMD นั้นเหมือนกันโดยพื้นฐานแล้ว โดยพื้นฐานแล้วความแตกต่างที่สำคัญคือสถานการณ์ของผู้ใช้ปลายทาง มีข้อแตกต่างพื้นฐานบางประการที่ไม่อนุญาตให้ใช้สถาปัตยกรรม CDNA สำหรับการเล่นเกมหรือการแสดงเนื้อหาภาพ

อนึ่ง AMD กำลังเตรียม ROCm ซึ่งเป็นชุดเครื่องมือโอเพนซอร์สของบริษัทซึ่งประกอบด้วยคอมไพเลอร์ API การเขียนโปรแกรมและไลบรารี ชุดเครื่องมือนี้จะทำหน้าที่เป็นพื้นฐานสำหรับเวิร์กโหลดการประมวลผลแบบ exascale ROCm 4.0 ล่าสุดได้อัปเกรดคอมไพเลอร์ให้เป็นโอเพ่นซอร์สและรวมเป็นหนึ่งเดียวเพื่อรองรับทั้ง OpenMP 5.0 และ HIP พูดง่ายๆ ก็คือ การแข่งขันระหว่าง AMD และ NVIDIA ในกลุ่ม HPC นั้นขยายไปไกลกว่าความสามารถทั่วไปและพลังการประมวลผลแบบดิบ