Radeon Open Compute“ ROCm” Stack v3.1 เปิดตัวพร้อม RAS สำหรับ Vega 7nm รองรับ SLURM เพื่อการจัดการทรัพยากรที่ดีขึ้น แต่ Navi ยังขาดหายไป
Radeon Open Compute หรือ“ ROCm” stack เวอร์ชันใหม่พร้อมให้ดาวน์โหลดแล้ว Radeon Open Compute v3.1 มาพร้อมกับคุณสมบัติบางอย่าง แต่น่าแปลกที่การสนับสนุน AMD Navi และ GFX10 ยังขาดหายไป
ROCm ซึ่งเป็นแพลตฟอร์มสากลที่ได้รับการยอมรับมากที่สุดสำหรับการประมวลผลแบบเร่งด้วย GPU อยู่ในเวอร์ชัน 3.1 แล้ว การอัปเดตล่าสุดสำหรับแพลตฟอร์มโมดูลาร์ซึ่งช่วยให้ผู้จำหน่ายฮาร์ดแวร์สามารถสร้างไดรเวอร์ที่รองรับเฟรมเวิร์ก ROCm รวมถึงคุณสมบัติที่คาดหวังไว้มากมายเช่นการรองรับ RAS สำหรับ 7nm Vega และ SLURM ที่รองรับ AMD GPU อย่างไรก็ตามด้วยเหตุผลที่ยังไม่ทราบสาเหตุ ROCm ยังไม่ได้รับการสนับสนุนอย่างสมบูรณ์สำหรับ AMD Navi Architecture รุ่นต่อไป
มีอะไรใหม่ใน Radeon ROCm v3.1:
การเปลี่ยนแปลงที่ใหญ่ที่สุดและชัดเจนที่สุดในการติดตั้ง Radeon ROCm v3.1 ใหม่อยู่ในโครงสร้างไดเรกทอรีการติดตั้ง ROCm การติดตั้งชุดเครื่องมือ ROCm ใหม่จะติดตั้งแพ็คเกจในไฟล์/ opt / rocm-
ROCm เวอร์ชันใหม่ได้ปรับปรุงการรองรับความน่าเชื่อถือการช่วยการเข้าถึงและความสามารถในการให้บริการ (RAS) สำหรับ Vega 7nm GPUs งาน Vega ขนาด 7 นาโนเมตรนี้น่าจะอยู่ภายใต้กล้องจุลทรรศน์สำหรับ “ Arcturus” ที่ใช้ Vega ตัวเร่งความเร็วในการคำนวณจะมาในปีนี้ การสนับสนุนประกอบด้วย:
- UMC RAS - HBM ECC (การแทรกข้อผิดพลาดที่ไม่สามารถแก้ไขได้), การลบเพจ, การกู้คืน RAS ผ่าน GPU (BACO) รีเซ็ต
- GFX RAS - GFX, MMHUB ECC (การแทรกข้อผิดพลาดที่ไม่สามารถแก้ไขได้), การกู้คืน RAS ผ่าน GPU (BACO) รีเซ็ต
- PCIE RAS - PCIE_BIF ECC (การแทรกข้อผิดพลาดที่ไม่สามารถแก้ไขได้), การกู้คืน RAS ผ่านการรีเซ็ต GPU (BACO)
Radeon ROCm v3.1 ยังได้รับ SLURM Support สำหรับ AMD GPUs SLURM หรือ Simple Linux Utility สำหรับการจัดการทรัพยากรเป็นหนึ่งในระบบการจัดการคลัสเตอร์และการจัดตารางงานที่ต้องการและใช้งานง่ายสำหรับคลัสเตอร์ Linux SLURM เป็นที่ต้องการเนื่องจากเป็นโอเพ่นซอร์สทนต่อข้อผิดพลาดและปรับขนาดได้สูง
ระบบนี้สามารถโต้ตอบกับ AMD GPU ได้เป็นอย่างดี SLURM เวอร์ชันล่าสุด 20.02.0 ประกอบด้วยปลั๊กอินของ AMD ที่ช่วยให้ SLURM ตรวจจับและกำหนดค่า GPU ของ AMD โดยอัตโนมัติ นอกจากนี้ยังรวบรวมและรายงานการใช้พลังงานของชิปกราฟิก การสนับสนุน SLURM เป็นส่วนเสริมที่มีประโยชน์เนื่องจากจำนวนการปรับใช้ super-computing ที่เพิ่มขึ้นโดยใช้ Radeon GPUs และคลัสเตอร์ GPU AMD ขนาดใหญ่อื่น ๆ
แม้จะมีการรวมคุณสมบัติหลายอย่างไว้ด้วยกัน แต่ก็ยังไม่มีสัญญาณของการรองรับ GFX10 / Navi ใน ROCm หน้า GitHub สำหรับ ROCm ได้รับการอัปเดตเพื่อแสดงการเปลี่ยนแปลงบันทึกการติดตั้งและปัญหาที่ทราบทั้งหมด