Google นำเสนอชุดข้อมูลเมตาดาต้าฟรีพร้อมด้วยอัลกอริธึม AI Deep Learning และแมชชีนเลิร์นนิงเพียงไม่กี่ช็อตเพื่อการจำแนกภาพที่รวดเร็วและมีประสิทธิภาพใน TensorFlow และ PyTorch

Google ได้ประกาศความพร้อมใช้งานของชุดข้อมูลหลายชุดซึ่งประกอบด้วยภาพธรรมชาติที่หลากหลาย แต่มีข้อ จำกัด ยักษ์ใหญ่ด้านการค้นหามั่นใจว่าข้อมูลที่เปิดเผยต่อสาธารณะจะผลักดันให้เกิดการเรียนรู้ของเครื่องและปัญญาประดิษฐ์ในขณะที่ลดเวลาในการฝึกโมเดล AI ด้วยข้อมูลเพียงเล็กน้อย Google เรียกความคิดริเริ่มใหม่ว่า 'ชุดข้อมูลเมตาฟรี' ที่จะช่วยให้โมเดล AI 'เรียนรู้' โดยใช้ข้อมูลน้อยลง 'Few-Shot AI' จาก บริษัท ได้รับการปรับให้เหมาะสมเพื่อให้แน่ใจว่า AI จะเรียนรู้คลาสใหม่ ๆ จากภาพตัวแทนเพียงไม่กี่ภาพ

เมื่อเข้าใจถึงความจำเป็นในการฝึกโมเดล AI และ Machine Learning อย่างรวดเร็วด้วยชุดข้อมูลที่น้อยลง Google ได้เปิดตัว "Meta-Dataset" ซึ่งเป็นคอลเล็กชันรูปภาพขนาดเล็กที่จะช่วยลดปริมาณข้อมูลที่จำเป็นในการปรับปรุงความแม่นยำของอัลกอริทึม บริษัท อ้างว่าการใช้เทคนิคการจำแนกภาพไม่กี่ช็อตโมเดล AI และ ML จะได้รับข้อมูลเชิงลึกเดียวกันจากภาพตัวแทนจำนวนน้อยกว่ามาก

Google AI ประกาศ Meta-Dataset: ชุดข้อมูลสำหรับการเรียนรู้ไม่กี่ช็อต:

Deep Learning สำหรับ AI และ Machine Learning มีการเติบโตอย่างทวีคูณมาระยะหนึ่งแล้ว อย่างไรก็ตาม ข้อกำหนดหลักคือความพร้อมใช้งานของข้อมูลคุณภาพสูงและในปริมาณมากเช่นกัน ข้อมูลการฝึกอบรมที่ใส่คำอธิบายประกอบด้วยตนเองจำนวนมากมักจะจัดหาได้ยากและบางครั้งอาจไม่น่าเชื่อถือเช่นกัน เมื่อเข้าใจถึงความเสี่ยงของชุดข้อมูลขนาดใหญ่ Google ได้ประกาศความพร้อมใช้งานของคอลเล็กชันชุดข้อมูลเมตา

ด้วย "Meta-Dataset: ชุดข้อมูลสำหรับการเรียนรู้เพื่อเรียนรู้จากตัวอย่างน้อย" (นำเสนอในงาน ICLR 2020) Google ได้เสนอเกณฑ์มาตรฐานขนาดใหญ่และหลากหลายสำหรับการวัดความสามารถของรูปแบบการจัดหมวดหมู่รูปภาพที่แตกต่างกันอย่างสมจริงและท้าทาย - การตั้งค่าภาพที่นำเสนอกรอบที่สามารถตรวจสอบประเด็นสำคัญหลายประการของการจำแนกประเภทไม่กี่ช็อต โดยพื้นฐานแล้ว Google ขอเสนอชุดข้อมูลภาพที่เป็นธรรมชาติ 10 ชุดที่เผยแพร่ต่อสาธารณะและใช้งานได้ฟรี ชุดข้อมูลเหล่านี้ประกอบด้วย ImageNet, CUB-200-2011, Fungi, อักขระที่เขียนด้วยลายมือและดูเดิล รหัสนี้เป็นแบบสาธารณะและรวมถึงสมุดบันทึกที่สาธิตวิธีใช้ Meta-Dataset ใน TensorFlow และ PyTorch

การจำแนกประเภทไม่กี่ช็อตไปไกลกว่าการฝึกอบรมมาตรฐานและโมเดลการเรียนรู้เชิงลึก ต้องใช้ลักษณะทั่วไปในชั้นเรียนใหม่ทั้งหมดในเวลาทดสอบ กล่าวอีกนัยหนึ่งคือไม่เห็นภาพที่ใช้ในระหว่างการทดสอบในการฝึกอบรม ในการจำแนกประเภทสองสามช็อต ชุดการฝึกประกอบด้วยคลาสที่แยกจากกันอย่างสิ้นเชิงจากคลาสที่จะปรากฏในเวลาทดสอบ แต่ละงานทดสอบประกอบด้วยไฟล์ ชุดสนับสนุนภาพที่มีป้ายกำกับสองสามภาพซึ่งโมเดลสามารถเรียนรู้เกี่ยวกับคลาสใหม่และการไม่ปะติดปะต่อกัน ชุดแบบสอบถามของตัวอย่างที่โมเดลจะถูกขอให้จัดประเภท

Meta-Dataset เป็นส่วนประกอบขนาดใหญ่ที่ แบบจำลองศึกษาลักษณะทั่วไปของชุดข้อมูลใหม่ทั้งหมดซึ่งไม่เห็นภาพของชั้นเรียนใด ๆ ในการฝึกอบรม นี่เป็นนอกเหนือจากความท้าทายในการวางนัยทั่วไปที่ยากลำบากสำหรับชั้นเรียนใหม่ที่มีอยู่ในการตั้งค่าการเรียนรู้เพียงไม่กี่ภาพ

Meta-Dataset ช่วยการเรียนรู้เชิงลึกสำหรับโมเดล AI และ Machine Learning ได้อย่างไร

Meta-Dataset แสดงถึงเกณฑ์มาตรฐานการจัดระเบียบขนาดใหญ่ที่สุดสำหรับชุดข้อมูลข้าม การจัดประเภทรูปภาพไม่กี่ช็อตจนถึงปัจจุบัน นอกจากนี้ยังแนะนำอัลกอริธึมการสุ่มตัวอย่างสำหรับการสร้างงานที่มีลักษณะและความยากที่แตกต่างกันโดยการเปลี่ยนแปลงจำนวนคลาสในแต่ละงานจำนวนตัวอย่างที่มีอยู่ต่อคลาสการแนะนำความไม่สมดุลของคลาสและสำหรับชุดข้อมูลบางชุดระดับความคล้ายคลึงกัน ชั้นเรียนของแต่ละงาน

Meta-Dataset นำเสนอความท้าทายใหม่สำหรับการจำแนกประเภทไม่กี่ช็อต การวิจัยของ Google ยังคงเป็นข้อมูลเบื้องต้นและมีพื้นฐานมากมายที่จะครอบคลุม อย่างไรก็ตามยักษ์ใหญ่ด้านการค้นหาอ้างว่านักวิจัยประสบความสำเร็จ ตัวอย่างที่โดดเด่นบางส่วน ได้แก่ การใช้การปรับสภาพงานที่ออกแบบมาอย่างชาญฉลาดการปรับแต่งไฮเปอร์พารามิเตอร์ที่ซับซ้อนยิ่งขึ้น 'meta-baseline' ที่รวมประโยชน์ของการฝึกอบรมล่วงหน้าและการเรียนรู้แบบเมตาและในที่สุดก็ใช้การเลือกคุณสมบัติเพื่อให้เป็นตัวแทนที่เป็นสากลสำหรับแต่ละงาน .

Facebook Twitter Google Plus Pinterest