โมดูลการใช้งานหลายภาษาใหม่สามโมดูลกำลังจะมาถึง TensorFlow

Google เป็นหนึ่งในผู้บุกเบิกการวิจัย AI และมีโครงการมากมายที่จะเปลี่ยนโฉมหน้า AlphaZero จาก Google DeepMind ทีมเป็นความก้าวหน้าในการวิจัย AI เนื่องจากความสามารถของโปรแกรมในการเรียนรู้เกมที่ซับซ้อนด้วยตัวเอง (โดยไม่ต้องมีการฝึกอบรมและการแทรกแซงจากมนุษย์) Google ยังทำงานได้อย่างยอดเยี่ยมใน โปรแกรมประมวลผลภาษาธรรมชาติ (NLP) ซึ่งเป็นสาเหตุหนึ่งที่อยู่เบื้องหลังประสิทธิภาพของ Google Assistant ในการทำความเข้าใจและประมวลผลคำพูดของมนุษย์

Google เพิ่งประกาศเปิดตัวใหม่สามตัว ใช้โมดูลหลายภาษา และจัดเตรียมแบบจำลองหลายภาษาเพิ่มเติมสำหรับการดึงข้อความที่มีความหมายเหมือนกัน

การประมวลผลภาษาในระบบมีมาอย่างยาวนานตั้งแต่การแยกโครงสร้างไวยากรณ์พื้นฐานไปจนถึงโมเดลการเชื่อมโยงเวกเตอร์ขนาดใหญ่ การทำความเข้าใจบริบทในข้อความเป็นปัญหาใหญ่อย่างหนึ่งในฟิลด์ NLP และ Universal Sentence Encoder แก้ปัญหานี้ได้โดยการแปลงข้อความในเวกเตอร์ที่มีมิติสูงซึ่งจะทำให้การจัดอันดับและการแสดงข้อความง่ายขึ้น

ตามที่ Google กล่าวว่า“โมดูลใหม่ทั้งสามโมดูลนี้สร้างขึ้นจากสถาปัตยกรรมการค้นคืนความหมายซึ่งโดยทั่วไปจะแบ่งการเข้ารหัสคำถามและคำตอบออกเป็นเครือข่ายประสาทที่แยกจากกันซึ่งทำให้สามารถค้นหาคำตอบที่เป็นไปได้หลายพันล้านคำตอบภายในมิลลิวินาที” กล่าวอีกนัยหนึ่งสิ่งนี้ช่วยในการจัดทำดัชนีข้อมูลได้ดีขึ้น

โมดูลหลายภาษาทั้งสามได้รับการฝึกฝนโดยใช้ไฟล์ เฟรมเวิร์กเอนโค้ดเดอร์คู่แบบหลายงานซึ่งคล้ายกับรูปแบบ USE ดั้งเดิมสำหรับภาษาอังกฤษในขณะที่ใช้เทคนิคที่เราพัฒนาขึ้นเพื่อปรับปรุงตัวเข้ารหัสคู่ด้วยวิธี softmax ระยะเพิ่ม พวกเขาได้รับการออกแบบมาเพื่อรักษาประสิทธิภาพการเรียนรู้การถ่ายโอนที่ดีเท่านั้น แต่ยังทำงานในการดึงความหมายได้ดี.” ฟังก์ชัน Softmax มักใช้เพื่อประหยัดพลังงานในการคำนวณโดยการยกกำลังเวกเตอร์แล้วหารทุกองค์ประกอบด้วยผลรวมของเลขชี้กำลัง

สถาปัตยกรรมการดึงความหมาย

“ โมดูลใหม่ทั้งสามโมดูลสร้างขึ้นจากสถาปัตยกรรมการดึงข้อมูลเชิงความหมายซึ่งโดยทั่วไปจะแบ่งการเข้ารหัสคำถามและคำตอบออกเป็นเครือข่ายประสาทที่แยกจากกันซึ่งทำให้สามารถค้นหาคำตอบที่เป็นไปได้นับพันล้านคำภายในมิลลิวินาที กุญแจสำคัญในการใช้ตัวเข้ารหัสคู่เพื่อการดึงข้อมูลเชิงความหมายที่มีประสิทธิภาพคือการเข้ารหัสคำตอบของผู้สมัครทั้งหมดไว้ล่วงหน้าสำหรับการสืบค้นข้อมูลที่คาดหวังและจัดเก็บไว้ในฐานข้อมูลเวกเตอร์ที่ได้รับการปรับให้เหมาะสมสำหรับการแก้ปัญหาเพื่อนบ้านที่ใกล้ที่สุดซึ่งช่วยให้สามารถค้นหาผู้สมัครจำนวนมากได้อย่างรวดเร็ว ด้วยความแม่นยำและการจำที่ดี”

คุณสามารถดาวน์โหลดโมดูลเหล่านี้ได้จาก TensorFlow Hub หากต้องการอ่านเพิ่มเติมโปรดดูบล็อกโพสต์ฉบับเต็มของ GoogleAI

Facebook Twitter Google Plus Pinterest