ปัญญาประดิษฐ์ (AI) กำลังเข้ามามีบทบาทสำคัญในการพัฒนา AI ให้มีความสามารถมากยิ่งขึ้น OpenAI ได้เปิดตัว CriticGPT ผู้ช่วย AI ที่สร้างขึ้นบนพื้นฐานของ GPT-4 เพื่อช่วยในการปรับปรุงโมเดล GPT-4 อย่างต่อเนื่อง
CriticGPT คืออะไรและทำงานอย่างไร
CriticGPT คือผู้ช่วย AI ที่ได้รับการฝึกฝนมาเพื่อตรวจจับข้อผิดพลาดในการเขียนโค้ดที่อาจเกิดขึ้นจาก ChatGPT โดยเฉพาะอย่างยิ่งในด้านการสร้างโค้ดที่ซับซ้อน ซึ่งมนุษย์อาจพลาดได้ง่าย
การเรียนรู้แบบเสริมกำลังจากข้อเสนอแนะของมนุษย์ (RLHF)
หลังจากที่โมเดลภาษาขนาดใหญ่ (LLM) อย่าง GPT-4 ได้รับการฝึกฝนเบื้องต้นแล้ว จะเข้าสู่กระบวนการปรับปรุงอย่างต่อเนื่องที่เรียกว่า RLHF โดยมนุษย์จะทำหน้าที่เป็นผู้ฝึกสอน ทำการโต้ตอบกับระบบ และให้คะแนนความถูกต้องของคำตอบต่างๆ เพื่อให้ระบบเรียนรู้และปรับปรุงความแม่นยำในการตอบสนอง
ความท้าทายในการปรับปรุงโมเดล AI
อย่างไรก็ตาม เมื่อประสิทธิภาพของระบบ AI พัฒนาขึ้น ความสามารถของผู้ฝึกสอนอาจไม่เพียงพอที่จะระบุข้อผิดพลาดที่ซับซ้อนได้ นอกจากนี้ ผู้ฝึกสอน AI ไม่จำเป็นต้องเป็นผู้เชี่ยวชาญในทุกด้านเสมอไป ทำให้การปรับปรุงโมเดลเป็นไปได้ยาก
riticGPT ช่วยเพิ่มประสิทธิภาพการทำงานของมนุษย์
OpenAI ได้เปิดเผยว่า การทำงานร่วมกันระหว่างมนุษย์และ CriticGPT ช่วยเพิ่มประสิทธิภาพในการตรวจสอบโค้ดของ ChatGPT ได้ถึง 60% เมื่อเทียบกับการทำงานของมนุษย์เพียงอย่างเดียว นอกจากนี้ การใช้ LLM Critics ยังช่วยลดอัตราการตอบสนองที่ไม่ถูกต้องของ AI ได้อีกด้วย