Google DeepMind แก้ปัญหาขาดแคลนข้อมูล แต่ Camp กำลังแก้ปัญหาที่แท้จริงของวงการ AI
หนึ่งในปัญหาที่ใหญ่ที่สุดของวงการปัญญาประดิษฐ์ (AI) ตอนนี้คือภาวะขาดแคลนข้อมูลคุณภาพสูงสำหรับใช้ฝึกโมเดล AI หรือที่เรียกว่า Data Drought ซึ่งหลายการคาดการณ์ระบุว่าข้อมูลที่มนุษย์สร้างขึ้น (Human-generated data) อาจถูกใช้จนหมดภายในช่วงปี 2026–2032 หากไม่มีการสร้างแหล่งข้อมูลใหม่ที่มีสิทธิ์และความถูกต้องทางกฎหมาย
Google DeepMind เสนอแนวทางใหม่ เขียนข้อมูลซ้ำ (Data Rewriting)
ทีมวิจัยของ Google DeepMind ได้เสนอแนวทางแก้ปัญหานี้ด้วยการเขียนข้อมูลใหม่ เพื่อเปลี่ยนข้อมูลที่ไม่ปลอดภัยหรือมีปัญหาทางกฎหมาย ให้กลายเป็นข้อมูลที่สามารถนำไปใช้ฝึกโมเดลได้โดยไม่เสี่ยงต่อการละเมิดลิขสิทธิ์
แนวทางนี้ดูเหมือนจะช่วยให้ AI สามารถเข้าถึงข้อมูลที่ปลอดภัยกว่าได้ แต่ในความเป็นจริงแล้ว มันอาจไม่สามารถแก้ปัญหาที่ต้นเหตุได้
คำถามเรื่องสิทธิ์ยังคงไม่มีคำตอบ
แม้ข้อมูลจะถูกเขียนใหม่ให้ปลอดภัยต่อการใช้งาน แต่คำถามสำคัญยังคงอยู่เหมือนเดิม
- ใครเป็นเจ้าของข้อมูลต้นฉบับ
- ผู้สร้างข้อมูลได้รับค่าตอบแทนหรือไม่
- สิทธิ์การใช้งานถูกกำหนดและบังคับใช้อย่างไร
การทำให้ข้อมูลดูปลอดภัยไม่ได้หมายความว่าข้อมูลนั้นถูกต้องตามสิทธิ์ทางกฎหมาย
ข้อมูลสะอาด ไม่ได้หมายถึง ข้อมูลถูกต้อง
การเขียนข้อมูลใหม่อาจทำให้เนื้อหาดูไม่ละเมิด แต่หากไม่สามารถพิสูจน์ได้ว่าข้อมูลนั้นมาจากแหล่งที่มีสิทธิ์จริง ก็ยังคงเสี่ยงต่อการถูกฟ้องร้องหรือข้อพิพาททางลิขสิทธิ์ในอนาคต
ดังนั้นปัญหาคอขวดที่แท้จริงของ AI ไม่ได้อยู่ที่ปริมาณข้อมูล แต่คือการขาดข้อมูลที่มีสิทธิ์ชัดเจน โปร่งใส และสามารถตรวจสอบได้
แนวทางใหม่ สร้างห่วงโซ่ข้อมูลที่ตรวจสอบได้
สิ่งที่โลก AI ต้องการไม่ใช่เพียงการทำให้ข้อมูลดูสะอาดภายนอก แต่คือการสร้างห่วงโซ่ข้อมูลที่ตรวจสอบได้ (Auditable Data Supply Chain) เพื่อให้มั่นใจได้ว่าข้อมูลทุกชิ้นมีสิทธิ์การใช้งานที่ชัดเจนตั้งแต่ต้นทาง
Camp โครงสร้างพื้นฐานข้อมูล AI ที่โปร่งใสตั้งแต่แหล่งกำเนิด
Camp เข้ามาแก้ปัญหานี้ด้วยการสร้างระบบข้อมูลที่มีสิทธิ์และที่มาอย่างชัดเจนตั้งแต่ต้นทาง โดยมีสามหลักการสำคัญ
1. การจดทะเบียนลิขสิทธิ์และเงื่อนไขการใช้งานบนบล็อกเชน (On-chain IP registration) ข้อมูลทุกชุดถูกผูกกับสิทธิ์การใช้งานตั้งแต่เริ่มต้น ทำให้ตรวจสอบได้ว่าใครเป็นเจ้าของและใช้งานอย่างไร
2. ระบบ Provenance หรือการระบุที่มาของข้อมูล ข้อมูลทุกชิ้นมีร่องรอยการสร้างและการใช้งานที่สามารถติดตามได้ แม้ผ่านการ remix หรือ fine-tune
3. กลไกการจัดการค่าลิขสิทธิ์อัตโนมัติ (Automatic Royalty Routing) ทุกครั้งที่ข้อมูลถูกนำไปฝึก AI ผู้สร้างเนื้อหาจะได้รับค่าตอบแทนโดยอัตโนมัติ
ความถูกต้องไม่ใช่เพียงภาพลักษณ์
Camp เชื่อว่าการจัดการข้อมูลที่ถูกต้อง ไม่ได้หมายถึงเพียงการปรับแต่งเนื้อหาให้ดูปลอดภัยเท่านั้น แต่คือการทำให้ข้อมูลทุกชิ้นมีสิทธิ์ทางกฎหมายที่ชัดเจน โปร่งใส และสามารถตรวจสอบได้ เพื่อให้ผู้สร้างเนื้อหาได้รับการยอมรับและผลตอบแทนที่เป็นธรรม
ยุคใหม่ของ AI
โลกของ AI กำลังเปลี่ยนจากคำถามว่าคุณสร้างมันได้ไหม ไปสู่คำถามที่สำคัญกว่าว่าคุณมีสิทธิ์สร้างมันหรือไม่ อนาคตของข้อมูลสำหรับ AI จะไม่ได้วัดกันที่ความสามารถในการผลิตเนื้อหา แต่จะวัดกันที่ความสามารถในการพิสูจน์สิทธิ์ของข้อมูลแต่ละชิ้น
Camp คือคำตอบของยุคใหม่ ที่ AI และสิทธิ์ในข้อมูลจะเติบโตไปด้วยกันอย่างโปร่งใส ยุติธรรม และยั่งยืน