สวัสดีครับเพื่อน ๆ ชาว data-espresso ทุกคน! วันนี้ผมมีเรื่องน่าสนใจมาเล่าสู่กันฟังอีกแล้วครับ 😃
เมื่อไม่นานมานี้ ผมได้มีโอกาสไปร่วมงานสัมมนาเกี่ยวกับ AI ที่กรุงเทพฯ แล้วได้ยินเรื่องที่ทำให้ผมต้องขมวดคิ้ว 🤔 มีคนพูดถึงแหล่งข้อมูลลับ ๆ ที่บริษัท AI ยักษ์ใหญ่ใช้ฝึกโมเดล AI ของพวกเขา แต่ไม่มีใครรู้แน่ชัดว่าข้อมูลเหล่านั้นมาจากไหนกันแน่
ผมเลยกลับมานั่งค้นคว้าต่อ และพบว่ามีการเปิดเผยข้อมูลน่าตกใจเกี่ยวกับแหล่งข้อมูลฝึก AI ที่มาจาก YouTube ครับ! 😱
เรื่องมันเป็นอย่างนี้ครับ มีชุดข้อมูลที่เรียกว่า “YouTube Subtitles Dataset” ซึ่งเป็นคำบรรยายจากวิดีโอ YouTube กว่า 173,536 คลิป จากช่องมากกว่า 48,000 ช่อง ถูกนำมาใช้โดยบริษัท AI ชั้นนำอย่าง Anthropic, Nvidia, Apple และ Salesforce เพื่อฝึกโมเดล AI ของพวกเขา
ลองนึกภาพตามผมนะครับ คุณอาจกำลังอัปโหลดวิดีโอสอนทำอาหาร หรือรีวิวเกมโปรดของคุณอยู่ แต่ไม่รู้ตัวเลยว่าคำพูดของคุณกำลังถูกใช้เป็นอาหารสมองให้ AI 🤖 น่าตกใจใช่มั้ยล่ะครับ?
แต่เรื่องไม่ได้จบแค่นั้น ทีมข่าว Proof News ได้สร้างเครื่องมือค้นหาที่ช่วยให้ผู้ใช้สามารถตรวจสอบได้ว่าวิดีโอของพวกเขาถูกใช้ในการฝึก AI หรือไม่ ผมลองเข้าไปค้นหาดูแล้วครับ รู้สึกเหมือนกำลังเล่นเกมสืบสวนเลยทีเดียว! 🕵️♂️
ทีนี้ เมื่อถูกจับได้ไล่ทัน ปฏิกิริยาของบริษัท AI เหล่านี้เป็นยังไงบ้างล่ะครับ?
Anthropic และ Salesforce ยอมรับว่าใช้ข้อมูลชุดนี้จริง ๆ ครับ แต่ Nvidia กลับเลือกที่จะไม่แสดงความคิดเห็น ส่วน Apple, Databricks และ Bloomberg ก็เงียบกริบ ไม่ตอบคำถามเลย 🤐
ผมว่าเรื่องนี้ชวนให้คิดมาก ๆ เลยนะครับ ในยุคที่ AI กำลังเติบโตอย่างรวดเร็ว เราควรจะตระหนักถึงคุณค่าของข้อมูลส่วนตัวมากขึ้น และอาจจะต้องคิดให้รอบคอบก่อนที่จะแชร์อะไรลงไปบนโลกออนไลน์
แต่ในขณะเดียวกัน ผมก็มองว่านี่อาจเป็นโอกาสดีที่เราจะได้มีส่วนร่วมในการพัฒนา AI ให้ฉลาดขึ้น เพียงแต่ว่าควรจะทำอย่างโปร่งใสและได้รับความยินยอมจากเจ้าของข้อมูลก่อน
สุดท้ายนี้ ผมอยากฝากข้อคิดไว้ว่า ในโลกยุคดิจิทัล ทุกคำพูด ทุกการกระทำของเราบนโลกออนไลน์ อาจกลายเป็นข้อมูลที่มีค่ามหาศาลสำหรับใครบางคน เราจึงควรใช้อินเทอร์เน็ตอย่างมีสติ และรู้เท่าทันเทคโนโลยีครับ 🧠💡
แล้วคุณล่ะครับ คิดยังไงกับเรื่องนี้? อยากให้มาแชร์กันในคอมเมนต์ด้านล่างนะครับ ผมอยากฟังความเห็นของทุกคนมาก ๆ เลย!
#AITrainingData #YouTubeSubtitles #PrivacyInAIEra #DataEthics #AIandYouTube
อย่าลืมติดตาม data-espresso.com เพื่ออัพเดทเรื่องราวน่าสนใจเกี่ยวกับ AI และเทคโนโลยีล่าสุดนะครับ! 👨💻📱
Keywords:แหล่งข้อมูลการฝึก AI, YouTube Subtitles Dataset, ข้อมูลฝึกอบรม AI, เครื่องมือค้นหาข้อมูล AI, การตอบกลับของบริษัท AI
.
Reference:
https://www.proofnews.org/youtube-ai-search/