Menu
แหล่งข้อมูลการฝึก AI, YouTube Subtitles Dataset, ข้อมูลฝึกอบรม AI, เครื่องมือค้นหาข้อมูล AI, การตอบกลับของบริษัท AI

ข้อมูลฝึก AI จากซับไตเติล YouTube เผยช่องที่ใช้

Headline By ก.ค. 19, 2024 No Comments

สวัสดีครับเพื่อน ๆ ชาว data-espresso ทุกคน! วันนี้ผมมีเรื่องน่าสนใจมาเล่าสู่กันฟังอีกแล้วครับ 😃

เมื่อไม่นานมานี้ ผมได้มีโอกาสไปร่วมงานสัมมนาเกี่ยวกับ AI ที่กรุงเทพฯ แล้วได้ยินเรื่องที่ทำให้ผมต้องขมวดคิ้ว 🤔 มีคนพูดถึงแหล่งข้อมูลลับ ๆ ที่บริษัท AI ยักษ์ใหญ่ใช้ฝึกโมเดล AI ของพวกเขา แต่ไม่มีใครรู้แน่ชัดว่าข้อมูลเหล่านั้นมาจากไหนกันแน่

ผมเลยกลับมานั่งค้นคว้าต่อ และพบว่ามีการเปิดเผยข้อมูลน่าตกใจเกี่ยวกับแหล่งข้อมูลฝึก AI ที่มาจาก YouTube ครับ! 😱

เรื่องมันเป็นอย่างนี้ครับ มีชุดข้อมูลที่เรียกว่า “YouTube Subtitles Dataset” ซึ่งเป็นคำบรรยายจากวิดีโอ YouTube กว่า 173,536 คลิป จากช่องมากกว่า 48,000 ช่อง ถูกนำมาใช้โดยบริษัท AI ชั้นนำอย่าง Anthropic, Nvidia, Apple และ Salesforce เพื่อฝึกโมเดล AI ของพวกเขา

ลองนึกภาพตามผมนะครับ คุณอาจกำลังอัปโหลดวิดีโอสอนทำอาหาร หรือรีวิวเกมโปรดของคุณอยู่ แต่ไม่รู้ตัวเลยว่าคำพูดของคุณกำลังถูกใช้เป็นอาหารสมองให้ AI 🤖 น่าตกใจใช่มั้ยล่ะครับ?

แต่เรื่องไม่ได้จบแค่นั้น ทีมข่าว Proof News ได้สร้างเครื่องมือค้นหาที่ช่วยให้ผู้ใช้สามารถตรวจสอบได้ว่าวิดีโอของพวกเขาถูกใช้ในการฝึก AI หรือไม่ ผมลองเข้าไปค้นหาดูแล้วครับ รู้สึกเหมือนกำลังเล่นเกมสืบสวนเลยทีเดียว! 🕵️‍♂️

ทีนี้ เมื่อถูกจับได้ไล่ทัน ปฏิกิริยาของบริษัท AI เหล่านี้เป็นยังไงบ้างล่ะครับ?

Anthropic และ Salesforce ยอมรับว่าใช้ข้อมูลชุดนี้จริง ๆ ครับ แต่ Nvidia กลับเลือกที่จะไม่แสดงความคิดเห็น ส่วน Apple, Databricks และ Bloomberg ก็เงียบกริบ ไม่ตอบคำถามเลย 🤐

ผมว่าเรื่องนี้ชวนให้คิดมาก ๆ เลยนะครับ ในยุคที่ AI กำลังเติบโตอย่างรวดเร็ว เราควรจะตระหนักถึงคุณค่าของข้อมูลส่วนตัวมากขึ้น และอาจจะต้องคิดให้รอบคอบก่อนที่จะแชร์อะไรลงไปบนโลกออนไลน์

แต่ในขณะเดียวกัน ผมก็มองว่านี่อาจเป็นโอกาสดีที่เราจะได้มีส่วนร่วมในการพัฒนา AI ให้ฉลาดขึ้น เพียงแต่ว่าควรจะทำอย่างโปร่งใสและได้รับความยินยอมจากเจ้าของข้อมูลก่อน

สุดท้ายนี้ ผมอยากฝากข้อคิดไว้ว่า ในโลกยุคดิจิทัล ทุกคำพูด ทุกการกระทำของเราบนโลกออนไลน์ อาจกลายเป็นข้อมูลที่มีค่ามหาศาลสำหรับใครบางคน เราจึงควรใช้อินเทอร์เน็ตอย่างมีสติ และรู้เท่าทันเทคโนโลยีครับ 🧠💡

แล้วคุณล่ะครับ คิดยังไงกับเรื่องนี้? อยากให้มาแชร์กันในคอมเมนต์ด้านล่างนะครับ ผมอยากฟังความเห็นของทุกคนมาก ๆ เลย!

#AITrainingData #YouTubeSubtitles #PrivacyInAIEra #DataEthics #AIandYouTube

อย่าลืมติดตาม data-espresso.com เพื่ออัพเดทเรื่องราวน่าสนใจเกี่ยวกับ AI และเทคโนโลยีล่าสุดนะครับ! 👨‍💻📱

Keywords:
แหล่งข้อมูลการฝึก AI, YouTube Subtitles Dataset, ข้อมูลฝึกอบรม AI, เครื่องมือค้นหาข้อมูล AI, การตอบกลับของบริษัท AI
.
Reference:
https://www.proofnews.org/youtube-ai-search/

Author

AI Specialist, Data Engineer, Data Strategist, Data Scientist

No Comments

Leave a comment

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *

หนังสือใหม่มาแล้ว!  "คู่มือการทำงานงานยุค AI: 50 Prompts พิชิตความสำเร็จด้วย ChatGPT" 

X