สวัสดีครับ วันนี้ผมจะพาทุกคนมารู้จักกับ LLM ภาษาไทยที่น่าจับตามองที่สุดในปี 2024 กันครับ 🤖
ถ้าใครติดตามวงการ AI คงจะรู้ดีว่าช่วงนี้ LLM (Large Language Model) กำลังมาแรงมากๆ แต่ส่วนใหญ่จะเป็นโมเดลภาษาอังกฤษ วันนี้เรามาดูกันว่าฝั่งภาษาไทยเรามีอะไรน่าสนใจบ้าง 😊
OpenThaiGPT: ยักษ์ใหญ่แห่งวงการ LLM ไทย
เริ่มต้นด้วย OpenThaiGPT ที่เพิ่งเปิดตัวไปเมื่อวันที่ 8 เมษายน 2024 ครับ โมเดลตัวนี้มีหลายขนาดให้เลือกใช้:
- รุ่น 7B (7 พันล้านพารามิเตอร์)
- รุ่น 13B (13 พันล้านพารามิเตอร์)
- รุ่น 70B (70 พันล้านพารามิเตอร์)
💡 ในความเห็นของผม รุ่น 70B น่าสนใจมากๆ เพราะมีความสามารถใกล้เคียงกับ Claude Sonnet และอยู่ระหว่าง GPT-3.5 กับ GPT-4 เลยทีเดียวครับ
#funfact: OpenThaiGPT ใช้ซูเปอร์คอมพิวเตอร์ LanTa ในการเทรนโมเดล ซึ่งติดอันดับที่ 94 ของ Top500 ทั่วโลกครับ 🔥
Typhoon: น้องใหม่มาแรง
อีกหนึ่งตัวที่น่าจับตามองคือ Typhoon ครับ แม้จะมีแค่ 7 พันล้านพารามิเตอร์ แต่ประสิทธิภาพสูสีกับ GPT-3.5 เลยทีเดียว
จุดเด่นของ Typhoon คือ:
- ประมวลผลภาษาไทยได้เร็วกว่าโมเดลอื่น 2.62 เท่า
- ประสิทธิภาพสูงแม้จะมีขนาดเล็กกว่า
การเปรียบเทียบประสิทธิภาพ
ทั้งสองโมเดลถูกทดสอบด้วย ThaiExam Benchmark ซึ่งเป็นชุดข้อสอบมาตรฐานของไทย นี่เป็นวิธีที่ดีในการเปรียบเทียบความสามารถครับ
สรุป
💡 ในมุมมองของผม ปี 2024 นี้น่าตื่นเต้นมากสำหรับวงการ AI ไทย:
- OpenThaiGPT เหมาะกับองค์กรที่ต้องการความหลากหลายในการใช้งาน
- Typhoon เหมาะกับผู้ที่ต้องการประสิทธิภาพสูงแต่ทรัพยากรจำกัด
สุดท้ายนี้ ผมเชื่อว่าการมี LLM ภาษาไทยที่แข็งแกร่งจะช่วยพัฒนาอุตสาหกรรม AI ของไทยได้อีกมาก ติดตามกันต่อไปนะครับ! 😊
#datascience #generativeai #genai #dataespresso
.