Databricks

DBRX: Open Source LLM คุณภาพสูงจาก Databricks

Headline By เม.ย. 02, 2024 No Comments

Databricks ได้เปิดตัว DBRX ซึ่งเป็น Large Language Model (LLM) แบบ open source รุ่นใหม่ล่าสุดที่มีประสิทธิภาพสูง โดยมีจุดเด่นดังนี้

  • Databricks ได้เปิดตัว DBRX ซึ่งเป็น open-source large language model (LLM) รุ่นใหม่ล่าสุดที่มีประสิทธิภาพสูง โดยทำคะแนนเหนือกว่า open source model อื่นๆ เช่น LLaMA 2 70B, Mixtral และ Grok-1 บน standard benchmark ด้านต่างๆ เช่น ความเข้าใจภาษา, การเขียนโปรแกรม, คณิตศาสตร์ และตรรกะ

DBRX

  • DBRX ยังทำคะแนนสูงกว่า GPT-3.5 ในหลายๆ benchmark ด้วย ซึ่งจะช่วยเร่งแนวโน้มที่ลูกค้าขององค์กรต่างๆ เริ่มเปลี่ยนมาใช้ open source model แทน proprietary model มากขึ้น

DBRX v ChatGPT

  • DBRX ใช้สถาปัตยกรรมแบบ mixture-of-experts (MoE) ทำให้มีความเร็วสูงถึง 2 เท่าในแง่ token ต่อวินาที เมื่อเทียบกับ LLaMA 2 70B และมีต้นทุนในการใช้งานต่ำ โดยใช้พารามิเตอร์เพียง 36,000 ล้านตัวจากทั้งหมด 132,000 ล้านตัว
  • Databricks เปิดให้ใช้ DBRX ได้ฟรีทั้งเพื่อการวิจัยและเชิงพาณิชย์ผ่าน GitHub, Hugging Face และ Databricks Platform รวมถึงบน AWS, GCP และ Azure
  • องค์กรต่างๆ สามารถนำ DBRX ไป fine-tune ต่อด้วยข้อมูลเฉพาะของตัวเองเพื่อสร้าง custom LLM ที่มีคุณภาพสูงได้ ซึ่งจะช่วยให้สร้าง generative AI application ที่ปลอดภัย, ควบคุมได้ และตอบโจทย์ธุรกิจเฉพาะด้านมากขึ้น
  • DBRX พัฒนาโดยทีม Mosaic AI Research ของ Databricks ซึ่งเป็นผู้อยู่เบื้องหลัง MPT model มาก่อน โดยใช้เวลาในการ train ประมาณ 2 เดือน บน NVIDIA H100 GPU จำนวน 3,072 ตัวที่เชื่อมต่อกันด้วย InfiniBand 3.2Tbps และใช้ข้อมูลในการ pre-train 12 ล้านล้าน token
  • ลูกค้าและพาร์ทเนอร์ของ Databricks หลายราย เช่น Accenture, Allen Institute for AI, Block, Nasdaq และ Zoom ได้เริ่มนำ DBRX ไปใช้งานและวางเผนเพื่อใช้ประโยชน์จากความสามารถของมันแล้ว

สำหรับคนที่อยากลงใช้งานสามารถทดลองได้ที่ Hugging Face ได้เลยครับ DBRX Instruct – a Hugging Face Space by databricks

DBRX Instruct a Hugging-Face Space

DBRX Instruct a Hugging-Face Space

การเปิดตัว DBRX ถือเป็นการเริ่มต้นในสมรภูมิของ Databricks ในการแข่งขันด้าน open-source foundation model และ custom AI สำหรับองค์กร ซึ่งกำลังร้อนแรงขึ้นเรื่อยๆ Databricks หวังว่า DBRX จะช่วยเร่งให้เกิดการนำ open-source model ไปใช้แทน proprietary model มากขึ้น และเป็นอีกทางเลือกให้องค์กรต่างๆ สามารถพัฒนา custom AI ที่มีคุณภาพสูงจากข้อมูลของตัวเองได้ง่ายขึ้น

การเปิด model ให้เป็น open source น่าจะช่วยให้ Databricks ดึงดูด data scientist และนักพัฒนาให้มาใช้แพลตฟอร์มของตัวเองได้มากขึ้น ขณะเดียวกัน ความสามารถในการ customize model ด้วยข้อมูลเฉพาะขององค์กร ก็จะช่วยให้ลูกค้าของ Databricks สามารถสร้าง AI ที่ตอบโจทย์และสร้างความได้เปรียบในการแข่งขันเฉพาะด้านได้ดีขึ้น

อย่างไรก็ตาม คงต้องติดตามกันต่อไปว่า DBRX จะได้รับการตอบรับและนำไปใช้งานจริงมากน้อยแค่ไหน และจะสามารถช่วยให้ Databricks สร้างความแตกต่างและรักษาความเป็นผู้นำในตลาดได้หรือไม่ ท่ามกลางการแข่งขันที่รุนแรงขึ้นเรื่อยๆ ทั้งจากคู่แข่งด้าน data platform อย่าง Snowflake และจาก cloud vendor รายใหญ่อย่าง Amazon, Microsoft และ Google ที่ต่างก็กำลังเร่งพัฒนาความสามารถด้าน generative AI เช่นกัน

#DBRX #DatabricksAI #OpenSourceLLM #CustomizableAI #MosaicAIResearch

Author

Data Engineer, Data Strategist, Data Analyst, Data Scientist

No Comments

Leave a comment

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *