DBRX: Open Source LLM คุณภาพสูงจาก Databricks

HeadlineDBRX: Open Source LLM คุณภาพสูงจาก Databricks

Databricks ได้เปิดตัว DBRX ซึ่งเป็น Large Language Model (LLM) แบบ open source รุ่นใหม่ล่าสุดที่มีประสิทธิภาพสูง โดยมีจุดเด่นดังนี้

  • Databricks ได้เปิดตัว DBRX ซึ่งเป็น open-source large language model (LLM) รุ่นใหม่ล่าสุดที่มีประสิทธิภาพสูง โดยทำคะแนนเหนือกว่า open source model อื่นๆ เช่น LLaMA 2 70B, Mixtral และ Grok-1 บน standard benchmark ด้านต่างๆ เช่น ความเข้าใจภาษา, การเขียนโปรแกรม, คณิตศาสตร์ และตรรกะ

DBRX

  • DBRX ยังทำคะแนนสูงกว่า GPT-3.5 ในหลายๆ benchmark ด้วย ซึ่งจะช่วยเร่งแนวโน้มที่ลูกค้าขององค์กรต่างๆ เริ่มเปลี่ยนมาใช้ open source model แทน proprietary model มากขึ้น

DBRX v ChatGPT

  • DBRX ใช้สถาปัตยกรรมแบบ mixture-of-experts (MoE) ทำให้มีความเร็วสูงถึง 2 เท่าในแง่ token ต่อวินาที เมื่อเทียบกับ LLaMA 2 70B และมีต้นทุนในการใช้งานต่ำ โดยใช้พารามิเตอร์เพียง 36,000 ล้านตัวจากทั้งหมด 132,000 ล้านตัว
  • Databricks เปิดให้ใช้ DBRX ได้ฟรีทั้งเพื่อการวิจัยและเชิงพาณิชย์ผ่าน GitHub, Hugging Face และ Databricks Platform รวมถึงบน AWS, GCP และ Azure
  • องค์กรต่างๆ สามารถนำ DBRX ไป fine-tune ต่อด้วยข้อมูลเฉพาะของตัวเองเพื่อสร้าง custom LLM ที่มีคุณภาพสูงได้ ซึ่งจะช่วยให้สร้าง generative AI application ที่ปลอดภัย, ควบคุมได้ และตอบโจทย์ธุรกิจเฉพาะด้านมากขึ้น
  • DBRX พัฒนาโดยทีม Mosaic AI Research ของ Databricks ซึ่งเป็นผู้อยู่เบื้องหลัง MPT model มาก่อน โดยใช้เวลาในการ train ประมาณ 2 เดือน บน NVIDIA H100 GPU จำนวน 3,072 ตัวที่เชื่อมต่อกันด้วย InfiniBand 3.2Tbps และใช้ข้อมูลในการ pre-train 12 ล้านล้าน token
  • ลูกค้าและพาร์ทเนอร์ของ Databricks หลายราย เช่น Accenture, Allen Institute for AI, Block, Nasdaq และ Zoom ได้เริ่มนำ DBRX ไปใช้งานและวางเผนเพื่อใช้ประโยชน์จากความสามารถของมันแล้ว

สำหรับคนที่อยากลงใช้งานสามารถทดลองได้ที่ Hugging Face ได้เลยครับ DBRX Instruct – a Hugging Face Space by databricks

DBRX Instruct a Hugging-Face Space
DBRX Instruct a Hugging-Face Space

การเปิดตัว DBRX ถือเป็นการเริ่มต้นในสมรภูมิของ Databricks ในการแข่งขันด้าน open-source foundation model และ custom AI สำหรับองค์กร ซึ่งกำลังร้อนแรงขึ้นเรื่อยๆ Databricks หวังว่า DBRX จะช่วยเร่งให้เกิดการนำ open-source model ไปใช้แทน proprietary model มากขึ้น และเป็นอีกทางเลือกให้องค์กรต่างๆ สามารถพัฒนา custom AI ที่มีคุณภาพสูงจากข้อมูลของตัวเองได้ง่ายขึ้น

การเปิด model ให้เป็น open source น่าจะช่วยให้ Databricks ดึงดูด data scientist และนักพัฒนาให้มาใช้แพลตฟอร์มของตัวเองได้มากขึ้น ขณะเดียวกัน ความสามารถในการ customize model ด้วยข้อมูลเฉพาะขององค์กร ก็จะช่วยให้ลูกค้าของ Databricks สามารถสร้าง AI ที่ตอบโจทย์และสร้างความได้เปรียบในการแข่งขันเฉพาะด้านได้ดีขึ้น

อย่างไรก็ตาม คงต้องติดตามกันต่อไปว่า DBRX จะได้รับการตอบรับและนำไปใช้งานจริงมากน้อยแค่ไหน และจะสามารถช่วยให้ Databricks สร้างความแตกต่างและรักษาความเป็นผู้นำในตลาดได้หรือไม่ ท่ามกลางการแข่งขันที่รุนแรงขึ้นเรื่อยๆ ทั้งจากคู่แข่งด้าน data platform อย่าง Snowflake และจาก cloud vendor รายใหญ่อย่าง Amazon, Microsoft และ Google ที่ต่างก็กำลังเร่งพัฒนาความสามารถด้าน generative AI เช่นกัน

#DBRX #DatabricksAI #OpenSourceLLM #CustomizableAI #MosaicAIResearch

Related articles

การใช้ Cline บน VSC Code เพื่อใช้ AI ช่วยเขียนโปรแกรม: คู่มือฉบับสมบูรณ์จาก Data-Espresso

เรียนรู้วิธีใช้ Cline AI บน VS Code เพื่อปฏิวัติการเขียนโปรแกรมของคุณ! เพิ่มประสิทธิภาพ ลดข้อผิดพลาด และเร่งการพัฒนาซอฟต์แวร์ด้วยผู้ช่วย AI อัจฉริยะ อ่านเลย!

Google เปิดตัว Gemini AI Ultra กับผลกระทบของการทำงานจริงหรือ?

เจาะลึก Google Gemini AI Ultra จากงาน I/O 2025 ฟีเจอร์ใหม่ ผลกระทบต่อการทำงาน และวิธีที่ธุรกิจ SME จะปรับตัวและใช้ประโยชน์จาก AI เพื่อการเติบโต โดย Data-Espresso

MCP A2A Protocol กับ AI: การเปลี่ยนแปลงใหม่ในโลกดิจิทัล

ทำความเข้าใจ MCP และ A2A Protocol มาตรฐานใหม่ที่ปฏิวัติการทำงานร่วมกันของ AI Agents และผลกระทบต่อธุรกิจ รวมถึงวิธีที่ Data-Espresso ช่วยคุณได้

สรุปงาน Google I/O 2025 Update สำคัญที่ต้องอ่าน

อัปเดตล่าสุดจาก Google I/O 2025! สรุปไฮไลท์สำคัญ Gemini AI, Project Astra, Android 16 และนวัตกรรม AI อื่นๆ ที่ธุรกิจและนักพัฒนาต้องรู้ อ่านเลย!

SME ควรเริ่มลงทุนและใช้ AI อย่างไรให้ประสบความสำเร็จ

คู่มือฉบับสมบูรณ์สำหรับ SME ที่ต้องการเริ่มต้นลงทุนและนำ AI มาใช้ในธุรกิจอย่างมีกลยุทธ์ ตั้งแต่การวางแผน การเลือกเครื่องมือ จนถึงการวัดผล เพื่อเพิ่มศักยภาพและสร้างความได้เปรียบในการแข่งขัน
บทความก่อนหน้านี้
บทความถัดไป

Related Article

Perplexity เปิดตัว Labs: เขย่าวงการ AI ด้วยเครื่องมือสร้างคอนเทนต์แห่งอนาคต

Perplexity Labs คืออะไร? ค้นพบศักยภาพเครื่องมือ AI ใหม่จาก Perplexity ที่สร้างได้ทั้งรายงาน สเปรดชีต แดชบอร์ด และเว็บแอปฯ พร้อมวิธีที่ธุรกิจคุณจะนำไปใช้ประโยชน์ในการทำ AI consulting และ AI automation workflows

A2A (Agent to Agent) คืออะไร? ปฏิวัติการทำงานร่วมกันของ AI Agent

เจาะลึก A2A (Agent to Agent) โปรโตคอลเปิดที่ช่วยให้ AI Agent ต่างค่ายสื่อสารและทำงานร่วมกันได้ พร้อมประโยชน์สำหรับธุรกิจ SME และ AI consulting โดย Data-Espresso

MCP คืออะไร? เจาะลึกมาตรฐานใหม่ พลิกเกม AI Agent และ Workflow Automation

MCP (Model Context Protocol) คืออะไร? ทำความเข้าใจมาตรฐานเปิดที่ช่วยให้ AI Agent เชื่อมต่อข้อมูลภายนอกอย่างมีประสิทธิภาพ พร้อมประโยชน์ ตัวอย่างการใช้งานใน n8n และอนาคตของ AI
สอบถามข้อมูล