DeepSeek ซึ่งเป็นบริษัท AI สัญชาติจีนได้เปิดตัวโมเดล DeepSeek V3-0324 ซึ่งถือเป็นการอัปเดตสำคัญของโมเดล V3 เดิม โดยการอัปเดตนี้มาพร้อมกับการปรับปรุงประสิทธิภาพในด้านต่าง ๆ เช่น การให้เหตุผล การเขียนโปรแกรม และการแก้ปัญหาทางคณิตศาสตร์ รวมถึงการเพิ่มความสามารถในการใช้งานสำหรับนักพัฒนาและองค์กรทั่วโลกผ่านใบอนุญาตแบบโอเพ่นซอร์ส MIT
DeepSeek V3-0324 ยังคงใช้ Multi-head Latent Attention (MLA) ซึ่งช่วยลดการใช้หน่วยความจำและเพิ่มประสิทธิภาพในการประมวลผล นอกจากนี้ยังมีการใช้ Mixture of Experts (MoE) ในเลเยอร์เครือข่ายเพื่อเลือกผู้เชี่ยวชาญที่เหมาะสมที่สุดสำหรับแต่ละโทเค็นโดยอัตโนมัติ
DeepSeek V3-0324 ได้รับการยอมรับว่ามีประสิทธิภาพเหนือกว่าโมเดลจาก OpenAI (GPT-4o), Anthropic (Claude 3.5 Sonnet), และ Meta (Llama 3.1) ในหลายด้าน เช่น การแก้โจทย์คณิตศาสตร์และการเขียนโปรแกรม นอกจากนี้ยังโดดเด่นในงานที่ต้องเข้าใจข้อความยาว โดยเฉพาะในภาษาจีน
ด้วยใบอนุญาต MIT นักพัฒนาและองค์กรสามารถเข้าถึงน้ำหนักโมเดลได้อย่างเสรี เปิดโอกาสให้ผู้เล่นรายเล็กสามารถแข่งขันกับบริษัทใหญ่ ๆ ได้ในตลาด AI
DeepSeek V3-0324 จึงถือเป็นก้าวสำคัญในวงการ AI ที่ไม่เพียงแต่เพิ่มความสามารถของโมเดล แต่ยังส่งเสริมความเท่าเทียมในการเข้าถึงเทคโนโลยีระดับสูงสำหรับทุกคน
บมความอื่นๆ
100/280 Soi 17, Delight Village, Bang Khun Thian - Chaitalay, Phanthai Norasing, Samut Sakhon 74000
Copyright © 2025 DriteStudio All Rights Reserved.