
Granite 4.0
Granite 4.0
Granite 4.0 คือ โมเดลภาษาขนาดใหญ่ (Large Language Model - LLM) รุ่นล่าสุดจาก IBM ที่ถูกพัฒนาด้วยสถาปัตยกรรมไฮบริดใหม่ระหว่าง Mamba กับ Transformer ซึ่งช่วยลดความต้องการใช้หน่วยความจำลงมากกว่า 70% ในงานที่ต้องวิเคราะห์บริบทยาวหรือรันหลายเซสชันพร้อมกัน โดยไม่ลดทอนประสิทธิภาพของโมเดล ทำให้สามารถรันบน GPU ราคาถูกลงและลดต้นทุนอย่างมากในการใช้งานจริงในธุรกิจและองค์กร
Granite 4.0 มีรุ่นย่อยหลายขนาด เช่น Granite-4.0-H-Small (32 พันล้านพารามิเตอร์ แต่ใช้แค่ 9 พันล้านพารามิเตอร์ในเวลาอินเฟอเรนซ์) เหมาะกับงานอัตโนมัติในองค์กร เช่น ตัวแทนบริการลูกค้า ส่วนรุ่น Tiny และ Micro เหมาะสำหรับงานที่ต้องการความหน่วงต่ำ เช่น การประมวลผลที่ปลายทาง หรือการใช้งานแบบโลคอล รวมทั้งยังมีรุ่น Micro แบบ Transformer ล้วนสำหรับแพลตฟอร์มที่ยังไม่รองรับสถาปัตยกรรมไฮบริด
โมเดล Granite 4.0 เป็นโมเดลเปิด (open source) ภายใต้ลิขสิทธิ์ Apache 2.0 และยังได้รับการรับรองมาตรฐาน ISO 42001 ด้านความปลอดภัย การกำกับดูแล และความโปร่งใส พร้อมมีการลงลายมือชื่อเชิงคริปโตกราฟฟิก เพื่อความน่าเชื่อถือและมาตรฐานสูงสุดสำหรับองค์กรที่ต้องการใช้งาน LLM ในระบบจริง
โดยรวม Granite 4.0 มุ่งเน้นให้โมเดลมีประสิทธิภาพสูงในการประมวลผลงานจำเพาะ (task efficiency) ด้วยสถาปัตยกรรมที่ผสมผสานกันระหว่าง Mamba-2 ที่เน้นประมวลผลบริบทยาวแบบต่อเนื่อง และ Transformer ที่ช่วยประมวลผลแบบ attention อย่างละเอียด บนโมเดลขนาดพารามิเตอร์ใหญ่ที่เปิดใช้เฉพาะบางส่วนผ่านโมเดล Mixture of Experts (MoE) ในการรันเวลาจริง ซึ่งช่วยให้ลดต้นทุนและความหน่วงเวลาในการใช้งานจริงได้ดีมาก
Granite 4.0 พร้อมให้ใช้ผ่าน IBM watsonx.ai และพันธมิตรแพลตฟอร์มอื่นๆ เช่น Dell, Docker Hub, Hugging Face, NVIDIA, และกำลังจะมาใน AWS และ Microsoft Azure อีกด้วย
สรุปสั้นๆ Granite 4.0 คือโมเดล LLM สำหรับองค์กรที่มีประสิทธิภาพสูง ใช้สถาปัตยกรรมไฮบริดลดการใช้หน่วยความจำและต้นทุนอย่างมาก เหมาะกับการใช้งานในธุรกิจจริงที่ต้องการความเร็วและความปลอดภัยตามมาตรฐานระดับสูง