Google เปิดตัว DiffusionGemma โมเดลภาษาเปิดน้ำหนักใช้เทคน…

ที่มาภาพ: The Register

AI14 มิถุนายน 2569 เวลา 01:30อ่าน 7 นาทีThe Register

Google เปิดตัว DiffusionGemma โมเดลภาษาเปิดน้ำหนักใช้เทคน…

⚡ สรุป 30 วิ

Google เปิดตัวโมเดลภาษา DiffusionGemma ที่ใช้เทคนิค diffusion จากโมเดลสร้างภาพ ทำให้การสร้างข้อความเร็วขึ้นหลายเท่าโดยใช้หน่วยความจำเพียง 18 GB. โมเดล…

Google เปิดตัวโมเดลภาษาแบบเปิดน้ำหนักใหม่ที่ชื่อ DiffusionGemma ซึ่งนำเทคนิคจากโมเดลสร้างภาพมาปรับใช้กับการสร้างข้อความ ทำให้ความเร็วการประมวลผลเพิ่มขึ้นหลายเท่าบนฮาร์ดแวร์ผู้บริโภคที่มีข้อจำกัดของทรัพยากร โมเดลนี้สามารถดาวน์โหลดและรันได้ด้วยหน่วยความจำ 18 GB ของ DRAM หรือ VRAM เท่านั้น

Overview

โมเดล DiffusionGemma เป็นส่วนหนึ่งของตระกูลโมเดลเปิดน้ำหนักของ Google ที่ออกแบบมาเพื่อทำงานบนเครื่องส่วนบุคคล ทีม DeepMind ของ Google เปิดเผยว่าโมเดลนี้มี 26 billion‑parameter และใช้สถาปัตยกรรม **Mixture‑of‑Experts (MoE) ซึ่งแตกต่างจากโมเดลภาษาแบบดั้งเดิมที่ทำงานแบบออโต้รีเกรสซีฟ การสร้างข้อความของ DiffusionGemma จะทำการสร้างชุดโทเคนทั้งหมดของย่อหน้าในครั้งเดียวคล้ายกระบวนการของโมเดล diffusion ที่สร้างภาพจากการลบสัญญาณรบกวนหลายขั้นตอน

โดยโมเดลนี้ไม่ได้มุ่งเน้นเป็น LLM ขนาดใหญ่ตามแบบทั่วไป แต่ใกล้เคียงกับโมเดลภาพเช่น Stable Diffusion หรือ Flux มากกว่า การทำงานโดยวาง “ผืนผ้าใบ” ของโทเคนแบบสุ่มแล้วค่อย ๆ ปรับให้เป็นผลลัพธ์ที่ต้องการ ทำให้กระบวนการส่วนใหญ่เปลี่ยนเป็นการคำนวณ (compute‑bound) มากกว่าการดึงข้อมูลจากหน่วยความจำ (memory‑bandwidth bound)

Technical Approach

เทคนิค diffusion ที่นำมาใช้ใน DiffusionGemma ทำให้การสร้างข้อความไม่ต้องรอการประมวลผลต่อเนื่องของโทเคนแต่ละตัว ซึ่งเป็นข้อจำกัดสำคัญของโมเดลออโต้รีเกรสซีฟแบบดั้งเดิม การสร้างโทเคนหลาย ๆ ตัวพร้อมกันทำให้การใช้หน่วยประมวลผลกราฟิก (GPU) มีประสิทธิภาพสูงกว่าเดิมโดยเฉพาะบนกราฟิกการ์ดระดับไฮเอนด์ที่มักมีพลังการประมวลผลเหลือเฟือ

โมเดลนี้ถูกออกแบบให้ทำงานได้บนเครื่องที่มี 18 GB ของหน่วยความจำ ซึ่งถือว่าต่ำกว่าข้อกำหนดของหลาย LLM ขนาดใหญ่ในตลาด การที่โมเดลทำงานเป็นงานคำนวณมากกว่าการดึงข้อมูลทำให้ข้อจำกัดด้านแบนด์วิดท์ของหน่วยความจำไม่เป็นอุปสรรคสำคัญอีกต่อไป

Performance & Benchmarks

Google ระบุว่า DiffusionGemma มีความเร็วในการสร้างข้อความดีกว่าโมเดล LLM ขนาด 12 B ที่เปิดใช้เทคนิค speculative decode อยู่ 2.25 เท่า และเมื่อรันบน Nvidia H100 เพียงเครื่องเดียว ความเร็วเพิ่มขึ้นใกล้ 4 เท่า เมื่อเทียบกับ Gemma 4 26B‑A4B อย่างไรก็ตาม ในการทดสอบเกณฑ์ GPQA‑Diamond โมเดลนี้ยังทำคะแนนได้แค่ระดับเดียวกับ Gemma 4 12B ซึ่งแสดงว่าประสิทธิภาพด้านคุณภาพยังไม่เหนือกว่าโมเดลที่มีขนาดเล็กกว่า

ก่อนหน้า Google เคยทดลองโมเดลเช่น DREAM หรือ Mercury 2 ที่ให้ความเร็วสูงแต่คะแนนการทดสอบโดยรวมต่ำกว่าโมเดลเดียวกันในขนาดเดียวกัน DiffusionGemma ดูเหมือนจะยังคงมีช่องว่างเดียวกัน – ความเร็วเป็นจุดแข็งหลัก ส่วนคุณภาพอาจต้องพัฒนาเพิ่มเติม

  • ขนาดโมเดล: 26 billion‑parameter MoE
  • ความต้องการหน่วยความจำ: 18 GB DRAM/VRAM
  • ความเร็วเพิ่ม: 2.25 × (เมื่อเทียบกับ 12 B LLM) / ~4 × (เมื่อเทียบกับ Gemma 4 26B‑A4B บน H100)
  • ประสิทธิภาพเบนช์มาร์ค: อยู่หลัง Gemma 4 12B ใน GPQA‑Diamond

Availability & Ecosystem

Google ปล่อย DiffusionGemma ในรูปแบบโมเดลทดลอง (experimental) ภายใต้สัญญาอนุญาต Apache 2.0 ที่ค่อนข้างเปิดกว้าง โมเดลนี้สามารถดาวน์โหลดได้จากแหล่งเก็บโมเดลยอดนิยมเช่น Hugging Face พร้อมกับการสนับสนุนจากเครื่องยนต์การสรุปผล (inference engines) ที่เป็นที่ยอมรับ ได้แก่ vLLM, MLX, และ HF Transformers ส่วนการสนับสนุนจาก Llama.cpp ก็กำลังอยู่ในขั้นตอนการพัฒนา

การเปิดตัวในลักษณะนี้สอดคล้องกับแนวโน้มของ Google ที่ต้องการกระตุ้นการใช้โมเดลบนอุปกรณ์ท้องถิ่น เพื่อลดค่าใช้จ่ายในการประมวลผลบนคลาวด์ ตัวอย่างเช่น Google ได้ปล่อย LLM เล็ก ๆ ไปกับเว็บเบราว์เซอร์ Chrome ตั้งแต่เดือนพฤษภาคมที่ผ่านมา ซึ่งเป็นส่วนหนึ่งของกลยุทธ์ลดภาระคลาวด์โดยใช้เทคโนโลยีบนอุปกรณ์ผู้ใช้

Implications

การนำเทคนิค diffusion มาใช้ในงานสร้างข้อความอาจเป็นจุดเริ่มต้นของการเปลี่ยนแปลงรูปแบบการพัฒนาโมเดลภาษาในอนาคต หากสามารถปรับปรุงคุณภาพให้สอดคล้องกับความเร็วที่เพิ่มขึ้น โมเดลแบบนี้จะทำให้ผู้ใช้ทั่วไปและนักพัฒนาสามารถรันแอปพลิเคชัน AI บนเครื่องส่วนบุคคลได้อย่างมีประสิทธิภาพ ลดการพึ่งพาเซิร์ฟเวอร์คลาวด์และค่าใช้จ่ายที่เกี่ยวข้อง

อย่างไรก็ตาม คำวิจารณ์จากการทดสอบเบนช์มาร์คยังชี้ให้เห็นว่าความแม่นยำและความเข้าใจเชิงลึกของ DiffusionGemma ยังตามไม่ไหวกับโมเดลที่มุ่งเน้นคุณภาพเป็นหลัก ดังนั้นในระยะสั้นอาจเห็นการใช้งานที่จำกัดเฉพาะงานที่ต้องการความเร็วสูงเป็นหลัก เช่น การสรุปข้อความแบบเร็ว ๆ หรือการสร้างข้อความร่างเบื้องต้น ก่อนที่จะพัฒนาต่อยอดให้ครอบคลุมการใช้งานที่ซับซ้อนมากขึ้น

Summary

Google เปิดตัว DiffusionGemma โมเดลภาษา 26 billion‑parameter ที่ใช้เทคนิค diffusion เพื่อเพิ่มความเร็วในการสร้างข้อความหลายเท่า บนเครื่องผู้ใช้ที่มี 18 GB หน่วยความจำ โมเดลนี้เป็นโครงการเปิดน้ำหนักที่พร้อมให้ดาวน์โหลดและสนับสนุนโดยเครื่องยนต์ inference หลักหลายตัว แม้จะเร็วกว่าโมเดลเดิม แต่ยังต้องพัฒนาคุณภาพเพื่อให้เป็นทางเลือกที่สมบูรณ์สำหรับการใช้งานทั่วไป.

แชร์บทความนี้:

ชอบบทความแบบนี้?

สมัคร AI Automate Weekly Newsletter — รับเคล็ดลับ AI + how-to ใหม่
ทุกสัปดาห์ตรงถึง inbox ฟรี ไม่มีสแปม

แหล่งข่าวต้นฉบับ

ชื่อต้นฉบับ
Google's new open-weights model brings image-generation tricks to AI text generation
ผู้เขียน
Unknown
แหล่ง
The Register
วันที่เผยแพร่
12 มิถุนายน 2569 เวลา 01:31

Related

บทความที่เกี่ยวข้อง

ทดสอบอัปเดตใหญ่ของ NotebookLM 3 รายการและการยกเลิกฟีเจอร์…AI
15 มิถุนายน 2569 เวลา 21:30

ทดสอบอัปเดตใหญ่ของ NotebookLM 3 รายการและการยกเลิกฟีเจอร์…

NotebookLM ยังคงเป็น AI ช่วยวิจัยยอดนิยม ด้วยอัปเดต UI การสรุปแม่นยำขึ้นและความเร็วในการจัดการข้อมูล การยกเลิกฟีเจอร์เสียงแม้เงียบแต่เปลี่ยนวิธีใช้มาก

XDA Developers6 นาที
เกมอินดี้ต้องสร้าง Prototype ให้ดี มิใช่พึ่ง AI เพื่อรับเ…AI
15 มิถุนายน 2569 เวลา 17:00

เกมอินดี้ต้องสร้าง Prototype ให้ดี มิใช่พึ่ง AI เพื่อรับเ…

การสร้าง prototype เป็นขั้นตอนสำคัญเพื่อให้ผู้จัดพิมพ์พิจารณาการลงทุน แต่การใช้ AI อย่างเร่งรีบอาจทำให้เกมสูญเสียเอกลักษณ์และความน่าเชื่อถือ ตามที่ผู้แทนจาก…

Rock Paper Shotgun7 นาที
สหรัฐอเมริกาบังคับ Anthropic ระงับโมเดล AI ชั้นนำทันทีAI
15 มิถุนายน 2569 เวลา 14:00

สหรัฐอเมริกาบังคับ Anthropic ระงับโมเดล AI ชั้นนำทันที

รัฐบาลสหรัฐออกคำสั่งฉุกเฉินให้ Anthropic ปิดให้บริการโมเดล AI Fable 5 และ Mythos 5 ทั้งหมด เนื่องจากความกังวลเรื่องความปลอดภัยระดับชาติและช่องโหว่ jailbreak…

Android Authority6 นาที
ให้ LLM ภายในเครื่องเข้าถึง Docker แล้วสคริปต์มอนิเตอร์ถู…AI
15 มิถุนายน 2569 เวลา 05:00

ให้ LLM ภายในเครื่องเข้าถึง Docker แล้วสคริปต์มอนิเตอร์ถู…

ผู้ใช้ให้ Local LLM เข้าถึง Docker เพื่อสร้างสคริปต์มอนิเตอร์อัตโนมัติ แต่ค่าใช้จ่ายสูง, ความเป็นส่วนตัวเสี่ยง, และผลลัพธ์ไม่แม่นยำ…

XDA Developers8 นาที
คัดลอกลิงก์แล้ว!