
ที่มาภาพ: Tom's Hardware
ซูเปอร์คอมพิวเตอร์ LineShine ของจีนครองอันดับหนึ่ง TOP500 ด้วยความเร็ว 2.2 ExaFLOPS แบบ CPU‑only
⚡ สรุป 30 วิ
LineShine ของจีนทำ 2.198 FP64 ExaFLOPS ด้วย CPU‑only เป็นเครื่องแรกใน TOP500 ที่ทะลุ 2 ExaFLOPS…
LineShine ซุปเปอร์คอมพิวเตอร์ของจีนขึ้นแท่น 1‑อันดับของรายการ TOP500 หลังจากทำคะแนน 2.198 FP64 ExaFLOPS ในเบนช์มาร์ค Linpack โดยใช้เพียง CPU เท่านั้น การบรรลุผลระดับนี้เป็นครั้งแรกในประวัติศาสตร์ของ TOP500 และชี้ให้เห็นถึงความก้าวหน้าของเทคโนโลยีเซมิคัสตอมจีนในสาขาคอมพิวเตอร์ความเร็วสูง
Overview
ซุปเปอร์คอมพิวเตอร์ LineShine ถูกติดตั้งที่ศูนย์คอมพิวเตอร์ความเร็วสูงแห่งชาติในเซินเจิ้น (NSCS) และผลการทดสอบถูกส่งเข้าสู่รายการ TOP500 โดยศูนย์คอมพิวเตอร์เมฆของเซินเจิ้น (Shenzhen Cloud Computing Center) รายละเอียดของระบบระบุว่าเป็นเครื่องที่ใช้ CPU เท่านั้นโดยไม่มีการเสริมด้วยตัวเร่งความเร็ว (accelerator) ใด ๆ การได้คะแนน 2.198 FP64 ExaFLOPS ทำให้เครื่องนี้กลายเป็นเครื่องแรกที่ทำลายเกณฑ์ “เหนือ 2 ExaFLOPS double‑precision” ด้วยสถาปัตยกรรม CPU
จากมุมมองของอุตสาหกรรม HPC การที่จีนสามารถสร้างเครื่องที่ทำงานได้เร็วขนาดนี้โดยพึ่งพาเทคโนโลยีภายในประเทศ ถือเป็นสัญญาณสำคัญต่อการลดการพึ่งพาเทคโนโลยีจากต่างประเทศ โดยเฉพาะอย่างยิ่งในช่วงที่ข้อจำกัดด้านการส่งออกของสหรัฐฯ กำลังเข้มงวดขึ้น
Technical Details
เครื่อง LineShine ประกอบด้วย CPU รุ่น LX2 ที่ออกแบบโดยใช้สถาปัตยกรรม Armv9 พร้อมคำสั่ง SVE (Scalable Vector Extension) และ SME (Scalable Matrix Extension) รายละเอียดหลักของระบบมีดังนี้
- CPU: 304‑core LX2, 1.55 GHz, จัดเป็น 8‑cluster แต่ละ cluster มี 38 core
- จำนวน Core ทั้งหมด: 13.79 ล้าน core
- หน่วยความจำ: 32 GB HBM บนแพ็กเกจ (แบนด์วิธสูงสุด 4 TB/s) + สูงสุด 256 GB DDR5 ภายนอก
- อินเทอร์คอนเนค: ระบบเชื่อมต่อภายใน LingQi ของจีน
- การใช้พลังงาน: 42.2 MW ทั้งระบบ
สถาปัตยกรรมหน่วยความจำแบบผสมระหว่าง HBM และ DDR5 มีจุดมุ่งหมายเพื่อเพิ่มแบนด์วิธและความจุพร้อมกัน แม้ว่าอัตราการเร่งจาก FP64 ไปยัง mixed‑precision จะเพิ่มเพียง 3.6 เท่า ซึ่งน้อยกว่าที่เห็นในระบบที่ใช้ตัวเร่งความเร็วเช่น AMD Instinct MI300A หรือ Intel Ponte Vecchio
Performance Metrics
ในเชิงประสิทธิภาพ LineShine ทำคะแนน 2.198 FP64 ExaFLOPS ในการทดสอบ Linpack และให้ 52.07 GFLOPS/W จากการคำนวณพลังงาน ซึ่งต่ำกว่า El Capitan ที่ได้ 60.94 GFLOPS/W อย่างไรก็ตาม มันยังเหนือกว่า Fugaku ของญี่ปุ่นซึ่งให้ค่า 14.78‑16.84 GFLOPS/W ทั้งในโหมดที่ปรับประสิทธิภาพและไม่ปรับ
นอกจากการทดสอบ Linpack แล้ว LineShine ยังทำคะแนน 22.00 HPCG‑PFLOPS ทำให้ขึ้นเป็นอันดับหนึ่งในตาราง HPCG อีกด้วย อย่างไรก็ตาม เมื่อวัดในโหมด mixed‑precision ผ่าน HPL‑MxP เครื่องนี้ได้ 7.92 EFLOPS ซึ่งยังตามไม่ทัน El Capitan, Frontier และ Aurora ทำให้ศักยภาพในการฝึกและสรุปโมเดล AI ยังอยู่ในระดับที่ต้องพัฒนาเพิ่มเติม
Comparison
การเปรียบเทียบระหว่างซุปเปอร์คอมพิวเตอร์ระดับโลกหลายเครื่องแสดงให้เห็นถึงความแตกต่างของแนวทางออกแบบ
- LineShine ใช้ CPU‑only โดยอาศัย Armv9 + SVE/SME เพื่อเร่งงานเวกเตอร์และเมทริกซ์
- Frontier และ Aurora ใช้ GPU หรือ Xe‑HPC accelerator ที่ให้การเร่ง mixed‑precision สูงกว่า 10‑15 เท่า
- Fugaku แม้จะเป็น CPU‑only แต่ใช้สถาปัตยกรรม ARM‑based รุ่นเก่าและให้ประสิทธิภาพต่อวัตต์ต่ำกว่าอย่างมีนัยสำคัญ
ผลลัพธ์นี้สรุปได้ว่า LineShine มีความแข็งแกร่งในงานคำนวณ double‑precision (FP64) แต่ยังขาดความได้เปรียบในงานที่ต้องการความเร็วแบบ low‑precision เช่น การฝึก AI ซึ่งมักพึ่งพา accelerator พิเศษ
Analysis
จากข้อมูลที่เปิดเผย การออกแบบ LX2 เน้นการรวม SVE และ SME เข้ากับหน่วยความจำ HBM ทำให้เครื่องสามารถทำงานด้านวิทยาศาสตร์คอมพิวเตอร์ที่ต้องการความแม่นยำสูงได้ดี การใช้ CPU‑only ยังช่วยลดความซับซ้อนของซอฟต์แวร์และการจัดการระบบ อย่างไรก็ตาม ความก้าวหน้าในด้าน mixed‑precision ยังถูกจำกัดโดยแบนด์วิธของหน่วยความจำและประสิทธิภาพของ LingQi interconnect ซึ่งยังไม่เทียบเท่ากับ InfiniBand หรือ NVLink ที่ใช้ในระบบอื่น
แม้ว่าการเพิ่มประสิทธิภาพจาก FP64 ไปยัง FP16/BF16 จะอยู่ที่ระดับ 3.6 เท่า ซึ่งอาจดูต่ำ แต่เป็นผลมาจากการที่ระบบยังไม่มีตัวเร่งความเร็วแยกส่วนและซอฟต์แวร์ที่สนับสนุนการทำงานแบบ mixed‑precision ยังอยู่ในขั้นตอนพัฒนา การประเมินผลในระยะยาวจึงต้องพิจารณาถึงการอัพเกรดฮาร์ดแวร์และการเพิ่มประสิทธิภาพของซอฟต์แวร์ต่อไป
Impact
การที่ LineShine ได้รับตำแหน่ง 1‑อันดับใน TOP500 ด้วยสถาปัตยกรรม CPU‑only ของจีน แสดงให้เห็นว่าประเทศจีนมีศักยภาพในการพัฒนาเทคโนโลยีคอมพิวเตอร์ความเร็วสูงที่อิสระจากอุปกรณ์ของสหรัฐฯ หรือญี่ปุ่น นี้อาจส่งผลต่อการแข่งขันด้าน HPC ระหว่างประเทศและอาจกระตุ้นให้ผู้ผลิตอื่น ๆ พิจารณานำ Armv9 เข้าไปใช้ในระบบ HPC ของตน
สำหรับอุตสาหกรรม AI แม้ว่า LineShine ยังตามไม่ทันในด้าน mixed‑precision แต่การมีเครื่องที่ทำงาน FP64 ได้เร็วกว่า 2 ExaFLOPS อย่างต่อเนื่อง จะช่วยสนับสนุนงานวิจัยด้านฟิสิกส์, ด้านเคมี, และการจำลองสภาพอากาศระดับโลก ซึ่งต้องการความแม่นยำสูง
Summary
LineShine ของจีนครองตำแหน่ง 1‑อันดับใน TOP500 ด้วยคะแนน 2.198 FP64 ExaFLOPS ใช้ CPU‑only บนสถาปัตยกรรม Armv9 การบรรลุนี้แสดงให้เห็นถึงความก้าวหน้าในด้านคอมพิวเตอร์ความเร็วสูงของจีน แม้ความสามารถในงาน mixed‑precision ยังคงต้องพัฒนาเพิ่มเติมก็ตาม.
แชร์บทความนี้:
ชอบบทความแบบนี้?
สมัคร AI Automate Weekly Newsletter — รับเคล็ดลับ AI + how-to ใหม่
ทุกสัปดาห์ตรงถึง inbox ฟรี ไม่มีสแปม
แหล่งข่าวต้นฉบับ
- ชื่อต้นฉบับ
- China's LineShine supercomputer dethrones US' El Capitan, secures first place in Top 500 list — first machine in the rankings to sustain more than 2 ExaFLOPS of double-precision performance using only CPUs
- ผู้เขียน
- Anton Shilov
- แหล่ง
- Tom's Hardware
- วันที่เผยแพร่
- 23 มิถุนายน 2569 เวลา 19:55



