ซูเปอร์คอมพิวเตอร์ LineShine ของจีนครองอันดับหนึ่ง TOP500 ด้วยความเร็ว 2.2 ExaFLOPS แบบ CPU‑only

LineShine ซุปเปอร์คอมพิวเตอร์ของจีนขึ้นแท่น 1‑อันดับของรายการ TOP500 หลังจากทำคะแนน 2.198 FP64 ExaFLOPS ในเบนช์มาร์ค Linpack โดยใช้เพียง CPU เท่านั้น การบรรลุผลระดับนี้เป็นครั้งแรกในประวัติศาสตร์ของ TOP500 และชี้ให้เห็นถึงความก้าวหน้าของเทคโนโลยีเซมิคัสตอมจีนในสาขาคอมพิวเตอร์ความเร็วสูง

Overview

ซุปเปอร์คอมพิวเตอร์ LineShine ถูกติดตั้งที่ศูนย์คอมพิวเตอร์ความเร็วสูงแห่งชาติในเซินเจิ้น (NSCS) และผลการทดสอบถูกส่งเข้าสู่รายการ TOP500 โดยศูนย์คอมพิวเตอร์เมฆของเซินเจิ้น (Shenzhen Cloud Computing Center) รายละเอียดของระบบระบุว่าเป็นเครื่องที่ใช้ CPU เท่านั้นโดยไม่มีการเสริมด้วยตัวเร่งความเร็ว (accelerator) ใด ๆ การได้คะแนน 2.198 FP64 ExaFLOPS ทำให้เครื่องนี้กลายเป็นเครื่องแรกที่ทำลายเกณฑ์ “เหนือ 2 ExaFLOPS double‑precision” ด้วยสถาปัตยกรรม CPU

จากมุมมองของอุตสาหกรรม HPC การที่จีนสามารถสร้างเครื่องที่ทำงานได้เร็วขนาดนี้โดยพึ่งพาเทคโนโลยีภายในประเทศ ถือเป็นสัญญาณสำคัญต่อการลดการพึ่งพาเทคโนโลยีจากต่างประเทศ โดยเฉพาะอย่างยิ่งในช่วงที่ข้อจำกัดด้านการส่งออกของสหรัฐฯ กำลังเข้มงวดขึ้น

Technical Details

เครื่อง LineShine ประกอบด้วย CPU รุ่น LX2 ที่ออกแบบโดยใช้สถาปัตยกรรม Armv9 พร้อมคำสั่ง SVE (Scalable Vector Extension) และ SME (Scalable Matrix Extension) รายละเอียดหลักของระบบมีดังนี้

CPU: 304‑core LX2, 1.55 GHz, จัดเป็น 8‑cluster แต่ละ cluster มี 38 core
จำนวน Core ทั้งหมด: 13.79 ล้าน core
หน่วยความจำ: 32 GB HBM บนแพ็กเกจ (แบนด์วิธสูงสุด 4 TB/s) + สูงสุด 256 GB DDR5 ภายนอก
อินเทอร์คอนเนค: ระบบเชื่อมต่อภายใน LingQi ของจีน
การใช้พลังงาน: 42.2 MW ทั้งระบบ

สถาปัตยกรรมหน่วยความจำแบบผสมระหว่าง HBM และ DDR5 มีจุดมุ่งหมายเพื่อเพิ่มแบนด์วิธและความจุพร้อมกัน แม้ว่าอัตราการเร่งจาก FP64 ไปยัง mixed‑precision จะเพิ่มเพียง 3.6 เท่า ซึ่งน้อยกว่าที่เห็นในระบบที่ใช้ตัวเร่งความเร็วเช่น AMD Instinct MI300A หรือ Intel Ponte Vecchio

Performance Metrics

ในเชิงประสิทธิภาพ LineShine ทำคะแนน 2.198 FP64 ExaFLOPS ในการทดสอบ Linpack และให้ 52.07 GFLOPS/W จากการคำนวณพลังงาน ซึ่งต่ำกว่า El Capitan ที่ได้ 60.94 GFLOPS/W อย่างไรก็ตาม มันยังเหนือกว่า Fugaku ของญี่ปุ่นซึ่งให้ค่า 14.78‑16.84 GFLOPS/W ทั้งในโหมดที่ปรับประสิทธิภาพและไม่ปรับ

นอกจากการทดสอบ Linpack แล้ว LineShine ยังทำคะแนน 22.00 HPCG‑PFLOPS ทำให้ขึ้นเป็นอันดับหนึ่งในตาราง HPCG อีกด้วย อย่างไรก็ตาม เมื่อวัดในโหมด mixed‑precision ผ่าน HPL‑MxP เครื่องนี้ได้ 7.92 EFLOPS ซึ่งยังตามไม่ทัน El Capitan, Frontier และ Aurora ทำให้ศักยภาพในการฝึกและสรุปโมเดล AI ยังอยู่ในระดับที่ต้องพัฒนาเพิ่มเติม

Comparison

การเปรียบเทียบระหว่างซุปเปอร์คอมพิวเตอร์ระดับโลกหลายเครื่องแสดงให้เห็นถึงความแตกต่างของแนวทางออกแบบ

LineShine ใช้ CPU‑only โดยอาศัย Armv9 + SVE/SME เพื่อเร่งงานเวกเตอร์และเมทริกซ์
Frontier และ Aurora ใช้ GPU หรือ Xe‑HPC accelerator ที่ให้การเร่ง mixed‑precision สูงกว่า 10‑15 เท่า
Fugaku แม้จะเป็น CPU‑only แต่ใช้สถาปัตยกรรม ARM‑based รุ่นเก่าและให้ประสิทธิภาพต่อวัตต์ต่ำกว่าอย่างมีนัยสำคัญ

ผลลัพธ์นี้สรุปได้ว่า LineShine มีความแข็งแกร่งในงานคำนวณ double‑precision (FP64) แต่ยังขาดความได้เปรียบในงานที่ต้องการความเร็วแบบ low‑precision เช่น การฝึก AI ซึ่งมักพึ่งพา accelerator พิเศษ

Analysis

จากข้อมูลที่เปิดเผย การออกแบบ LX2 เน้นการรวม SVE และ SME เข้ากับหน่วยความจำ HBM ทำให้เครื่องสามารถทำงานด้านวิทยาศาสตร์คอมพิวเตอร์ที่ต้องการความแม่นยำสูงได้ดี การใช้ CPU‑only ยังช่วยลดความซับซ้อนของซอฟต์แวร์และการจัดการระบบ อย่างไรก็ตาม ความก้าวหน้าในด้าน mixed‑precision ยังถูกจำกัดโดยแบนด์วิธของหน่วยความจำและประสิทธิภาพของ LingQi interconnect ซึ่งยังไม่เทียบเท่ากับ InfiniBand หรือ NVLink ที่ใช้ในระบบอื่น

แม้ว่าการเพิ่มประสิทธิภาพจาก FP64 ไปยัง FP16/BF16 จะอยู่ที่ระดับ 3.6 เท่า ซึ่งอาจดูต่ำ แต่เป็นผลมาจากการที่ระบบยังไม่มีตัวเร่งความเร็วแยกส่วนและซอฟต์แวร์ที่สนับสนุนการทำงานแบบ mixed‑precision ยังอยู่ในขั้นตอนพัฒนา การประเมินผลในระยะยาวจึงต้องพิจารณาถึงการอัพเกรดฮาร์ดแวร์และการเพิ่มประสิทธิภาพของซอฟต์แวร์ต่อไป

Impact

การที่ LineShine ได้รับตำแหน่ง 1‑อันดับใน TOP500 ด้วยสถาปัตยกรรม CPU‑only ของจีน แสดงให้เห็นว่าประเทศจีนมีศักยภาพในการพัฒนาเทคโนโลยีคอมพิวเตอร์ความเร็วสูงที่อิสระจากอุปกรณ์ของสหรัฐฯ หรือญี่ปุ่น นี้อาจส่งผลต่อการแข่งขันด้าน HPC ระหว่างประเทศและอาจกระตุ้นให้ผู้ผลิตอื่น ๆ พิจารณานำ Armv9 เข้าไปใช้ในระบบ HPC ของตน

สำหรับอุตสาหกรรม AI แม้ว่า LineShine ยังตามไม่ทันในด้าน mixed‑precision แต่การมีเครื่องที่ทำงาน FP64 ได้เร็วกว่า 2 ExaFLOPS อย่างต่อเนื่อง จะช่วยสนับสนุนงานวิจัยด้านฟิสิกส์, ด้านเคมี, และการจำลองสภาพอากาศระดับโลก ซึ่งต้องการความแม่นยำสูง

Summary

LineShine ของจีนครองตำแหน่ง 1‑อันดับใน TOP500 ด้วยคะแนน 2.198 FP64 ExaFLOPS ใช้ CPU‑only บนสถาปัตยกรรม Armv9 การบรรลุนี้แสดงให้เห็นถึงความก้าวหน้าในด้านคอมพิวเตอร์ความเร็วสูงของจีน แม้ความสามารถในงาน mixed‑precision ยังคงต้องพัฒนาเพิ่มเติมก็ตาม.

ซูเปอร์คอมพิวเตอร์ LineShine ของจีนครองอันดับหนึ่ง TOP500 ด้วยความเร็ว 2.2 ExaFLOPS แบบ CPU‑only

Overview

Technical Details

Performance Metrics

Comparison

Analysis

Impact

Summary

แหล่งข่าวต้นฉบับ

บทความที่เกี่ยวข้อง

Cornelis Network นำ Omni‑Path มาใช้แทน InfiniBand ในคลัสเตอร์ Lynx ของ DOE

Intel Diamond Rapids เปิดตัว 192 คอร์ใหม่ ยกเลิก Hyper‑th…

นักวิจัย UNSW พัฒนาวิธีทำเอสเปรสโซด้วยคลื่นอัลตราโซนิกที่อุณหภูมิห้อง

เกมเมอร์ไทยเลือกอุปกรณ์เล่นเกมระหว่างสมาร์ทโฟน แท็บเล็ต พีซี หรือคอนโซล

Overview

Technical Details

Performance Metrics

Comparison

Analysis

Impact

Summary

แหล่งข่าวต้นฉบับ

บทความที่เกี่ยวข้อง

Cornelis Network นำ Omni‑Path มาใช้แทน InfiniBand ในคลัสเตอร์ Lynx ของ DOE

Intel Diamond Rapids เปิดตัว 192 คอร์ใหม่ ยกเลิก Hyper‑th…

นักวิจัย UNSW พัฒนาวิธีทำเอสเปรสโซด้วยคลื่นอัลตราโซนิกที่อุณหภูมิห้อง

เกมเมอร์ไทยเลือกอุปกรณ์เล่นเกมระหว่างสมาร์ทโฟน แท็บเล็ต พีซี หรือคอนโซล

Intel Diamond Rapids เปิดตัว 192 คอร์ใหม่ ยกเลิก Hyper‑th…