一家中國新創公司在日前於美國矽谷舉行的Hot Chips大會上,介紹了史上最“牛逼”的ARM核心伺服器處理器;該成立於2012年的廣州飛騰信息技術(Phytium Technology),介紹的是一款採用64顆客製化ARMv8核心的2GHz處理器,以28奈米製程生產;每週期可執行最多4個指令集、峰值性能達512 GFlops。
該款名為Mars的大型晶片耗電量120W,面積尺寸640mm2,約有3,000支接腳,其性能超越了現存的高階ARM核心伺服器晶片,例如美國晶片業者Cavium已經開始提供樣品的48核心ThunderX,以及Broadcom正在開發的另一款元件。此外在今年2月,以色列IC設計公司EZchip表示,將推出一款有100顆ARMv8核心的28奈米製程處理器,但要到2017年才會上市。
Mars處理器雖然尚未投片,卻在大會上讓眾家市場分析師與產業觀察家印象深刻,其中有部分原因是飛騰信息這家公司很少有人聽過。
如同IBM的Power 8,Mars採用外接L3快取與記憶體控制器
市場研究機構Insight64首席分析師Nathan Brookwood表示:「我的天哪…這是到目前為止發表過得最厲害64位元 ARM處理器──它真的很威,絕對是今年大會上的驚喜。」在Mars亮相的那場講座擔任主持人的AMD院士Sam Naffziger,則盛讚Mars是一款可敬的設計,具備「優良的快取記憶體階層,並有良好的頻寬匹配(bandwidth match)」。
而Hot Chips的主辦單位則是在收到飛騰信息提交的論文時頗感驚訝,因為這家公司他們以前都沒聽過;該大會過去曾收到過幾篇由一個中國政府與當地大學院校支持之研究團隊所提供的論文,也就是打造龍芯(Godson,編按:該處理器英文名稱已改為Loongson)的團隊。
「我們很驚訝今年未再聽到龍芯團隊的訊息,」Hot Chips主辦單位的Ralph Wittig表示:「當我們收到飛騰信息的論文,我們從ARM那邊得知他們對於這家新創公司所開發的實際成果很有信心…飛騰信息處理器的外接記憶體模組與IBM在Power 8處理器採用的很類似…做為大會議程委員會,我們對該設計的印象非常深刻。」
為飛騰信息這家公司更添神秘感的,是原本要到Hot Chips現場發表論文的該公司工程經理,因為無法及時取得美國簽證而缺席,只能透過越洋電話做簡報;該公司在中國的天津與廣州都設有據點。根據一位熟悉飛騰信息的與會者表示,該公司並不是從龍芯計畫出身,而他們位於天津的辦公室在最近於當地發生的嚴重大爆炸意外中也有受損。
客製化ARMv8核心揭密
在SpecCPU 2006的性能基準測試平台的模擬中,Mars處理器達到了672分整數,浮點運算性能分數585分;不過觀察家指出,該處理器的單一核心性能表現平平。該晶片是將每8個核心放在同一平面,同平面上的4顆核心共享4MByte的快取記憶體;8顆外部晶片提供總量128MB的L3快取記憶體,以及16個DDR3-1600通道。
飛騰信息的客製化64位元ARM核心擁有192個實體暫存器(register),一個重排序緩衝器(reorder buffer)最多能處理160條指令,整個流水線則能處理約210條指令。該晶片按順序調度指令集,執行時則不按規則;它採用有力的分支預測器(branch predictor),並可執行多執行續(multithreading)。
飛騰信息自己設計的64位元ARM核心,代號是小米(Xiaomi)
Mars支援多重處理系統的MPI與Open MP介面;據了解,飛騰信息還有另外一款正在開發中的處理器名叫Earth,成本與功耗都會較低,鎖定今日的大型資料中心應用。
飛騰信息研究總監Charles Zhang在Hot Chips大會上透過電話告訴與會者:「我們確信Mars會是全世界第一款64位元ARMv8處理器,這是一個好的開始…接下來幾年我們將開發更強勁的處理器。」不過分析師也指出,Mars的一大缺點是尺寸,這樣一顆大型晶片上要達到好的生產良率將會有困難。
編譯:Judith Cheng
(參考原文: China Shakes Up ARM Servers,by Rick Merritt)
資料來源:電子工程專輯
留言列表