Neo核心架構
在美國有一家由兩個青少年所創立的新公司 Rex Computing ,開發了一款平行架構處理器,期望能為高階系統帶來10倍的每瓦效能提升;該公司並打算將指令集架構轉為開放源碼,以拉攏支持者。
這家新創公司的雄心不小,最近終於到了可以自己簽公司合約年紀(18歲)的該公司執行長Thomas Sohmers的目標,是打造目前處理器與加速器的替代技術──現有的方案若要升級至研究人員期望在未來十年達到的exaflop等級性能,要付出的代價太高(主要是功耗方面)。
Sohmers表示,運算產業界面前是一條艱辛的長路;大家廣泛接受的是繼續與英特爾(Intel)、Nvidia一起遵循摩爾定律(Moore's Law)路線往下走:「現在有一個很好的機會能讓我們能提早實現exascale等級系統,我們需要的是很新的東西,我們也正在嘗試推廣它,不過這是一樁困難的生意,很多人抗拒新的東西。」
最近Sohmers當選為Facebook發起的開放運算計畫(Open Compute Project,OCP)高性能工作小組共同主席;他預期Rex最快能在明年1月完成其Neo核心的開發,並且透過OCP將該處理器架構開放:「我們的想法是讓它成為一個基礎架構,讓其他人能利用它打造未來的系統。」
Sohmers透露這會是第一個全力實現晶片的OCP專案,其他成員將協助提供晶片互連、以及實際的Verilog、RTL等設計程序。3W的Neo處理器在80mm2面積內包含256個核心(核心架構如上圖),每個核心具備64位元ALU、128Kbyte容量的SRAM暫存記憶體。
每個Neo核心之間有16Gbyte/s的互連,晶片之間的總頻寬約384 Gbytes/s。該處理器架構的靈感來自於Adapteva 的Epiphany晶片,Sohmers 用它做出了第一代原型晶片,不過該原型的記憶體頻寬不夠、也達不到他想要的雙倍精度。
Rex Computing規劃的系統設計
Rex Computing規劃了一個系統設計(如上圖),只需利用三分之一的OCP 1U伺服器節點,採用4x4的晶片陣列,由一個次元件來控制──該公司打算一開始採用FPGA方案;Sohmers表示,該設計可達到50 Gflops/watt、雙倍精度浮點運算。
執行Linux軟體的控制晶片能提供Neo陣列存取功能,並能以C語言編寫高度平行化的應用程式;不過Sohmers強調,要讓新架構處理器充分發揮效能,會需要用到一些新興的平行編程解決方案,例如Unified C或Erlang。該新架構系統鎖定的應用市場包括石油/天然氣探勘、機器學習等等,Rex Computing正在籌募種子基金,為Neo處理器投片做準備。
在不久前的Supercomputing 2014大會上,Sohmers 與來自Cray、IBM、美國國家實驗室的技術菁英們一起參與了一場座談會,探討exascale 等級系統的未來發展;有人認為,該類系統將會是遠超過可預期的未來,部分原因是目前系統的性能都被高估了。
不過Sohmers認為,全球五百大超級電腦仍是利用已經有30年歷史的Linpack基準,根本無法強調記憶體頻寬或是模擬實際應用;而HPCG (high-performance conjugant gradient)基準是更實際的量測,採用該基準所列出的系統評比結果,只有Linpack基準性能的60分之一,因此現今最強大的系統可能只有還搆不上petaflop等級的一半:「這真的很糟糕。」
編譯:Judith Cheng
(參考原文: Startup to Open Source Parallel CPU,by Rick Merritt)
資料來源:電子工程專輯
留言列表