美國加州大學戴維斯分校(University of California-Davis)電機系學生設計出一款號稱1,000核心的處理器,其中包含6.21億個電晶體,支援每秒1.78兆次指令的運算效能與終極傳輸速率。
這款1,000核心的處理器名為“KiloCore”,據稱是今最節能的多核心處理器。它在日前於夏威夷檀香山舉辦的「2016 年超大型積體技術暨電路研討會」(Symposia on VLSI Technology & Circuits)上首度現身。
帶領該晶片架構設計團隊的該校電子與電腦工程系教授Bevan Baas表示:「據我們所知,它是世界上第一個1,000核心的處理器晶片,具備最高速率的時脈。」
根據Baas研究團隊進行的分析指出,雖然業界持續開發出其他多核心處理器晶片,但沒有一款超過300核心。這些高核心數的處理器晶片中多半都是為了研究用途而開發的,很少真正能商用化上市。但KiloCore晶片已實際進行製造與執行了——它採用了IBM 32-nm PD-SOI CMOS技術製造。
KilCore的基本架構是「多重指令/多重數據」(MIMD),每一個七階管線核心都是通用單元,包含72個指令集以及單一指令/週期。研究團隊表示,有別於GPU級晶片不同,KilCore沒有一種指令集基於「特定演算法」。
KilCore在1.1V下支援高達每秒1.78兆次指令的運算效能、1.78GHz的時脈速度:在0.84V與1GHz時的功耗約13.1W,而在0.56V與115MHz時則可達到5.8 pJ/Op的峰值功率效率。
每個核心均能獨立供電,而且可以在無須執行任務時斷電以降低漏電。相較於快取的架構,每一個處理器都能在不同的位置分層中儲存指令與數據,包括本地記憶體、一或多個鄰近處理器、晶片上獨立記憶體模組或外部記憶體等。
每個處理器都經由高通量電路交換網路、封包交換網路(晶片形式)進行通訊。研究團隊表示,採用像「蟲洞」(wormhole)的路徑,使其從晶片上的協同處理器提供運算的能量開銷較低。也就是說,從相鄰或附近核心而來的訊息,將可透過「電路」網路路由;而從更遠的處理器矩陣而來的訊息,則透過封包網路進行傳送。
每個核心都有南北東西向的通訊緩衝通道,以及用於主處理器通訊的第五通道;在1.1V時的每路由器最大傳輸速率為45.5 Gbps,在1.1V時則可達9.1 Gbps的每埠傳輸速率。
在0.9V供電電壓下,3.36mW的最大傳輸率為27.1Gbps;而在0.67電壓時,429 µW的最大傳輸速率為8.1 Gbps。
KiloCore的1,000核心處理器、1000封包路由器以及12個獨立的記憶體,都經由本地振盪器進行時脈控制,但無需使用PLL或改變頻率,可在1-5個時脈週期內暫停以及在不到1時脈週期內重新啟動,以降低功枆。該晶片尺寸約8mm2,搭載32排32顆處理器核心(共992顆核心),而剩下的8顆核心以及記憶體則置於最後一排。
採用多核心陣列的一項挑戰就是任務排程,以及保持所有的核心持續運轉。研究團隊打造出一款編程模型與編譯器,透過多步驟過程進行編程來分配所有的處理器任務。然而,為了利用現有的封裝技術,研究人員在測試時僅用了中央的160顆核心,未來還必須進一步測試完整的晶片性能。
高一些核心陣列工作的一個主要挑戰是安排任務,並保持所有內核忙碌。該團隊已經創建了一個編程模型和編譯器;他們說,編程是通過多步驟的過程,分配方案的處理器。然而,利用現有的包裝,只有中央160內核在測試中被供電的;全芯片的性能數據被假定為推斷。
每個處理器核心可以獨立作業,相較於GPU等處理器所使用的謂「單指令多數據」(SIMD)途徑,基本上可說是一種較更龗活的途徑;其想構在於將應用劃分成多個小單元,每一個應用單元都能在不同的處理器上平行處理,從而以較低能耗實現高吞吐量。Baas並補充說,KiloCore是最節能的多核心晶片。
例如,1000核心處理器每秒可執行1,150億條指令,而功耗僅0.7W,低至足以用一顆AA電池就能供電。相較於目前的筆記型電腦處理器,KiloCore晶片的效能更高100倍,且更具能效。
研究人員已經為該晶片開發出各種應用,包括無線編碼/解碼、處理、加密,以及其他有關大量平行資料運算的應用,例如科學資料應用以及資料中心記錄處理。
編譯:Susan Hong
(參考原文:Researchers Claim First 1,000-core Processor,by Graham Prophet)
資料來源:電子工程專輯
留言列表