就高速數據處理而論,RAM通常用於存儲正在使用的數據,它比從傳統磁盤提取數據的速度要快數万倍,比NAND閃存的速度也快很多倍。而麻省理工學院(MIT)研究人員構建了一個服務器網絡證明——對於大數據應用,​​閃存和RAM一樣快,而且便宜很多。

在這個大數據時代,海量數據集用於揭示千百萬人的購買趨勢或預測還有基於千萬個數據點的金融市場趨勢,單一電腦的RAM是無法負荷的。

例如,處理一個人的基因組的數據,需要40到100台標準計算機。而另一個可選項NAND閃存,它的價格大約是RAM的十分之一,消耗功率也是它的十分之一。上個月,在計算機體系結構國際會議(International Symposium on Computer Architecture)上,麻省理工學院研究人員展示了一個新的系統,證實閃存和傳統RAM一樣高效,而且還能降低功率和硬件成本。

“比如,我們需要購買一個系統來處理10TB大的數據集。在DRAM中處理它,假設服務器有100​​GB內存的DRAM,我們就需要一組大約100台電腦集群。” Arvind Mithal,麻省理工學院計算機科學與工程約翰遜講座教授在郵件中回复說,“這樣一個集群創建需要大約400000美元。”

每一台服務器連接到一個可模擬不同電路的現場可編程網關陣列(field-programmable gate array或FPGA),每一個FPGA依次連接到2個500GB的閃存芯片和2個其他距離最近的FPGA。

因為彼此相互連接,FPGA成為了一個快速網絡,允許任何服務器從每一個閃存驅動器存取數據,而這些FPGA也能控制閃存驅動器。

Arvind還表示,同樣在閃存中處理10TB數據集,只需要10台電腦——每台需要1TB閃存容量。即便包括基於FPGA加速器硬件成本,這個系統的總成本也不會超過大概70000美元。 “如果我們考慮到基於閃存的系統中,每一台服務器上不需要同樣多的DRAM這個事實,價格可能還會進一步降低。” Arvind稱,“如果我們使用配置較少DRAM的低端服務器,該系統花費大約是40000美元。”

而維護一個基於閃存的系統費用顯然更便宜,他繼續說道,因為閃存比DRAM消耗更小的功率並且所需的服務器也相對較少。就算將閃存和FPGA加速器因素的額外功耗也算在內,麻省理工學院的服務器網絡標準顯示閃存存儲設備也僅僅是增加了大約10%的功耗到整個系統。

實際上,即使沒有他們的新網絡結構,研究人員指出如果做分佈式計算的服務器使用磁盤驅動器來獲取數據只需要該時間的5%,和使用閃存時的性能相同。

例如,配置10TB RAM的40台服務器處理一個10.5TB的計算,也不比配置20TB閃存的20台服務器快。而閃存不但成本較少,也只損耗一小部分功率。
通過將服務器的一些計算能力移到閃存驅動器的控制芯片上,研究人員就能製作一個可與基於RAM服務器媲美的20台基於閃存的服務器網絡。
他們在將數據傳遞回服務器之前,使用閃存驅動器對其進行預處理,增大了分佈式計算的效率。
“這並非是要取代DRAM之類的東西。” Arvind表示,他和一組研究生和研究員在廣達電腦公司完成了這項工作。該調查表明可能有許多應用能夠取代RAM,而且使用一個基於閃存的電腦架構費用較低。
“每一個人都在實驗閃存的不同方面。我們只是嘗試從另一個角度著手。” Arvind如是說。

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 Shacho San 的頭像
    Shacho San

    真乄科技業的頂尖投資團隊

    Shacho San 發表在 痞客邦 留言(0) 人氣()