freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

cell體系結(jié)構(gòu)(doc48)-經(jīng)營管理-文庫吧資料

2024-08-24 15:54本頁面
  

【正文】 低估這些公司。并且在一些領域 Cell對 PC并沒有特別的優(yōu)勢,因此在很長,很長的時間里 x86仍然會存在。但是 Cell和 PC總會在某個地方發(fā)生碰撞??磥?PC終于遇上了他的對手。在價格和出貨量上也不能壓倒 Cell。過去的勝利和失敗可能過于簡單,這一次則不是這樣。因此在服務器市場之后很難預測 Cell還能走多遠。 Toshiba計劃在自己的 HDTV產(chǎn)品中使用 Cell。一個 Cell處理器可以被建立用一個或者多個 SPE來 執(zhí)行每一個步驟,這意味這無需再開發(fā)專用芯片并且可用軟件支持新的標準。和定制的芯片比較起來通用處理器要低效很多,雖然專用芯片開發(fā)起來相當復雜,昂貴,但是巨大的需求量可以降低價格并且可以使功耗降到最小。當然他們也可以用軟件來實現(xiàn),但即使并不是全部由硬件完成計算也需要一顆性能相當強勁的處理器-而這僅僅是標準 MPEG2定義所需要的處理。 例子:數(shù)字電視接收器 用觀看數(shù)字電視所需的機頂盒作為流處理的例子,實際上整個過程要比播放 MPEG影片包含更多復雜的處理。一個流處理器獲得一個數(shù)據(jù)流,并按照一系列的步驟來處理。因此 Cell可以使服務器受益。 針對包含實際數(shù)據(jù)的商用數(shù)據(jù)庫的研究發(fā)現(xiàn)他們可以從 GPU的運行中獲益。然而 XML和類似的處理似乎都無法從 SPE中獲得幫助,而存儲結(jié)構(gòu)會更有用(這也是 XML如此令人驚奇的低效的原因)。【這里考慮的是雙精度浮點,單精度浮點的能力是雙精度浮點的 10倍。 Cell不僅僅會取代 PC 集群,在集群失敗的領域也可一展身手。 Top500上沒有將這部分評價單獨出來,但是確實有這樣一個使用大機柜系統(tǒng),一度被 Cray統(tǒng)治, PC集群尚不得門而入的領域。這是一個向后兼容性完全不那么重要的領域,而且變化迅速,未來基于 Cell的系統(tǒng)可能會迅速替代 PC 集群?,F(xiàn)在湊足 250臺 PC你就可以打入 Top500排行榜。 很多計算可以通過 GPU加速,包括稀疏線形系統(tǒng)求解,物理模擬,線 形代數(shù)操作,偏微分方程,快速傅立葉變換,水平集合計算,計算幾何問題,以及非經(jīng)典圖論,例如體繪制,光線跟蹤和流形象化。即使有這樣的存儲限制 Cell也可用通過 I/O單元流式處理來獲得不錯的性能。對于可以向量化的系統(tǒng)而言就是完全另外一回事了。其他眾多的分布式應用可以從 Cell中獲益。 SETI DSP應用的一個最好的例子,同樣也是基于 FFT, Cell將無止境的推動 SETIhome計劃(用分布計算方法利用計算機空閑周期為尋找外星只會生命做運算)。 現(xiàn)在有成千上萬的 DSP應 用,他們中的大多數(shù)可以被流化,因此 Cell可以應用在他們中。 數(shù)字信號處理 DSP 數(shù)字信號處理中主要使用的算法是 FFT(快速傅立葉變換),將信號分離到不同的頻域空間以做進一步處理。許多操作都可以被向量化。所有這些都需要自己的處理能力,而這還是在為每路通道上加入不同音效之前的工作。今天的電子音樂家們使用多路虛擬合成器,每路合成器上有多路聲音。 視頻編解碼也可以被向量化,因此格式轉(zhuǎn)換和各種控制操作都可以從 Cell上獲益,希望 Cell能夠顛覆目前的專業(yè)視頻處理硬件。 視頻 圖像操作顯然可以被向量化, Photoshop已經(jīng)顯示了圖像處理向量化的巨大效果?,F(xiàn)在有很多不同高性能圖形技術(shù)方面的研究,希望 Cell能夠被他們所使用,而這些技術(shù)也能通過 Cell使自己成為主流技術(shù)?,F(xiàn)在的問題是 PS3是否能成為第一個實時光影跟蹤的游戲終端。 游戲 GAME 游戲是當然的設計目標, Cell從一開始就是作為游戲終端進行設計的,如果在游戲上沒有良好的表現(xiàn)那肯定有問題。 Cell應用 正如在第一部分所說, Cell并不僅僅是為了 ps3來設計,但是 Cell擅長的應用究竟有哪些呢? Cell不可能在每一件事情上都工作得很好,某些應用可能完全不能被向量化,而某些應用可能因為頻繁讀取存儲塊的系統(tǒng)降低性能。 Navidia提供 PS3上的圖形硬件似乎驗證了這一說法。 只有一種方式來總結(jié):這個系統(tǒng)并不僅僅是搖滾,它將演奏德國的重金屬。只有 Seymour Cray的某些設計能與之相比。 目前還不太清晰的是這個設計將會走多遠。直接傳輸在專利中有所提及但沒有更多深入內(nèi)容。在專利中提到了包含 4個 Cell的單個芯片,但也有其他的設置來滿足不同的 Cell應用。 Navidia將提供 PS3使用的圖形硬件,因此這部分工作可能被包含在一個修改過的 Cell中。 Cell的設計并不是完全固定的, SPE的數(shù)目時可變的,并且 SPE中可以包含更多的浮點或整數(shù)單元。但是硬件 DRM并不是 Cell中的秘密武器,在以前的機頂盒甚至 IBM大型機的 crypto硬件都包含它。 Sony是一家媒體公司,和行業(yè)里的其他公司一樣大力推廣 DRM型的解決方案。在 OS X上書寫的 Cell代碼和在 Windows、 Linux和 Zeta上的 Cell代碼是完全相同的,應用在任何情況下都是相同的硬件 Cell來執(zhí)行它。 Cell提供了某些和 Java類似的特性,但卻是以完全不同的方式。 然而 Cell的方法也可以得到某些抽象的好處。但如果你注意到進幾年來現(xiàn)代處理器并沒有多大改變,你就會理解 Cell的設計顯然并不希望他們的體系結(jié)構(gòu)會有什么重大的變化,因此選擇了從一開始就固定住設計。 去除抽象的一個巨大缺點就是將極大的增加開發(fā)的復雜度,并且將限制硬件設計者改變系統(tǒng)的方式。每一個被添加的抽象層次都帶來了可觀的計算開銷,一次抽象可以十倍的降低性能。你將會直接面對硬件。但是 Cell放棄了他。但這并不僅僅發(fā)生在 Transmeta或者 x86上,大多數(shù)現(xiàn)代處理器的內(nèi)部體系結(jié)構(gòu)和他們的編程模型都有很大的區(qū)別。 即使硬件制造商們也開始做抽象化的工作, Transmeta擁有 x86兼容的處理器產(chǎn)品線,但實際上這些處理器與 x86大相徑庭。你無需專門為 Mac或者 Windows寫一個特定版本的 HTML文檔。這也包括類似 Java這樣提供其自身環(huán)境,而將應用從單一的操作系統(tǒng)中獨立出來的技術(shù)。發(fā)展到現(xiàn)在操作系統(tǒng)已經(jīng)包含各種各樣的復雜任務,實現(xiàn)這一目的的途徑之一就是從硬件中抽象出更多的內(nèi)容。 具體的處理方式 Cell體系結(jié)構(gòu)在許多方面都極盡所能的獲得最大性能,但是在一個地方卻和整個業(yè)界走了相反的路線。升級不在意味著替換掉原有系統(tǒng),而是增強。程序員需要說明那些任務需要被完成,以及任務之間的關(guān)系, Cell的操作系統(tǒng)和編譯器將完成其余的工作。如果你的系統(tǒng)方式變化( Cell增加或者減少)操作系統(tǒng)將完成相關(guān)處理,而無需用戶或者程序員的干涉。這種做法通常會延緩處理速度,但有增加靈活性的好處。 更多 Cell的連接方式在專利文檔中沒有更多論述,但是軟件 Cell的分發(fā)方式使得 Cell系統(tǒng)中可以使用任何網(wǎng)絡技術(shù),即使允許 adhoc的方式來處理 cell,也無需因為使用不同類型的網(wǎng)絡而重寫軟件。這樣的系統(tǒng)并非設計得象機柜式計算系統(tǒng)那樣工作,也就是說他們并不是圍繞著一組共享得存儲器來設計。如果需要更多的計算能力,插上更多的 Cell就可以了。軟件 Cell可以漂亮的被送到任何地方,并且這一過程與特定的傳輸方法是相互獨立的。 Cell應該不會因為運行操作系統(tǒng)的不同而添 加限制。 雖然這一系統(tǒng)的實際工作方式仍然很不清晰,但是顯然有某些適應性機制允許 Cell在一個網(wǎng)絡上出現(xiàn),消失。軟件 Cell中包含這些 DMA命令以從存儲器中獲得數(shù)據(jù)進行操作處理,如果 SPE被用于處理流, Cell中將包含描述何處讀取數(shù)據(jù),何處回寫結(jié)果的命令。這使得可以在網(wǎng)絡上的一臺特定主機可以將一個軟件 Cell發(fā)送到任意的硬件 Cell。軟件 Cell中包含源、目標和響應地址域,這些內(nèi)容依賴于使用的硬件網(wǎng)絡,軟件 Cell可以被發(fā)送到不同的硬件 Cell中。這一系統(tǒng)可能在靈活性上有所缺失,但是非常簡單,高速。隨著訪存能力的提高,頁表本身所需的存儲空間會變得很大,不能一次完全提供給處理器,這意味這如果 CPU試圖讀取一個存儲器位置,它需要首先從存儲器中獲得一個頁表,然后在從磁盤中讀取數(shù)據(jù)-如果考慮到 TLB,多級頁表和頁失效過程,過程將變得更復雜。 現(xiàn)有的處理器硬件都包含了許多更加復雜的存儲保護措施。這個檢查過程 是訪問執(zhí)行之前在 DMAC中進行的。 存儲保護 在 DMAC中有存儲系統(tǒng)的保護措施?,F(xiàn)在并不清楚超過 8個 Cell是如何通訊的,但是 Switch系統(tǒng)應該可以擴展以應付更多的 Cell芯片互連。 如果有超過 4個 Cell芯片共存,將會有額外的交換系統(tǒng)來提供高速的存儲訪問。這也是來自于 Rambus的技術(shù),兩條可配置的總線 FlexIO和 XIO 都工作在 Hz主頻之下,總的帶寬達到 。但以前這些都僅僅是理論數(shù)字從來沒實際達到,比較而言 Cell的帶寬將比其他競爭者更加接近于理論峰值,因此會有更好的性能。即使這條總線并不大( 64數(shù)據(jù) pin給所有 8B數(shù)據(jù)),但可以降低芯片的制造成本。 一個真實的情況是 Cell使用非常高速的存儲連接, Sony和 Toshiba從 Rambus那里獲得了 License。 Cell的存儲總線將會有更多的空閑帶寬和時間用于傳輸數(shù)據(jù),因此實際工作的性能將更加接近理論傳輸峰值速率。另外有 3位用于選擇 Bank,但這部分工作是在芯片中完成的因此影響很小。 注意:這 里并沒有考慮需要一個額外數(shù)據(jù)位時的 I/O和圖形地址空間。 如果 PC上有 512MB主存, RAM 查找需要解析 29位地址,但是由于系統(tǒng)每次最少讀取 64位數(shù)據(jù),實際只要解析 26位地址。實際的查表操作可能在存儲芯片中并不重要,但是每一個查找都會引發(fā)一個包含將地址從 bank控制器發(fā)送到存儲器件的查找事務,而這是需要時間的。專利中并沒有說明這樣做的原因,但可能是: 雖然這樣會降低靈活性,它同樣會降低訪存的延時-而延時是目前阻礙計算機性能增長最大的一個原因。 存儲器 與其他處理器一樣 Cell體系結(jié)構(gòu)中的存儲系統(tǒng)也是針對 raw speed設計的,它將同時具有低延時和高帶寬。如果預測正確的話, PS3將具有 100GB/s的存儲接口,如果均分倒 4個 Cell上,每個 DMAC將需要每秒處理至少 25GB。分布和集中式的 DMAC結(jié)構(gòu)都在專利中提及。從專利上更進一步知道這一總線寬度達到了恐怖的 1024位。專利中除了說明總線可以是一個傳統(tǒng)總線或者一個包交換網(wǎng)絡外并沒有更多的內(nèi)容。 PPE并沒有直接將指令發(fā)往 SPE但是會將他們發(fā)往 DMAC并由后者選擇合適的動作,這在載入和保存數(shù)據(jù)時顯得特別重要,同時取消了 PPE和 SPE直接相連的必要性。但是這僅適用于使用 SPE的任務,因此 QNX并不會就此消失。 硬實時處理通常是在專門定制的特殊操作系統(tǒng)(如 QNX)控制之下的。一個 絕對時鐘 被用于保證一個處理操作在說明的時間限制內(nèi)完成。以前他們被限制在 3D圖形處理但是自從梯度 (shader)的加入,他們被用于許多更加具有通用性任務中 [GPGPU],這樣的通用性和通用處理器并非沒有區(qū)別,但是 Shader 。與之相比, Intel 3GHz的 Pentium4在使用 SSE指令時,其理論峰值僅僅 6GFlops。事實上只要你用于一個足夠先進的現(xiàn)代圖形加速卡,你的系統(tǒng)將具備很多你不曾想到的能力。另外總共 8個 SPE可以使計算性能達到足夠可觀的地步。它們有以 SSE或者 Altivec形式出現(xiàn)的向量處理單元,但是這些集成的單元將分享處理器的資源。 PlayStation 3計劃將裝備 4個 Cell。在這些應用中 Cell可以接近它的理論峰值,并提供比目前任何桌面處理器高出一個數(shù)量級的計算能力。如果在流處理中各個步驟使用 RAM中的不同 bank,完成流處理的 SPE可以同時讀寫不同 bank。 流處理器通常并不需要大存儲帶寬,但是 Cell具有這一能力。根據(jù)應用的需求,這一序列可以使用多個 SPE,同時 SPE可以讀寫多個 RAM塊。 一個 Cell處理器可以通過用一個或者多個 SPE承擔流中的一個步驟來執(zhí)行流操作。一個流處理器獲取數(shù)據(jù)之后,按照一系列的步驟來處理它。在第二部分將介紹這一內(nèi)容,以及 Cell內(nèi)部的其他部分。但是 ... ... SPE同時也可以串連起來以流方式使用多個并行 SPE來處理數(shù)據(jù)。但是作為傳統(tǒng)的處理器設計,假設有正常的 Cache和一致性即使是安全的做法。 這一系統(tǒng)仍然會增加存儲訪問的復雜性并且降低它的速度,存放在 RAM中的額外數(shù)據(jù)可以加速訪問但是對于額外硅面積和相關(guān)開銷而言可能并不值得這樣做。在相關(guān)專利中極多的圖表用于解釋這一機制。 SPE需要足夠的數(shù)據(jù),通過使用本地存儲器 Cell設計師證明能夠提供足夠的帶寬。 這聽起來象是一個難以編程很不靈活的系統(tǒng),但可以讓 SPE寄存器達到難以置信的速度。 不使用 Cache工作模 式,設計師可以剔除很多復雜設計。 SPE通過寄存器操作來讀寫本地存儲器。 SPE本地存儲-不是 Cache 為了解決 Cache設計帶來的復雜性并提高性能, Cell設計師選擇了一條獨一無二的激進道路。 支持 這些復雜操作將在邏輯設計和時間上付出巨大開銷,同時限制了傳統(tǒng)系統(tǒng)中訪問主存的速度,隨著處理器核心的增多問題復雜度也在增加。
點擊復制文檔內(nèi)容
醫(yī)療健康相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1