freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

顯卡發(fā)展史__燕山大學(xué)郭培贊(編輯修改稿)

2025-01-22 01:24 本頁(yè)面
 

【文章內(nèi)容簡(jiǎn)介】 ) 32個(gè)流處理器構(gòu)成一組SM(StreamingMultiprocessor)返回目錄返回目錄體系架構(gòu)體系架構(gòu)光柵引擎以流水線的方式執(zhí)行 邊緣 /三角形設(shè)定 (Edge/TriangleSetup)、光柵化(Rasterization)、 Z軸壓縮 (ZCulling)等操作,每個(gè)時(shí)鐘循環(huán)周期處理 8個(gè)像素。 GF100有四個(gè)光柵引擎,每組 GPC分配一個(gè),整個(gè)核心每周期可處理 32個(gè)像素。 RasterEngine是用于修正 ,而 ROPs則是傳統(tǒng)的運(yùn)算 .多形體引擎則要負(fù)責(zé)頂點(diǎn) 拾取 (VertexFetch)、細(xì)分曲面 (Tessellation)、視口轉(zhuǎn)換 (ViewportTransform)、屬性設(shè)定 (AttributeSetup)、流輸出 (StreamOutput)等五個(gè)方面的處理工作,DX11中最大的變化之一細(xì)分曲面單元(Tessellator)就在這里。返回目錄返回目錄體系架構(gòu)體系架構(gòu)返回目錄返回目錄NVIDIA的 線 程粒度被稱作 Warp,一個(gè) Warp是 32 線 程 ;而 AMD的 線 程粒度稱作wavefront,粒度是 64 線 程 。 每個(gè) CUDACore是一個(gè)統(tǒng)一的處理器核心,執(zhí)行 頂點(diǎn),像素,幾何和 kernel函數(shù) 。一個(gè)統(tǒng)一的 768KB二級(jí)緩存架構(gòu)負(fù)責(zé) 線程加載、存儲(chǔ)和紋理操作 。每組 SM里四個(gè)紋理單元,共享使用 12KB一級(jí)紋理緩存,并和整個(gè)芯片共享768KB二級(jí)緩存。每個(gè)紋理單元每周期可計(jì)算 一個(gè)紋理尋址、拾取四個(gè)紋理采樣 ,并支持 DX11新的壓縮紋理格式。CUDA(ComputeUnifiedDeviceArchitecture, 統(tǒng)一計(jì)算架構(gòu) )是 NVIDIA公司對(duì)于 GPGPU( GeneralPurposeGPU),即通用計(jì)算圖形處理器的正式名稱。通過(guò)這個(gè)技術(shù),用戶首次可以 利用 GPU作為 C編譯器的開發(fā)環(huán)境 。 CUDA架構(gòu)可以 兼容OpenCL或者自家的 C編譯器 。無(wú)論是 CUDAC語(yǔ)言或是 OpenCL,指令最終都會(huì) 被驅(qū)動(dòng)程序轉(zhuǎn)換成 PTX代碼 , 交由顯示核心計(jì)算 。要將GPGPU普及化,還要看微軟能否在 Windows操作系統(tǒng)中,提供相關(guān)的編程接口。 DirectCompute是微軟的通用計(jì)算 API。 CUDA體系結(jié)構(gòu)的組成來(lái)說(shuō),包含了三個(gè)部分:開發(fā)庫(kù)、運(yùn)行期環(huán)境和驅(qū)動(dòng)。體系架構(gòu)體系架構(gòu)返回目錄返回目錄第一個(gè)問(wèn)題:為什么需要 GPU?   CPU除了處理游戲的 AI,情節(jié)等方面的數(shù)據(jù)外,對(duì)于有些圖像方面也是由它完成的。當(dāng)微軟每次發(fā)布新的 DirectX時(shí),并不是每款 GPU都能支持 DirectX新的特性,所以有些圖像方面的任務(wù)還得由 CPU來(lái)完成。還有有些特性比如重力特性以前是由 CPU來(lái)完成,現(xiàn)在有些 GPU也能支持了,這些任務(wù)就由 GPU來(lái)完成了。第二個(gè)問(wèn)題: GPU能否替代 CPU?   GPU相當(dāng)于專用于圖像處理的 CPU,正因?yàn)樗鼘?,所以它?qiáng),在處理圖像時(shí)它的工作效率遠(yuǎn)高于 CPU,但是 CPU是通用的數(shù)據(jù)處理器,在處理數(shù)值計(jì)算時(shí)是它的強(qiáng)項(xiàng),它能完成的任務(wù)是 GPU無(wú)法代替的,所以不能用 GPU來(lái)代替 CPU。體系架構(gòu)體系架構(gòu)返回目錄返回目錄SIMD是 Single Instruction Multiple Data的 縮 寫,翻 譯過(guò) 來(lái)的意思 為 單 指令多數(shù)據(jù)流 。其 執(zhí) 行方法是 讓 一個(gè)控制器 對(duì) 多個(gè) 處 理器 進(jìn) 行控制,將一個(gè)指令下 發(fā) 到每個(gè)被控制的 處 理器上 對(duì) 不同數(shù)據(jù) 進(jìn) 行相同的操作。 這 一技 術(shù) 在 CPU以及GPU上都得到了 應(yīng) 用,而其中 GPU領(lǐng) 域 應(yīng) 用更為 廣泛(特指 ATI方面) 4D設(shè)計(jì)的 SIMD單元只有一個(gè)指令端口,但卻能同時(shí)吃進(jìn)四個(gè)通道的數(shù)據(jù)流,這樣就能夠在 一個(gè)周期內(nèi)完成 4D矢量指令的處理 。SIMD單元能夠有效提升 GPU的矢量處理性能,但缺點(diǎn)是, SIMD在執(zhí)行標(biāo)量指令時(shí)效能較為低下,因?yàn)樗挥幸粋€(gè)指令端口,所以在面對(duì)標(biāo)量指令時(shí)(即 1D向量指令的時(shí)候), 4DSIMD單元一個(gè)時(shí)鐘周期只能允許一個(gè)標(biāo)量進(jìn)入,也只能處理一個(gè)標(biāo)量,其效率就會(huì)下降到原來(lái)的 1/4。體系架構(gòu)體系架構(gòu)返回目錄返回目錄MIMD多 指令多數(shù)據(jù)流 在 并行計(jì)算 當(dāng)中最為通用。讓 NVIDIA的每個(gè)流處理器僅處理一個(gè)1D指令,而如果遇到 4D、 3D、 2D指令時(shí),則將這些指令 打散為多個(gè) 1D指令,并且通過(guò)分配器將這些指令分配到每個(gè)流處理器當(dāng)中 。從理論上分析,流處理器的執(zhí)行效率幾乎達(dá)到了 100%。負(fù)面效果就是 “組長(zhǎng) ”這一職位過(guò)多(反映在顯卡當(dāng)中就會(huì) 出現(xiàn)過(guò)多的分派單元,從而導(dǎo)致晶體管數(shù)量的增加 )。并且由于組長(zhǎng)數(shù)量過(guò)多,因此導(dǎo)致了組員數(shù)量的減少。 NVIDIA顯卡基本上都是以大核心甚至 “巨核心 ”的形象出現(xiàn)在消費(fèi)者面前。也就是從 G80開始, NVIDIA徹底拋棄了傳統(tǒng)顯卡的 SIMD架構(gòu),和
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1