freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

顯卡發(fā)展史__燕山大學(xué)郭培贊(編輯修改稿)

2025-01-22 01:24 本頁面
 

【文章內(nèi)容簡介】 ) 32個流處理器構(gòu)成一組SM(StreamingMultiprocessor)返回目錄返回目錄體系架構(gòu)體系架構(gòu)光柵引擎以流水線的方式執(zhí)行 邊緣 /三角形設(shè)定 (Edge/TriangleSetup)、光柵化(Rasterization)、 Z軸壓縮 (ZCulling)等操作,每個時鐘循環(huán)周期處理 8個像素。 GF100有四個光柵引擎,每組 GPC分配一個,整個核心每周期可處理 32個像素。 RasterEngine是用于修正 ,而 ROPs則是傳統(tǒng)的運(yùn)算 .多形體引擎則要負(fù)責(zé)頂點(diǎn) 拾取 (VertexFetch)、細(xì)分曲面 (Tessellation)、視口轉(zhuǎn)換 (ViewportTransform)、屬性設(shè)定 (AttributeSetup)、流輸出 (StreamOutput)等五個方面的處理工作,DX11中最大的變化之一細(xì)分曲面單元(Tessellator)就在這里。返回目錄返回目錄體系架構(gòu)體系架構(gòu)返回目錄返回目錄NVIDIA的 線 程粒度被稱作 Warp,一個 Warp是 32 線 程 ;而 AMD的 線 程粒度稱作wavefront,粒度是 64 線 程 。 每個 CUDACore是一個統(tǒng)一的處理器核心,執(zhí)行 頂點(diǎn),像素,幾何和 kernel函數(shù) 。一個統(tǒng)一的 768KB二級緩存架構(gòu)負(fù)責(zé) 線程加載、存儲和紋理操作 。每組 SM里四個紋理單元,共享使用 12KB一級紋理緩存,并和整個芯片共享768KB二級緩存。每個紋理單元每周期可計算 一個紋理尋址、拾取四個紋理采樣 ,并支持 DX11新的壓縮紋理格式。CUDA(ComputeUnifiedDeviceArchitecture, 統(tǒng)一計算架構(gòu) )是 NVIDIA公司對于 GPGPU( GeneralPurposeGPU),即通用計算圖形處理器的正式名稱。通過這個技術(shù),用戶首次可以 利用 GPU作為 C編譯器的開發(fā)環(huán)境 。 CUDA架構(gòu)可以 兼容OpenCL或者自家的 C編譯器 。無論是 CUDAC語言或是 OpenCL,指令最終都會 被驅(qū)動程序轉(zhuǎn)換成 PTX代碼 , 交由顯示核心計算 。要將GPGPU普及化,還要看微軟能否在 Windows操作系統(tǒng)中,提供相關(guān)的編程接口。 DirectCompute是微軟的通用計算 API。 CUDA體系結(jié)構(gòu)的組成來說,包含了三個部分:開發(fā)庫、運(yùn)行期環(huán)境和驅(qū)動。體系架構(gòu)體系架構(gòu)返回目錄返回目錄第一個問題:為什么需要 GPU?   CPU除了處理游戲的 AI,情節(jié)等方面的數(shù)據(jù)外,對于有些圖像方面也是由它完成的。當(dāng)微軟每次發(fā)布新的 DirectX時,并不是每款 GPU都能支持 DirectX新的特性,所以有些圖像方面的任務(wù)還得由 CPU來完成。還有有些特性比如重力特性以前是由 CPU來完成,現(xiàn)在有些 GPU也能支持了,這些任務(wù)就由 GPU來完成了。第二個問題: GPU能否替代 CPU?   GPU相當(dāng)于專用于圖像處理的 CPU,正因?yàn)樗鼘?,所以它?qiáng),在處理圖像時它的工作效率遠(yuǎn)高于 CPU,但是 CPU是通用的數(shù)據(jù)處理器,在處理數(shù)值計算時是它的強(qiáng)項(xiàng),它能完成的任務(wù)是 GPU無法代替的,所以不能用 GPU來代替 CPU。體系架構(gòu)體系架構(gòu)返回目錄返回目錄SIMD是 Single Instruction Multiple Data的 縮 寫,翻 譯過 來的意思 為 單 指令多數(shù)據(jù)流 。其 執(zhí) 行方法是 讓 一個控制器 對 多個 處 理器 進(jìn) 行控制,將一個指令下 發(fā) 到每個被控制的 處 理器上 對 不同數(shù)據(jù) 進(jìn) 行相同的操作。 這 一技 術(shù) 在 CPU以及GPU上都得到了 應(yīng) 用,而其中 GPU領(lǐng) 域 應(yīng) 用更為 廣泛(特指 ATI方面) 4D設(shè)計的 SIMD單元只有一個指令端口,但卻能同時吃進(jìn)四個通道的數(shù)據(jù)流,這樣就能夠在 一個周期內(nèi)完成 4D矢量指令的處理 。SIMD單元能夠有效提升 GPU的矢量處理性能,但缺點(diǎn)是, SIMD在執(zhí)行標(biāo)量指令時效能較為低下,因?yàn)樗挥幸粋€指令端口,所以在面對標(biāo)量指令時(即 1D向量指令的時候), 4DSIMD單元一個時鐘周期只能允許一個標(biāo)量進(jìn)入,也只能處理一個標(biāo)量,其效率就會下降到原來的 1/4。體系架構(gòu)體系架構(gòu)返回目錄返回目錄MIMD多 指令多數(shù)據(jù)流 在 并行計算 當(dāng)中最為通用。讓 NVIDIA的每個流處理器僅處理一個1D指令,而如果遇到 4D、 3D、 2D指令時,則將這些指令 打散為多個 1D指令,并且通過分配器將這些指令分配到每個流處理器當(dāng)中 。從理論上分析,流處理器的執(zhí)行效率幾乎達(dá)到了 100%。負(fù)面效果就是 “組長 ”這一職位過多(反映在顯卡當(dāng)中就會 出現(xiàn)過多的分派單元,從而導(dǎo)致晶體管數(shù)量的增加 )。并且由于組長數(shù)量過多,因此導(dǎo)致了組員數(shù)量的減少。 NVIDIA顯卡基本上都是以大核心甚至 “巨核心 ”的形象出現(xiàn)在消費(fèi)者面前。也就是從 G80開始, NVIDIA徹底拋棄了傳統(tǒng)顯卡的 SIMD架構(gòu),和
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1