【正文】
M MX 指令集 MMX(Multi Media eXtension,多媒體擴(kuò)展指令集 ) 指令集是Intel 公司于 1 9 96 年推出的一項(xiàng)多 媒體指令增強(qiáng)技術(shù)。 二、 S SE 指令集 SSE(Streaming SIMD Extensions,單指令多數(shù)據(jù)流擴(kuò)展 )指令集是Intel 在 Pentium Ⅲ 處理器中率 先推出的。 S SE 指令集包括了 70 條指令, 其中包含提高 3D 圖形運(yùn)算效率的 50 條 SIMD(單指令多數(shù)據(jù)技術(shù) )浮點(diǎn)運(yùn)算指令、 12 條 MMX 整數(shù)運(yùn)算增強(qiáng)指令、 8 條優(yōu)化內(nèi)存中連續(xù)數(shù)據(jù)塊傳輸指令。 三、 3D Now !指令集 由 AMD 公司提出的 3DNow!指令集應(yīng)該說(shuō)出現(xiàn)在 SSE 指令集之前,并被 AMD 廣泛應(yīng)用于其 K62 、 K6 3 以及 A t h l o n (K 7)處理器上。早期的 C PU 處理器采用的大 多是 微米制造工藝。晶體管越做越小,能耗自然也就隨之降低, C PU 也可 以更省電。 二、封裝方式 —— Socket 架構(gòu)是主流 S E C C2 封裝、 F C P GA 封裝、 BGA 封裝 。 再來(lái)看看 Slot 系列的 Slot 1 和 Slot A 。雖然從外觀上看 S l o t A 與 S l o t 1 十分相像,但 是由于它們的電氣性能不同,兩者并不兼容。封裝方式的改變表面上看只是外形上的變化,其實(shí)不然,技術(shù)、成本 和消費(fèi)者最關(guān)心的最終價(jià)格與 C PU 的封裝方式可以說(shuō)是密不可分的,因此大家在關(guān)注 C PU 性能的同 時(shí),千萬(wàn)不要忽視了 C PU 的封裝技術(shù)。到了 S l o t 1 時(shí)代, P e n t i u m Ⅱ 處理器的緩存封裝方式與舊的 S o c k e t 7 架構(gòu)完全不同, L 2 C a c he 開(kāi)始做到了處理器上,并以處理器速度一半的頻率工作,這便是 I n t el 引以為榮的雙獨(dú)立 總線結(jié)構(gòu)。 而在新一代 CPU 技術(shù)中,緩存技術(shù)得到了更進(jìn)一步的發(fā)展,如 A M D D u r o n(鉆龍,俗稱(chēng)毒龍 )處理器 的L2 Cache 已為 6 4 KB, L1 Cache 高達(dá) 1 2 8 KB,高端的 Thunderbird(雷鳥(niǎo) )處理器更是達(dá)到了 128KBL1 Cache 和 256KB L2 Cache 的高速緩存。而 V IA 的 Cyrix Ⅲ 處理器則同時(shí)支持 Intel 的 M MX 和 AMD 的3DNow!多媒體指令集。從外形上分析, 采用 μm 工藝制造的Coppermine 芯片的內(nèi)核尺寸進(jìn)一步縮小,雖然內(nèi)部集成了 256KB 的全速 On D i e L 2 C a c he,內(nèi)建 2 8 10 萬(wàn)個(gè)晶體管,但其尺寸卻只有1 0 6 mm 2 。 從技術(shù)的角度分析,新一代 C o p p e r m i ne 處理器具有兩大特點(diǎn) :一是封裝形式的變化。 作 為 新 一 代 處 理 器 , Coppermine 強(qiáng) 勁 的 高 速OnDie L2 Cache 值得稱(chēng)道,而且 P Ⅲ Coppermine 的可超頻性也是非常出色 的。當(dāng)前 只有一款芯片組宣布支持 Tualatin,它就是 A l m a d or 或者被稱(chēng)之為 i 8 30 。 3 .C e l e r o n Ⅱ 處理器 為了進(jìn)一步擴(kuò)大在低端市場(chǎng)的占領(lǐng)份額, 2 0 00 年 3 月 Intel 終于發(fā)布了其代號(hào)為 “C o p p e r m i n e 1 28 ”的新一代的 Celeron 處理器——Celeron Ⅱ (Intel 仍稱(chēng)其為 Celeron,但 為了和前面的 C e l e r on 區(qū)分,我們暫 且這樣稱(chēng)呼 )。 二 是 功 耗 方 面 。而 66MHz 外 頻的 Celeron Ⅱ 與 100MHz 外頻的P Ⅲ Coppermine 相比, 也就注定了其要在性能方面犧牲更多。正是由于高性能的二級(jí)緩存和低功耗, C e l e r o n Ⅱ 同樣也具有良好的超頻性能。該處理器采用了不同于 P6 總線的 全新 N e t B u r st 架構(gòu),其管線長(zhǎng)度是 P6 架構(gòu)的兩倍,達(dá)到了 20 級(jí)。不過(guò),隨著 P e n t i u m 4 速度的提升,這一現(xiàn)象會(huì)逐漸消失。P e n t i u m 4 的算術(shù) 邏輯單元 (A L U)以核心頻率的兩倍運(yùn)行。其中最容易被關(guān)注到的變化就是它的新系統(tǒng)總線。 但 Pentium 4 的二級(jí)緩存每線為128 字節(jié),并分成 2 個(gè)等量的 64 字節(jié)。過(guò)去在 P e n t i u m Ⅲ 或 A t h l on 處理器中,都有一級(jí)指令緩存。 另外 Pentium 4 新加有硬件預(yù)取的機(jī)制。 Pentium Ⅲ 的流水線 工位有 10 個(gè), A t h l on 為 11 個(gè),而P e n t i u m 4 不少于 20 個(gè)。 I n t el 聲稱(chēng) 用了這個(gè)單元后,可減少 P e n t i u m Ⅲ 3 3%的預(yù)測(cè)失敗。快 速執(zhí) 行引擎 無(wú)法 處理 的指令 ,將 被送 到唯 一的S l o w A LU 處處 理。其中重要的改進(jìn)包括引入新的數(shù)據(jù)格式, 比如 128 位 SIMD 整數(shù)運(yùn)算和 64 位雙精度浮點(diǎn)運(yùn)算等 。加入流式單指令多數(shù)據(jù)擴(kuò)展技術(shù)的第二版棗 SSE2 。 其余的新特性包括兩組雙速 ALU 及 AGU 。 Pentium 4 的流水線能保留多達(dá) 126 個(gè)將要被執(zhí)行指令,其中最多可包含 48 個(gè)載入及 24 個(gè)存儲(chǔ)運(yùn) 算。在應(yīng)用大量 的有 規(guī)則數(shù)據(jù)情況下比如矩陣, P e n t i u m 4 的硬件預(yù)取功能將大幅加速執(zhí)行效能。糟糕的是某些 x 86 指令非常復(fù) 雜,因此解碼過(guò)程可能會(huì)阻塞整個(gè)執(zhí)行管道,同時(shí)這些指令中的部分重復(fù)頻率很高,常常剛解碼一 次后又需要再次解碼。 一級(jí)緩存方面, P e n t i u m 4 僅有 8 KB 的一級(jí)數(shù)據(jù)緩存,沒(méi)有指令緩存 ,這樣便于降低一級(jí)的延遲,采用 4 路聯(lián)合方式,并使用64 字節(jié)的緩存管道。 明 顯 超 過(guò)AMD Thunderbird 處理器 266MHz(133MHz 2)率。 Intel 預(yù)計(jì)P e n t i u m 4 將于 2021 年下半年占其 C PU 總產(chǎn)量的一半,并采用 μm 銅工藝制造。最初版本的核心頻 率為 1 .4 G Hz 和 ,內(nèi)部集成了 8 KB 一級(jí)數(shù)據(jù)緩存 和 2 5 6 KB 同速二級(jí)緩存 (I n t el 稱(chēng)之為 L2 超 級(jí) 傳 輸 緩 存 ) , 帶 寬 大 于 , 大 大 超 過(guò)Pentium Ⅲ 1GHz 處理器的 1 6 G B /s ?,F(xiàn)在的 P e n t i u m Ⅲ 處理器由于管線長(zhǎng)度的限制,最高時(shí)鐘頻率在 左右, P e n t i u m Ⅲ 1 .1 3 G Hz 處 理器出現(xiàn)的問(wèn)題就是最好的證明。新一代的 P e n t i u m 4 處理器即原先研發(fā)代號(hào)為W i l l a m e t te 的 W i l ly 芯片,是 I n t el 公 司繼 C o p p e r m i ne 處理器之后推出的面向普通用戶(hù)的主流產(chǎn)品。 但是,糟糕的 66MHz 外頻可能會(huì)是 Celeron Ⅱ 最終不敵 A MD 同型產(chǎn)品的致命之處,不過(guò)如果將其與老 C e l e r on 放在一起,其實(shí)還是我們要求太高了。三是外頻方面。 從技術(shù)角度分析, C e l e r o n Ⅱ 與 P Ⅲ C o p p e r m i ne 有著 諸多明顯的區(qū)別 : 一是 Celeron Ⅱ 的 L2 Cache 容量只是P Ⅲ C o p p e r m i ne 處 理 器 的 一 半 , 并 且 縮 減P Ⅲ C o p p e r m i ne 的 8 路緩存通道為 4 路 ,延遲 時(shí)間 也由P Ⅲ Coppermine 的 0 變成了 2 。從時(shí)間表上看這兩款處理器都在 2 0 01 年三季度發(fā)布。其核心技術(shù)大致如下:最 初時(shí)鐘頻率應(yīng)該是 1 .1 3 /1 .2 6 G Hz;內(nèi)核集成 512KB 二級(jí)緩存;采用 新的總線結(jié)構(gòu);封裝結(jié)構(gòu)上采用 F C P G A2 替換F C P GA 。C o p p e r m i ne 處理器全部采用了 μm 制造工藝,其核心工作電壓降到了 1. 6 5 V (S E C C 2)和 1 .6 V (F C P G A),與傳統(tǒng)的 P Ⅲ 相比大大降低了電能的消耗和發(fā)熱量。 E 系列的 C o p p e r m i ne 處理器采用了0 .18 μm 工藝制 造,同時(shí)應(yīng)用了 I n t el 公司新一代 O n D ie 全速2 5 6 K B L 2 C a c h e。盡 管 Intel 公司早在 1 9 99 年 10 月 25 日便發(fā)布了這款代號(hào)為 Coppermine 的 Pentium Ⅲ 處理器,但其真 正的普及是在 2 0 00 年。 四、指令集 —— M M X 、 S S E 和 3DNow !唱主角 2021 年的主流 CPU 產(chǎn)品似乎更關(guān)注于在硬件技術(shù)上的 推陳出新,并沒(méi)有在 C PU 指令集方面出更多的新招。 后來(lái) AMD 在其 S u p e r 7 平臺(tái)的最后一款產(chǎn)品 K63 中首次使用了三級(jí)緩存技術(shù),它包括一個(gè)全速 6 4 K B L 1 C a c he,一個(gè)內(nèi)部全速 256KB L2 Cache , 還 有 主 板 上 運(yùn) 行 在 100MHz 頻 率 下 的L 3 C a c he 。與處理器相關(guān)的緩存一般分為兩種 :L1 Cache(片內(nèi)緩存 )和 L2 Cache(二級(jí)緩存 )。 S o c k e t A 接 口 的 大 小 與S o c k e t 7 和 S o c k e t 3 70 類(lèi)似,但其接口在整體的布局 中缺了一些針腳,這就是為了防止在將 S o c k e t 3 70 處理器插入插槽時(shí)發(fā)生意外的錯(cuò)誤。除了接口方式不同外, S l o t 1 所支持的特性與 S u p e r 7 系統(tǒng)沒(méi)有太大的差別。以 市場(chǎng)上最常見(jiàn)的 S o c k et 系列為例,主流的F C P GA 封裝對(duì)應(yīng)的自然是 S o c k e t 3 70 接口,這種插腳接 口是一種方形的多針角零插拔力插座,插座上有一根拉桿,在安裝和更換C PU 時(shí)只要將拉桿向上拉 出,就可以輕易地插進(jìn)或取出 CPU 芯片了。銅導(dǎo)線技術(shù)與鋁導(dǎo)線技術(shù)相比,優(yōu) 勢(shì)在于導(dǎo)電性能更佳,發(fā)熱量更小,可以有效提高 C PU 芯片的穩(wěn)定性。從 P Ⅲ C o p p e r m i n e(銅礦 )處理器開(kāi)始,采用 微米制造工藝的 C PU 開(kāi)始出現(xiàn)。 與 Intel 公司的 M MX 技術(shù)側(cè)重于整數(shù)運(yùn)算有所不同, 3DNow!指令集主要針對(duì)三維建模、坐標(biāo)變換 和效果渲染等三維應(yīng)用場(chǎng)合,在軟件的配合下,可以大幅度提高 3D 處理性能。 S SE 指令與 3 D N o w!指令彼此互不兼容,但 SSE 包含了 3 D N o w!技術(shù)的絕大 部分功能,只是 實(shí)現(xiàn)的方法不同。究其背景,原來(lái) “K NI ”指令集是 I n t el 公司最早為其下一代 芯片命名的指令集名稱(chēng),而所謂的 “M M X2 ”則完全是硬件評(píng)論家們和媒體憑感覺(jué)和印象對(duì) “KNI ”的 評(píng)價(jià), I n t el 公司從未正式發(fā)布過(guò)關(guān)于 M M X2 的消息。 M MX 的益處在于 ,當(dāng)時(shí)存在的操作系統(tǒng)不必為此而做出任何修改便可以輕松地執(zhí)行M MX 程序。一 旦其最終狀態(tài)能被確定,指令便可返回到其正常順序并保持永久的機(jī)器狀態(tài)。 通過(guò)提前判讀并執(zhí)行有可能需要的程序指令的方式提高執(zhí)行速度。這個(gè)技術(shù)可加速向處理器傳送任務(wù)。動(dòng)態(tài)處理并 不是簡(jiǎn)單執(zhí)行一串指令,而是通過(guò) 操作數(shù)據(jù)來(lái)提高處理器的工作效率。 十、采用回寫(xiě) (Write Back)結(jié)構(gòu)的高速緩存 采用回寫(xiě)結(jié)構(gòu)的高速緩存對(duì)讀和寫(xiě)操作均有效,速度較快 。 九、 L1 高速緩存 L1 高速緩存也就是大家經(jīng)常說(shuō)到的一級(jí)高速緩存。 4 86 以后的 C PU 一般都內(nèi)置了數(shù)學(xué) 協(xié)處理器,功能也不再局限于增強(qiáng)浮點(diǎn)運(yùn)算,含有內(nèi)置數(shù)學(xué)協(xié)處理器的 C PU,可以加快特定類(lèi)型的 數(shù)值計(jì)算,某些需要進(jìn)行復(fù)雜計(jì)算的軟件系統(tǒng),如高版本的A u t o C AD 就需要數(shù)學(xué)協(xié)處理器支持。 五、地址總線寬度 應(yīng)當(dāng)說(shuō)地址總線寬度決定了 C PU 可以訪問(wèn)的物理地址空間,換句話說(shuō)就是 C PU 到底能夠使 用多大 容量的內(nèi)存。平時(shí)用戶(hù)打開(kāi)電腦機(jī)箱時(shí),總可以看見(jiàn)一些插槽般的東西,這些東西又叫做擴(kuò)展 槽,上面可以插顯卡、聲卡之類(lèi)的功能模塊,而擴(kuò)展總線 就是 C PU 用以聯(lián)系這些設(shè)備的橋梁。由于內(nèi)存和CPU 之間的運(yùn)行速度或多或少會(huì)有差異,因此便出現(xiàn)了二級(jí)緩存, 來(lái)協(xié)調(diào)兩者之間的差異。三者有十分密切的關(guān)系 :主頻 =外頻 倍頻。一 般說(shuō)來(lái),主頻越高,一個(gè)時(shí)鐘周期里完成的指令數(shù)也越多,當(dāng)然C PU 的速度也就越 快了。 硬件工程師培訓(xùn)教程(六) 第三節(jié) CPU 的相關(guān)指標(biāo) 在深入了解了 C PU 的架構(gòu)和生產(chǎn)過(guò)程后,接下來(lái)我們看看C PU 的工作原理和相關(guān)指標(biāo)。目前常用的是 SDRAM 插槽,有 168 個(gè)引腳。 PCI 插槽的工作頻率為 33