【正文】
其中重要的改進(jìn)包括引入新的數(shù)據(jù)格式, 比如 128 位 SIMD 整數(shù)運(yùn)算和 64 位雙精度浮點(diǎn)運(yùn)算等 。加入流式單指令多數(shù)據(jù)擴(kuò)展技術(shù)的第二版棗 SSE2 ???速執(zhí) 行引擎 無法 處理 的指令 ,將 被送 到唯 一的S l o w A LU 處處 理。 其余的新特性包括兩組雙速 ALU 及 AGU 。 I n t el 聲稱 用了這個(gè)單元后,可減少 P e n t i u m Ⅲ 3 3%的預(yù)測失敗。 Pentium 4 的流水線能保留多達(dá) 126 個(gè)將要被執(zhí)行指令,其中最多可包含 48 個(gè)載入及 24 個(gè)存儲(chǔ)運(yùn) 算。 Pentium Ⅲ 的流水線 工位有 10 個(gè), A t h l on 為 11 個(gè),而P e n t i u m 4 不少于 20 個(gè)。在應(yīng)用大量 的有 規(guī)則數(shù)據(jù)情況下比如矩陣, P e n t i u m 4 的硬件預(yù)取功能將大幅加速執(zhí)行效能。 另外 Pentium 4 新加有硬件預(yù)取的機(jī)制。糟糕的是某些 x 86 指令非常復(fù) 雜,因此解碼過程可能會(huì)阻塞整個(gè)執(zhí)行管道,同時(shí)這些指令中的部分重復(fù)頻率很高,常常剛解碼一 次后又需要再次解碼。過去在 P e n t i u m Ⅲ 或 A t h l on 處理器中,都有一級(jí)指令緩存。 一級(jí)緩存方面, P e n t i u m 4 僅有 8 KB 的一級(jí)數(shù)據(jù)緩存,沒有指令緩存 ,這樣便于降低一級(jí)的延遲,采用 4 路聯(lián)合方式,并使用64 字節(jié)的緩存管道。 但 Pentium 4 的二級(jí)緩存每線為128 字節(jié),并分成 2 個(gè)等量的 64 字節(jié)。 明 顯 超 過AMD Thunderbird 處理器 266MHz(133MHz 2)率。其中最容易被關(guān)注到的變化就是它的新系統(tǒng)總線。 Intel 預(yù)計(jì)P e n t i u m 4 將于 2021 年下半年占其 C PU 總產(chǎn)量的一半,并采用 μm 銅工藝制造。P e n t i u m 4 的算術(shù) 邏輯單元 (A L U)以核心頻率的兩倍運(yùn)行。最初版本的核心頻 率為 1 .4 G Hz 和 ,內(nèi)部集成了 8 KB 一級(jí)數(shù)據(jù)緩存 和 2 5 6 KB 同速二級(jí)緩存 (I n t el 稱之為 L2 超 級(jí) 傳 輸 緩 存 ) , 帶 寬 大 于 , 大 大 超 過Pentium Ⅲ 1GHz 處理器的 1 6 G B /s 。不過,隨著 P e n t i u m 4 速度的提升,這一現(xiàn)象會(huì)逐漸消失?,F(xiàn)在的 P e n t i u m Ⅲ 處理器由于管線長度的限制,最高時(shí)鐘頻率在 左右, P e n t i u m Ⅲ 1 .1 3 G Hz 處 理器出現(xiàn)的問題就是最好的證明。該處理器采用了不同于 P6 總線的 全新 N e t B u r st 架構(gòu),其管線長度是 P6 架構(gòu)的兩倍,達(dá)到了 20 級(jí)。新一代的 P e n t i u m 4 處理器即原先研發(fā)代號(hào)為W i l l a m e t te 的 W i l ly 芯片,是 I n t el 公 司繼 C o p p e r m i ne 處理器之后推出的面向普通用戶的主流產(chǎn)品。正是由于高性能的二級(jí)緩存和低功耗, C e l e r o n Ⅱ 同樣也具有良好的超頻性能。 但是,糟糕的 66MHz 外頻可能會(huì)是 Celeron Ⅱ 最終不敵 A MD 同型產(chǎn)品的致命之處,不過如果將其與老 C e l e r on 放在一起,其實(shí)還是我們要求太高了。而 66MHz 外 頻的 Celeron Ⅱ 與 100MHz 外頻的P Ⅲ Coppermine 相比, 也就注定了其要在性能方面犧牲更多。三是外頻方面。 二 是 功 耗 方 面 。 從技術(shù)角度分析, C e l e r o n Ⅱ 與 P Ⅲ C o p p e r m i ne 有著 諸多明顯的區(qū)別 : 一是 Celeron Ⅱ 的 L2 Cache 容量只是P Ⅲ C o p p e r m i ne 處 理 器 的 一 半 , 并 且 縮 減P Ⅲ C o p p e r m i ne 的 8 路緩存通道為 4 路 ,延遲 時(shí)間 也由P Ⅲ Coppermine 的 0 變成了 2 。 3 .C e l e r o n Ⅱ 處理器 為了進(jìn)一步擴(kuò)大在低端市場的占領(lǐng)份額, 2 0 00 年 3 月 Intel 終于發(fā)布了其代號(hào)為 “C o p p e r m i n e 1 28 ”的新一代的 Celeron 處理器——Celeron Ⅱ (Intel 仍稱其為 Celeron,但 為了和前面的 C e l e r on 區(qū)分,我們暫 且這樣稱呼 )。從時(shí)間表上看這兩款處理器都在 2 0 01 年三季度發(fā)布。當(dāng)前 只有一款芯片組宣布支持 Tualatin,它就是 A l m a d or 或者被稱之為 i 8 30 。其核心技術(shù)大致如下:最 初時(shí)鐘頻率應(yīng)該是 1 .1 3 /1 .2 6 G Hz;內(nèi)核集成 512KB 二級(jí)緩存;采用 新的總線結(jié)構(gòu);封裝結(jié)構(gòu)上采用 F C P G A2 替換F C P GA 。 作 為 新 一 代 處 理 器 , Coppermine 強(qiáng) 勁 的 高 速OnDie L2 Cache 值得稱道,而且 P Ⅲ Coppermine 的可超頻性也是非常出色 的。C o p p e r m i ne 處理器全部采用了 μm 制造工藝,其核心工作電壓降到了 1. 6 5 V (S E C C 2)和 1 .6 V (F C P G A),與傳統(tǒng)的 P Ⅲ 相比大大降低了電能的消耗和發(fā)熱量。 從技術(shù)的角度分析,新一代 C o p p e r m i ne 處理器具有兩大特點(diǎn) :一是封裝形式的變化。 E 系列的 C o p p e r m i ne 處理器采用了0 .18 μm 工藝制 造,同時(shí)應(yīng)用了 I n t el 公司新一代 O n D ie 全速2 5 6 K B L 2 C a c h e。從外形上分析, 采用 μm 工藝制造的Coppermine 芯片的內(nèi)核尺寸進(jìn)一步縮小,雖然內(nèi)部集成了 256KB 的全速 On D i e L 2 C a c he,內(nèi)建 2 8 10 萬個(gè)晶體管,但其尺寸卻只有1 0 6 mm 2 。盡 管 Intel 公司早在 1 9 99 年 10 月 25 日便發(fā)布了這款代號(hào)為 Coppermine 的 Pentium Ⅲ 處理器,但其真 正的普及是在 2 0 00 年。而 V IA 的 Cyrix Ⅲ 處理器則同時(shí)支持 Intel 的 M MX 和 AMD 的3DNow!多媒體指令集。 四、指令集 —— M M X 、 S S E 和 3DNow !唱主角 2021 年的主流 CPU 產(chǎn)品似乎更關(guān)注于在硬件技術(shù)上的 推陳出新,并沒有在 C PU 指令集方面出更多的新招。 而在新一代 CPU 技術(shù)中,緩存技術(shù)得到了更進(jìn)一步的發(fā)展,如 A M D D u r o n(鉆龍,俗稱毒龍 )處理器 的L2 Cache 已為 6 4 KB, L1 Cache 高達(dá) 1 2 8 KB,高端的 Thunderbird(雷鳥 )處理器更是達(dá)到了 128KBL1 Cache 和 256KB L2 Cache 的高速緩存。 后來 AMD 在其 S u p e r 7 平臺(tái)的最后一款產(chǎn)品 K63 中首次使用了三級(jí)緩存技術(shù),它包括一個(gè)全速 6 4 K B L 1 C a c he,一個(gè)內(nèi)部全速 256KB L2 Cache , 還 有 主 板 上 運(yùn) 行 在 100MHz 頻 率 下 的L 3 C a c he 。到了 S l o t 1 時(shí)代, P e n t i u m Ⅱ 處理器的緩存封裝方式與舊的 S o c k e t 7 架構(gòu)完全不同, L 2 C a c he 開始做到了處理器上,并以處理器速度一半的頻率工作,這便是 I n t el 引以為榮的雙獨(dú)立 總線結(jié)構(gòu)。與處理器相關(guān)的緩存一般分為兩種 :L1 Cache(片內(nèi)緩存 )和 L2 Cache(二級(jí)緩存 )。封裝方式的改變表面上看只是外形上的變化,其實(shí)不然,技術(shù)、成本 和消費(fèi)者最關(guān)心的最終價(jià)格與 C PU 的封裝方式可以說是密不可分的,因此大家在關(guān)注 C PU 性能的同 時(shí),千萬不要忽視了 C PU 的封裝技術(shù)。 S o c k e t A 接 口 的 大 小 與S o c k e t 7 和 S o c k e t 3 70 類似,但其接口在整體的布局 中缺了一些針腳,這就是為了防止在將 S o c k e t 3 70 處理器插入插槽時(shí)發(fā)生意外的錯(cuò)誤。雖然從外觀上看 S l o t A 與 S l o t 1 十分相像,但 是由于它們的電氣性能不同,兩者并不兼容。除了接口方式不同外, S l o t 1 所支持的特性與 S u p e r 7 系統(tǒng)沒有太大的差別。 再來看看 Slot 系列的 Slot 1 和 Slot A 。以 市場上最常見的 S o c k et 系列為例,主流的F C P GA 封裝對(duì)應(yīng)的自然是 S o c k e t 3 70 接口,這種插腳接 口是一種方形的多針角零插拔力插座,插座上有一根拉桿,在安裝和更換C PU 時(shí)只要將拉桿向上拉 出,就可以輕易地插進(jìn)或取出 CPU 芯片了。 二、封裝方式 —— Socket 架構(gòu)是主流 S E C C2 封裝、 F C P GA 封裝、 BGA 封裝 。銅導(dǎo)線技術(shù)與鋁導(dǎo)線技術(shù)相比,優(yōu) 勢在于導(dǎo)電性能更佳,發(fā)熱量更小,可以有效提高 C PU 芯片的穩(wěn)定性。晶體管越做越小,能耗自然也就隨之降低, C PU 也可 以更省電。從 P Ⅲ C o p p e r m i n e(銅礦 )處理器開始,采用 微米制造工藝的 C PU 開始出現(xiàn)。早期的 C PU 處理器采用的大 多是 微米制造工藝。 與 Intel 公司的 M MX 技術(shù)側(cè)重于整數(shù)運(yùn)算有所不同, 3DNow!指令集主要針對(duì)三維建模、坐標(biāo)變換 和效果渲染等三維應(yīng)用場合,在軟件的配合下,可以大幅度提高 3D 處理性能。 三、 3D Now !指令集 由 AMD 公司提出的 3DNow!指令集應(yīng)該說出現(xiàn)在 SSE 指令集之前,并被 AMD 廣泛應(yīng)用于其 K62 、 K6 3 以及 A t h l o n (K 7)處理器上。 S SE 指令與 3 D N o w!指令彼此互不兼容,但 SSE 包含了 3 D N o w!技術(shù)的絕大 部分功能,只是 實(shí)現(xiàn)的方法不同。 S SE 指令集包括了 70 條指令, 其中包含提高 3D 圖形運(yùn)算效率的 50 條 SIMD(單指令多數(shù)據(jù)技術(shù) )浮點(diǎn)運(yùn)算指令、 12 條 MMX 整數(shù)運(yùn)算增強(qiáng)指令、 8 條優(yōu)化內(nèi)存中連續(xù)數(shù)據(jù)塊傳輸指令。究其背景,原來 “K NI ”指令集是 I n t el 公司最早為其下一代 芯片命名的指令集名稱,而所謂的 “M M X2 ”則完全是硬件評(píng)論家們和媒體憑感覺和印象對(duì) “KNI ”的 評(píng)價(jià), I n t el 公司從未正式發(fā)布過關(guān)于 M M X2 的消息。 二、 S SE 指令集 SSE(Streaming SIMD Extensions,單指令多數(shù)據(jù)流擴(kuò)展 )指令集是Intel 在 Pentium Ⅲ 處理器中率 先推出的。 M MX 的益處在于 ,當(dāng)時(shí)存在的操作系統(tǒng)不必為此而做出任何修改便可以輕松地執(zhí)行M MX 程序。 一、 M MX 指令集 MMX(Multi Media eXtension,多媒體擴(kuò)展指令集 ) 指令集是Intel 公司于 1 9 96 年推出的一項(xiàng)多 媒體指令增強(qiáng)技術(shù)。一 旦其最終狀態(tài)能被確定,指令便可返回到其正常順序并保持永久的機(jī)器狀態(tài)。這樣可使 P e n t i u m Ⅱ 處理器超級(jí)處理能力得到充分的發(fā)揮, 從而提升軟件性能。 通過提前判讀并執(zhí)行有可能需要的程序指令的方式提高執(zhí)行速度。處理器讀取經(jīng)過解碼的軟件指令,判 斷該指令能否處理或是否需與其他指令一道處理。這個(gè)技術(shù)可加速向處理器傳送任務(wù)。它預(yù)測下一條指令在內(nèi)存中位置的精確度可以達(dá)到驚人的 9 0%以上。動(dòng)態(tài)處理并 不是簡單執(zhí)行一串指令,而是通過 操作數(shù)據(jù)來提高處理器的工作效率。 十一、動(dòng)態(tài)處理 動(dòng)態(tài)處理是應(yīng)用在高能奔騰處理器中的新技術(shù),創(chuàng)造性地把 3 項(xiàng)專為提高處理器對(duì)數(shù)據(jù)的操作效 率而設(shè)計(jì)的技術(shù)融合在一起。 十、采用回寫 (Write Back)結(jié)構(gòu)的高速緩存 采用回寫結(jié)構(gòu)的高速緩存對(duì)讀和寫操作均有效,速度較快 。內(nèi)置的 L1 高速緩存的容量和結(jié)構(gòu)對(duì) C PU 的性能影響較大,容量越大,性 能也相對(duì)會(huì)提高不少,這也正是一些公司力爭加大 L1 高速緩存容量的原因。 九、 L1 高速緩存 L1 高速緩存也就是大家經(jīng)常說到的一級(jí)高速緩存。這在 486 或者以前的 CPU 上是很難想象的,只有 P e n t i um 級(jí)以上C PU 才具有這種超標(biāo)量結(jié)構(gòu)。 4 86 以后的 C PU 一般都內(nèi)置了數(shù)學(xué) 協(xié)處理器,功能也不再局限于增強(qiáng)浮點(diǎn)運(yùn)算,含有內(nèi)置數(shù)學(xué)協(xié)處理器的 C PU,可以加快特定類型的 數(shù)值計(jì)算,某些需要進(jìn)行復(fù)雜計(jì)算的軟件系統(tǒng),如高版本的A u t o C AD 就需要數(shù)學(xué)協(xié)處理器支持。 六、數(shù)據(jù)總線寬度 數(shù)據(jù)總線負(fù)責(zé)整個(gè)系統(tǒng)的數(shù)據(jù)流量的大小,而數(shù)據(jù)總線寬度則決定了 CPU 與二級(jí)高速緩存、