您好,歡迎進入深圳市穎特新科技有限公司官方網(wǎng)站!
Intel于1971年發(fā)售了自己的第一款4位微處理器,設計與ROM 4001,RAM 4002和移位寄存器4003配合工作。其中4004自身負責運算,其它部分則是使CPU正常工作的重要組成。大部分4004被用于計算器和其它類似的設備,而不是用在計算機中。它的最大頻率只有740KHz。4004的后繼產(chǎn)品是4040,實質上是4004的改進版本,增加了擴展指令集并提高了性能。
二.8008和8080(1972)
4004使得Intel成為了一家微處理器公司,為了適應潮流,Intel發(fā)布了新的8位處理器系列。8008,8080和8085分別于1972年,1974年和1975年發(fā)布。
盡管8008是第一款8位處理器,但是并沒有前任4004或者繼任者8080那么著名。借助于8位數(shù)據(jù)傳輸,它的性能比4004有所提升,但頻率依舊保守地定在200-800KHz之間,使用10微米工藝制造的8008的性能并沒有打動消費者們。
Intel的8080處理器則要成功的多,它增加了新的指令集并采用了6微米的制造工藝。這讓頻率幾乎翻了一番,1974年性能最高的8080達到了2MHz的頻率。8080被用到了大量的設備上去,這吸引了許多開發(fā)者,例如剛成立不久的微軟,投身到Intel處理器的軟件開發(fā)上。到8086發(fā)布的時候,它通過兼容8080來保持軟件兼容性。結果是8080系列處理器和其他的關鍵硬件遍布當時所有的X86微機系統(tǒng),8080的軟件可以在任何X86處理器上運行。8085是8080的低價高能版本,盡管很成功但影響力不大
8086:X86的起點(1978)
Intel的第一款16微處理器,相比于8080大有提升。不僅頻率更高,而且16位總線和其它附加硬件允許8086同時執(zhí)行兩條8位指令。它也能執(zhí)行更高效的16位任務,但此時大多數(shù)軟件是8位軟件,所以支持16位在多任務能力面前顯得不那么重要。地址總線則擴展到了20位,使得8086可以存取1MB的內(nèi)存,因而提高了性能。
8086是史上第一款X86處理器,使用第一版的X86指令集架構,這是日后AMD和Intel幾乎所有處理器的基石。
Intel與此同時也在生產(chǎn)8088處理器,這款處理器以8086為藍本,但是外部總線只有8位。因為依舊能訪問1MB內(nèi)存和運行在較高頻率,它比Intel的舊8位處理器性能快得多。
80186和80188(1980)
繼8086之后Intel發(fā)布了一些使用相似架構的16位處理器。首先是80186處理器,設計用于緩解使用80186 CPU成品機的制造壓力。Intel將一些原本在主板上的硬件移到了CPU中,包括時鐘發(fā)生器,中斷控制器和計時器,通過集成這些部分,80186比8086快上許多,Intel也通過提高時鐘頻率來提升性能
80188同樣集成了部分硬件,但是像8088那樣總線被限制為8位總線
80286:更多的內(nèi)存 更好的性能(1982)
80286和80186于同年發(fā)布,有著幾乎相同的特性,但是80286的地址總線擴展到了24位,使得最高能訪問16MB的內(nèi)存
iAPX 432(1981)
iAPX 432是Intel對于偏離X86的不同設計的一種嘗試。Intel希望 iAPX 432性能能夠更上一步,但因為一些設計上的缺陷,這款處理器最終以失敗告終。盡管X86處理器已經(jīng)很復雜了,iAPX 432則將CISC復雜度更上一層。芯片的設計過于龐雜,迫使Intel不得不把它做成分離的兩片芯片。處理器對于數(shù)據(jù)吞吐的龐大需求致使帶寬不足而性能表現(xiàn)不佳。它比8080和8086表現(xiàn)要好,但不敵后續(xù)的X86處理器,最終被放棄
i960:Intel的RICS初嘗試(1984)
Intel在1984年推出了自家的第一款RICS(精簡指令集)處理器,但它并不是設計與自家的X86處理器競爭,而是主要被用于嵌入式安全解決方案。它的內(nèi)部設計基于BerkeleyRISC 32位超標量設計概念。最初的i960處理器頻率非常低,低速模式僅僅有10MHz,但是經(jīng)過逐年改進和更先進的制程,它的最終頻率達到了100MHz。同樣支持4GB內(nèi)存,被廣泛應用于軍事系統(tǒng)和商業(yè)系統(tǒng)中
80386:X86的32位開端(1986)
Intel的第一款32位X86處理器是80386,于1985年發(fā)布。其中最關鍵的特性就是采用了32位地址總線最大支持4GB內(nèi)存,盡管這個數(shù)字比當時大多數(shù)人用的要大得多,但RAM的限制損害了早先X86處理器和它的競品的性能。與現(xiàn)代CPU不同的是,在80386時代,更多的RAM能夠直接轉化為性能的提升。Intel同時采用了一些架構改進來提升相同RAM大小的性能表現(xiàn)
為了讓產(chǎn)品線在價格上更加友好,Intel發(fā)布了80386SL,和32位的80386幾乎相同,不過限制了只能進行16位操作,不過它同樣支持最大4GB RAM,但只能運行16位應用
.i860(1989)
在1989年,Intel再次嘗試了非X86處理器,他們推出了全新的RICS處理器i860。不像早先的i960,這次的i860被設計用于直接在桌面級市場競爭,但是這次的設計問題繁多,它最明顯的缺陷是處理器的性能嚴重依賴于編譯器在軟件啟動時將指令編排好順序,這雖然幫助Intel將芯片尺寸縮小,復雜度降低,但是在編譯過程中將指令從頭到尾正確排序幾乎是不可能的,最終導致了處理過程中的高延遲
80486:整合浮點運算(1989)
80486是CPU性能史上的又一里程碑,它成功的關鍵在于在CPU中整合更多的元件。80486上第一次出現(xiàn)了一級緩存,早期的80486封裝了8KB緩存,使用1000nm制程。不過隨著制程發(fā)展到600nm,一級緩存增加到了16KB
此外,Intel還整合了FPU(浮點運算單元),在此之前一直作為一個分離的處理單元。通過將FPU整合進CPU,它們之間的延遲大大降低。80486還使用了更快的FSB接口來提升帶寬和其它技術來提升性能。這些改進顯著提高了80486的性能。
最初的80486時鐘頻率為50MHz,后來的采用600nm制程的型號達到了100MHz。在消費領域還發(fā)布了80486SX,移除了FPU部分
P5:最初的Pentium(奔騰)(1993)
最初的Pentium CPU在1993年發(fā)布,但沒有沿用80X86的命名方式。Pentium采用了P5架構,這是Intel在X86 CPU首次采用超標量技術(注:這與我們現(xiàn)在常提到的超線程技術不同),盡管全面超越了80486,但最突出的進步是改進了FPU。
最初的Pentium FPU性能達到80486的十倍,在接下來推出的Pentium MMX中這一特點更加顯著,它和最初的Pentium處理器架構相同,但新的MMX SIMD指令集令性能大幅提升
Intel同樣提升了一級緩存的大小,Pentium提升到16KB,Pentium MMX提升到32KB。當然頻率也在提升,最初的Pentium使用800nm制程,運行在60MHz,但在之后的版本中,采用250nm的Pentium達到了300MHz的頻率
P6架構:Pentium Pro(奔騰 Pro)(1995)
Intel計劃在Pentium之后迅速推出基于P6架構的Pentium Pro系列,但是遇到了技術問題。借助于Out-of-Order(無序執(zhí)行指令)設計,Pentium Pro的性能大大提高。最顯著的特性是其內(nèi)部有一個將指令分解為微指令的架構,隨后送到通用執(zhí)行單元。此外還采用了典型的14級流水線結構
最初的目標是面向服務器市場,將地址總線提升至32位并且增加了PAE(物理地址擴展),使得最大能支持到64GB RAM,這遠超一般消費者的需求,但大容量內(nèi)存支持對服務器市場來說很重要
緩存系統(tǒng)也得到了改進,一級緩存使用在2片8KB高速緩存,一片存取指令,一片存取數(shù)據(jù)。為了彌補和Pentium MMX 16KB緩存的差距,Intel采用了從256KB到1MB大小不等的二級緩存,以與CPU相連的單獨芯片形式封裝在CPU中,它與CPU通過BSB總線相連
Intel原來打算把Pentium Pro推向消費者市場,不過最終只在服務器市場銷售,Pentium Pro帶來了幾種革命性改進,但是表現(xiàn)難以在Pentium和Pentium MMX面前脫穎而出,后兩者在16位操作下性能優(yōu)異,而那時軟件市場還是16位的天下,同時由于缺乏對于MMX指令集的支持,結果導致Pentium Pro在MMX指令集優(yōu)化軟件下表現(xiàn)不佳
PentiumPro或許會在消費級市場站住腳,但是由于分離的輔助芯片(包括二級緩存)導致造價依舊昂貴。最快的Pentium Pro處理器能達到200MHz,制造工藝為500nm和350nm
P6架構: Pentium II(奔騰II)(1997-1999)
Intel沒有放棄P6架構,1997年Pentium II發(fā)布。Pentium II幾乎一掃所有Pentium Pro的缺陷。它的底層架構和Pentium Pro相似,堅持使用14級流水線架構和一些增強核心來改善性能。一級緩存由16KB數(shù)據(jù)緩存和16KB指令緩存
Intel還選擇通過使用低價緩存芯片和更大的硅片封裝來降低成本,這兩種方法對于降低產(chǎn)品價格非常奏效,但是這些存儲模塊不能與CPU的速度相匹配,因此二級緩存只有一半的速率,在早期的CPU中這些方法對于提升性能異常有效
Intel同時增加了對于MMX指令集的支持,Pentium II使用的核心代號分別為"Klamath"和 "Deschutes",同時也作為Xeon和PentiumII Overdrive系列產(chǎn)品在服務器市場出售,最高端的型號擁有頻率450MHz容量512KB二級緩存
P6:Pentium III和1 GHz競賽(1999-2003)
Intel打算使用代號為Netburst 架構的CPU來接替PentiumII ,但是事與愿違,新架構處于難產(chǎn)。因而Intel繼續(xù)壓榨P6架構推出了Pentium III處理器
第一款產(chǎn)品代號為Katmai,它與Pentium II非常相似,同樣使用了只有一半CPU時鐘頻率的二級緩存。底層架構包括了一些其他的顯著變化, 14級流水線的一些部分被融合在一起,縮短至10級流水線。得益于流水線的改進和時鐘頻率提高,Pentium III性能小幅度超越Pentium II
Katmai使用250nm工藝,但是隨著制造工藝演進到180nm,Intel得以大幅度提升Pentium III的性能。代號Coppermine的處理器將二級緩存集成到CPU,并且削減了一半容量(降至256KB),但因為與CPU保持同速,性能表現(xiàn)搶眼
Coppermine是Intel在1GHz大戰(zhàn)中面對AMD Athlon的競品,Intel成功地將頻率提升到1.13GHz,但是在隨后發(fā)現(xiàn)不能以此頻率穩(wěn)定運行因而被召回了,這使得1GHz的型號成為最快的Pentium III
最后的Pentium III核心代號為Tualatin,采用130nm制程,頻率達到1.4GHz,二級緩存擴容至512KB,一定程度提高了性能
P5和P6架構 Celeron(賽揚)和Xeon(志強)
在發(fā)布Pentium II的同時Intel也發(fā)布了Celeron和Xeon系列,這系列產(chǎn)品和Pentium II或是之后的Pentium III擁有相同的核心,只是緩存大小不同。第一款基于PentiumII的賽揚處理器沒有二級緩存,結果性能表現(xiàn)糟糕。而基于Pentium III的賽揚處理器擁有對應產(chǎn)品的一半的緩存。結果是使用Coppermine核心的賽揚處理器只有128KB二級緩存,隨后的Tualatin核心產(chǎn)品增加到了256KB
這些一半緩存的衍生品被稱作Coppermine-128和Tualatin-256,Intel以媲美Pentium III的頻率售賣這些CPU,讓他們擁有良好的性能表現(xiàn)來和AMD的Duron處理器相對抗。例如微軟在Xbox游戲機上使用的就是733MHz的Coppermine-128處理器
第一款Xeon處理器也很類似,不過擁有更大的二級緩存,基于PentiumII的Xeon處理器至少有512KB的緩存,高端型號能達到2MB
Netburst架構: Pentium 4 Willamette(威廉)和Northwood(北木)(2000-2004)
時間來到2000年,Intel的Netburst架構終于準備就緒,推向市場的產(chǎn)品就是Pentium 4,這樣的組合本該讓Intel在之后的6年里在CPU市場獨領風騷。首先發(fā)布的是代號Willamette的產(chǎn)品,領跑Pentium 4最初的兩年。盡管新品在性能上勉強超過PentiumIII,但這段時間Intel麻煩不斷。Netburst 架構的特點是流水線長頻率高(注:堆了多達20級的流水線),Willamette的頻率高達2GHz,但1.4GHz的Pentium III在某些任務中表現(xiàn)竟然優(yōu)于Willamette處理器。結果這一時期AMD的Athlon處理器的良好表現(xiàn)使其獨領風騷
在高端領域Intel推出了超線程技術來改善多任務下的資源利用問題,那時的超線程技術不像現(xiàn)在Core i7那樣高效,但還是能夠在一定程度上提高性能
Willamette和Northwood同樣出現(xiàn)在Celeron和Xeon系列里,像上代產(chǎn)品一樣,Intel通過調整二級緩存大小來區(qū)別性能
P6: Pentium-M(奔騰M)(2003-2008)
高性能的Netburst發(fā)熱量巨大,將其用于筆記本表現(xiàn)不佳。因而2003年Intel發(fā)布了旗下第一次為筆記本設計的專用架構。Pentium-M基于P6架構,采用12-14級可變流水線,這也是Intel第一款可變流水線長度處理器,意味著如果需要的數(shù)據(jù)已經(jīng)讀取到緩存中,指令只需經(jīng)過12級流水線就可以執(zhí)行完畢,如果沒有則再經(jīng)過額外的2級流水線來讀取數(shù)據(jù)
首款處理器采用130nm工藝,包含1MB二級緩存。主頻達到1.8GHz而功耗只有24.5W。2004年發(fā)布的名為Dothan的后繼型號,采用90nm工藝,擁有2MB二級緩存和更多的輔助核心,改善了IPC。最終達到2.27GHz主頻和僅僅27W的功耗
Netburst: Prescott(2004-2008)
Northwood在2002年至2004年作為Netburst 架構的主力,在這之后Intel發(fā)布了Prescott架構帶來了巨大的提升,使用90nm工藝,二級緩存增至1MB,全新的LGA 775接口,支持DDR2內(nèi)存,新的FSB。使得Prescott相較于northwood有了更大的帶寬,極大地提高了Netburst架構的性能。Prescott同時也是第一款64位X86 CPU,能夠支持更大的RAM
Prescott本應是Intel處理器家族中的皇冠,可結果是慘敗。Intel再次狂堆至31級流水線(注:包括前端處理)Intel希望通過提高頻率來抵消長流水線的弊端,但是只達到了3.8GHz。Prescott 發(fā)熱量巨大,功耗過高。Intel寄希望于90nm制程能解決這一問題,結果是增加的晶體管密度致使散熱更加困難。因為頻率沒有達到預期,Prescott的“革命性”改進成效
Netburst: Pentium D(奔騰D)(2005-2008)
2005年,雙核處理器之戰(zhàn)打響。AMD率先發(fā)布了自己的雙核產(chǎn)品Athlon 64,但只是畫了張大餅。Intel匆忙推出基于MCM( multi-coremodule)的雙核產(chǎn)品迎戰(zhàn),并將其命名為Pentium D,核心代號Smithfield
事與愿違,Pentium D處理器飽受批評,因為它有著和Prescott一樣的問題。兩片基于Netburst架構的芯片發(fā)熱巨大、能耗驚人,頻率則最多只有3.2GHz。因為帶寬上的不足,Smithfield的IPC性能大打折扣,而同時期AMD的單芯雙核處理器則非常成功
Smithfield的繼任者是Presler架構,采用新的65nm工藝,由兩片CederMill芯片封裝而成。改善了發(fā)熱和功耗,并且頻率提升至3.8GHz
Presler有兩點重要改進,一是將TDP從125W降至95W。二是歸功于更小的芯片尺寸,二級緩存幾乎翻了一倍,達到了2MB。一些發(fā)燒級型號使用了超線程技術,允許CPU同時執(zhí)行4線程。
改頭換面:Core 2(2006-2011)
Intel最終放棄了Netburst架構轉而采用和P6、Pentium-M類似的設計。他們終于意識到P6的設計是高效可行的。Intel重新設計了核心架構,新架構采用14級流水,明顯比Prescott的31級要少得多
Core 2系列具有很高的可擴展性,Intel推出了從TDP只有5W的移動型號到130W的高端型號,其中Intel售出的大部分是Core 2 Duo(雙核)和Core 2 Quad(四核)的產(chǎn)品,不過也有Core Solo、Celeron,Pentium和Xeon系列產(chǎn)品。四核產(chǎn)品是將兩個單芯雙核芯片封裝在一起,單核產(chǎn)品則由雙核屏蔽而成,配置的二級緩存從512KB到12MB不等
隨著核心架構的改進,Intel終于可以與AMD一較高下,PC DIY市場也進入了新的黃金時代
Bonnell架構: Silverthorne 和Diamondville(2008)
Core 2處理器廣受歡迎,但Intel需要一些價格低廉的產(chǎn)品來攻占低端市場,于是Atom誕生了。芯片大小僅有26平方毫米,不及Core 2的四分之一
Intel并沒有選擇完全重新設計Atom Bonnell架構,而是選擇借助P5架構的基礎。第一款Atom芯片,核心代號Silverthorne,TDP僅有3W,讓它能夠在無法使用Core 2的地方發(fā)揮功用。Silverthrone的IPC性能毫無亮點,不過還是能夠達到2.13GHz頻率。配有512KB二級緩存,不過這兩者對于彌補較低的IPC沒有太大幫助。不過Silverthrone的低價還是物有所值
接替Sliverthorne的是Diamondville,頻率降低至1.67GHz,增加64位支持,改善了面對64位軟件的性能表現(xiàn)
.Nehalem:第一款Core i7(2008)
隨著高端處理器市場的競爭白熱化,Intel決心不能坐以待斃。他們重新設計了Nehalem架構。包括重新設計的緩存控制器,每核心二級緩存降至256KB,增加4-12MB不等的三級緩存(所有核心共享)。Nehalem產(chǎn)品線包括單核到四核,采用45nm工藝
Intel還重新設計CPU和系統(tǒng)其它部分的總線,從19世紀80年代起一直采用的FSB總線終于壽終正寢,取而代之的的是全新的QPI和DMI。Intel同時將內(nèi)存控制器和PCIe控制器一并集成到了CPU中,這項舉措增加了帶寬的同時降低了延遲
Intel再一次增加了處理器的流水線,這次是20-24浮動,頻率沒有任何提升。同時也是Intel第一款采用睿頻技術的處理器。盡管最高頻率是3.33GHz,不過可以短時運行在3.6GHz。
最后一項主要特性是Nehalem標志著超線程技術的回歸,得益于這項技術和其它改進,Nehalem與Core 2相比在滿負載情況下性能最高能提高一倍
Bonnell:Pineview和Cedarview(2009)
2009年,Intel發(fā)布了兩款新的基于Bonnell架構的Atom處理器。第一款代號為Pineview,依舊采用45nm制程,采用集成部分原屬于主板的組件的方法來提升性能,包括集成顯卡和內(nèi)存控制器,并且降低了功耗和發(fā)熱。使用MCM(Multi-Chip Module)技術的雙Pineview核心版本也有發(fā)售
.Westmere:核顯的開端(2010)
Intel使用32nm工藝重做了Nehalem并命名為Westmere,它的底層架構沒有太多變化,但是通過制程帶來的進步,Intel可以在CPU中塞下更多的東西,Westere堆至10核心以及多達30MB的三級緩存
集成在其中的核顯架構類似GMA 4500,除了前者多出了兩個EU,頻率從低端CPU的166MHz到高端CPU的900MHz
盡管32nm的CPU和45nm的北橋沒有完全融合在一起,不過還是封裝在一塊基板上,這有助于減低CPU和北橋中的內(nèi)存控制器的通信延遲。API的支持上和GMA系列沒有太大變化,但是性能提高了50%
Sandy Bridge(2011)
SandyBridge架構完成了性能上的巨大飛躍,流水線重新縮減為14-19級,采用了新的微指令緩存能夠存儲至多1500條微指令,當微指令全部進入緩存時可以繞過多出的5級流水,如若沒有則執(zhí)行完整的19級流水
此外還有一些其他改進,包括支持DDR3內(nèi)存,更多的組件集成到CPU中,所有部分集成在一個芯片中,這些子系統(tǒng)由一條高帶寬的總線連接在一起
此外還更新了核顯,改變了上代產(chǎn)品一款核顯打天下的思路,這次發(fā)布了三種型號的核顯,最高端的是12EU的HD Graphics 3000,時鐘頻率可達1.35GHz。中端型號為HDGraphics 2000,縮至6EU。低端型號也是6EU,但閹割了一些額外功能
Bonnell: Cedarview(2011)
2011年Intel發(fā)布新的Atom處理器,通過縮小核心來改善IPC性能,但事實上收效甚微
Cedarview的兩項重大舉措就是采用32nm工藝和頻率提升至2.13GHz,同時得益于改進后的內(nèi)存控制器,可以支持頻率更高的DDR3內(nèi)存
Ivy Bridge(2012)
Sandy Bridge產(chǎn)品的后繼者是Ivy Bridge系列產(chǎn)品,是Intel Tick-Tock戰(zhàn)略中的Tick+產(chǎn)品。IvyBridge的IPC性能僅比SandyBridge好上一點,但是帶來了一些其他的亮點
Ivy Bridge最大的亮點是能耗,采用22nm的工藝降低了發(fā)熱,上代i7產(chǎn)品的典型TDP為95W,而這代產(chǎn)品降至77W。這對于移動端意義非凡,使得移動端四核CPU僅有35W的TDP,而此前移動端四核CPU的TDP為45W
.Haswell(2013)
Intel在IvyBridge發(fā)布后僅一年發(fā)布了新的Haswell架構,這次僅僅能算上是進步而不是革新。AMD此時在高端產(chǎn)品無法與Intel抗衡,所以Intel繼續(xù)擠牙膏,Haswell與Ivy Bridge相比僅提高10%左右
和IvyBridge系列類似,Haswell最大的吸引力在于能耗和iGPU,Hsawell在CPU中集成了電壓管理模塊,使CPU能夠有更好的能耗表現(xiàn),但問題是電壓管理模塊導致CPU發(fā)熱更大
與此同時為了與AMD的APU抗衡,Intel在高端iGPU中集成了40組EU,同時通過增加128MB L4 eDRAM緩存,大幅提高iGPU性能
Broadwell(2014)
Intel的下一代架構的核心代號為Broadwell,采用14nm制程,為移動端而設計,于2014年發(fā)布。首個Broadwell產(chǎn)品是Core M,雙核超線程CPU,TDP僅有3-6W
但是在桌面市場,幾乎難見Broadwell的身影,僅在2015年中期發(fā)布寥寥幾款產(chǎn)品,但集成了Intel史上最強核顯,包括48組EU單元,128MB L4 eDRAM緩存,解決了核顯的帶寬問題,在游戲性能的測試中,表現(xiàn)優(yōu)于AMD最快的APU
Skylake(2015)
在Broadwell桌面端發(fā)布后不久,Intel發(fā)布了下一代產(chǎn)品Skylake架構,盡管這是Intel至今最強的CPU,不過平臺的變化可以說比CPU本身更重要
首先是支持DDR4內(nèi)存,能夠比DDR3內(nèi)存提高更高的帶寬,還有全新的DMI 3.0總線,升級的PCIe控制器和支持更多的設備連接
同時iGPU也得到了升級,最高端型號為Iris Pro Graphics 580(Skylake-R系列),包含72組EU和128 MB L4 eDRAM緩存,但大部分CPU搭載的是包含24組EU的核顯,其架構與上代Broad架構相似
上一篇:局部變量與全局變量
下一篇:函數(shù)的遞歸調用