公司概況AMD(Advanced Micro Devices的英文縮寫,魏超半導體註:Advanced是高級的意思,Micro是微小的意思)字面上翻譯為高級微半導體,但AMD公司在中文裏給自己取名為魏超半導體,所以也可以叫超微半導體。這裏用的官方說法是1969,總部在加州桑尼維爾。AMD專門為計算機、通信和消費電子行業設計和制造創新的微處理器、閃存和低功耗處理器解決方案。AMD致力於為技術用戶提供基於標準和以客戶為中心的解決方案,從企業、政府機構到個人消費者。其在CPU市場的份額僅次於英特爾。
AMD在全球設有業務辦事處,在美國、中國、德國、日本、馬來西亞、新加坡和泰國設有制造工廠,在全球主要城市設有銷售辦事處,員工超過654.38+0.6萬人。2004年,AMD的銷售額為50億美元。
AMD有超過70%的收入來自國際市場,是壹家真正的跨國公司。該公司在紐約證券交易所上市,代碼為AMD。
[編輯此段落]
在AMD的業務發展中,堅持“客戶導向和創新驅動”的理念,這是指導AMD所有業務運作的核心原則。
AMD為了更深入地了解客戶的需求,與客戶建立了成功的合作關系。AMD與技術領導者密切合作,開發下壹代解決方案,拓展全球市場,推廣AMD的品牌。我們還與壹些世界級的領導者建立了合作關系,他們克服艱巨的困難,依靠技術取得成功。
到目前為止,全球已有2000多家軟件和硬件開發商、原始設備制造商和分銷商宣布支持AMD64位技術。在福布斯全球2000強的100家公司中,超過75%都在使用AMD Opteron?處理器系統運行企業級應用,性能大幅提升。
[編輯此段落]
AMD的產品線計算產品
AMD為需要高性能計算和IT基礎設施的企業用戶提供了壹系列解決方案。
1981年,AMD 287 FPU,采用Intel 80287內核。產品的市場定位和性能與Intel 80287基本壹致。至今也是AMD。
公司唯壹生產的FPU產品非常罕見。
AMD 8080(1974),8085(1976),8086(1978),8088(1979),80186 (186)。產品的市場定位和性能與英特爾同名產品基本壹致。
AMD 386(1991年)微處理器,核心代碼P9,分為SX和DX,分別兼容Intel 80386SX和DX。AMD 386DX和Intel 386DX都是32位處理器。不同的是,AMD 386SX是完整的16位處理器,而Intel 386SX是準32位處理器——32位內部總線,16位外部處理器。AMD 386DX的性能和Intel 80386DX差不多,是當時的主流產品之壹。AMD也開發了386 DE等基於386核心的嵌入式產品。
AMD 486DX(1993)微處理器,核心代碼P4,AMD設計生產的第壹代486產品。然後其他486級陸續推出。
常見的型號有:486DX2,核心代碼P24;;486DX4,核心代碼P24C;486SX2,核心碼P23等。其他的
衍生型號有486DE和486DXL2,比較少見。AMD 486的最高頻率為120MHz(DX4-120),這也是AMD首次在頻率上超越其強大的競爭對手英特爾。
AMD 5X86(1995)微處理器,核心代碼為X5,是AMD在486市場的利器。486時代後期,TI(德州儀器)推出高性價比的TI486DX2-80,迅速占領低端市場,Intel也推出了高端的奔騰系列。為了搶占市場空缺,AMD推出了5x86系列CPU(幾乎與Cyrix 5x86同時推出)。是486級產品,最高頻率——33 * 4,133MHz,0.35微米制造工藝,內置16KB壹級回寫緩存,性能直指奔騰75,功耗更低。
AMD K5(1997)微處理器,發布於1997。因為研發問題,它的上市時間比競爭對手英特爾的“經典奔騰”晚了很多,性能也不是很優秀。這款不成功的產品壹度讓AMD失去了不少市場份額。K5性能很壹般,整數運算能力不如Cyrix 6x86,但比“經典奔騰”略勝壹籌。浮點預算能力遠不及“經典奔騰”,但略勝Cyrix 6x86。綜合來看,K5是壹款實力壹般的產品,上市初期的低價比性能更能吸引消費者。此外,高端K5-RP200的產量非常小(慣例:),而且不在中國大陸銷售。
AMD K6(1997)處理器和Intel PentiumMMX是壹個檔次。是AMD收購了NexGen,整合進了當時的高級NexGen。
686技術之後的代表作。它還包含MMX指令集和64KB L1緩存,是奔騰MMX的兩倍大!總比率
相比較而言,K6是壹款成功的作品,但是在性能方面,浮點運算能力還是低於奔騰MMX。
K6-2(1998)系列微處理器曾經是AMD的拳頭產品,現在我們稱之為經典。為了擊敗競爭對手英特爾,AMD K6-2系列微處理器在K6的基礎上進行了大幅改進,其中最重要的是增加了“3DNow!”指令支持。“3DNow!”指令是X86系統的重大突破。這項技術的優勢在於,它大大增強了計算機的3D處理能力,為我們帶來了真正優秀的3D性能。當妳使用壹個為“3DNow!”在優化軟件的時候,可以發現K6-2的潛力有多大。而且K6-2大部分都是不鎖頻的,加上0.25微米制造工藝帶來的低發熱量,很容易超頻。也就是從K6-2開始,超頻不再是英特爾的專有名詞。同時,. k62也繼承了AMD的傳統,同頻機型價格比Intel產品低25%左右,市場銷量驚人。在推出之初,K6-2系列使用的名稱是“k63d”(“3D”的意思是“3DNow!”),直到正式上市才改名為“K6-2”。正因為如此,K6 3D大部分都是ES(少數官方版本,畢竟沒有量產:)。K6 3D曾經有壹款非標250MHz的產品,但是並沒有出現在官方的K6-2系列中。K6-2的最低頻率為200MHz,最高頻率為550MHz。
AMD在1999年2月推出了代號為“Sharptooth”的K6-3(1998)系列微處理器,這是AMD在超級架構和CPGA封裝上支持的最後壹款CPU。K6-3采用0.25微米制造工藝,集成256KB L2緩存(競爭對手英特爾新賽揚為128KB),運行於CPU主頻速度。Socket 7主板上的L2此時被K6-3自動識別為L3,這對於高頻CPU來說無疑是非常有優勢的,雖然K6-3的浮點運算還是差強人意。由於種種原因,K6-3投放市場後壹票難求,價格也不平易近人,甚至在更高級的K6-3+出現後也是如此。
AMD在2001和10推出了K8架構。雖然K8和K7使用相同數量的浮點調度窗口,但整數單位從K7的18擴展到24。此外,AMD還改進了K7的分支預測單元。相比Athlon,全局歷史計數器緩沖區(用於記錄CPU在壹定時間段內對數據的訪問情況,稱為全歷史計數緩沖區)大4倍,在分支調試前流水線可以容納更多的指令。AMD在整數調度方面的改進使得K8的流水線深度比速龍多了兩個級別。增加兩級導管深度的目的是增加K8的核心頻率。在K8,AMD增加了備份轉換緩沖區,以滿足Opteron在服務器應用程序中的巨大內存需求。
AMD在2007年下半年推出了K10架構。
K10架構的巴薩是四核,有4.63億個晶體管。Barcelona是AMD首款四核處理器,原生架構基於65nm制程技術。與Intel Kentsfield四核不同的是,Barcelona封裝的不是兩個雙核,而是真正的單芯片四核。
●巴薩新特點分析:引進SSE128新技術。
巴薩的壹個重要改進是AMD稱為“SSE128”的技術。在K8架構中,處理器可以並行處理兩條SSE指令,但SSE執行單元壹般只有64位帶寬。對於128位的SSE操作,K8處理器需要將其視為兩條64位指令。也就是說,在取壹條128位的SSE指令時,需要先解碼成兩個微操作,因此單條指令也占用了額外的解碼端口,降低了執行效率。
Barcelona將執行單元從64位拓寬到128位,因此所有128位SSE操作不再需要解碼分解成兩個64位操作,浮點調度器也可以支持這種128位SSE操作,提高了執行效率。
增加SSE指令執行單元的帶寬也會帶來壹些新的變化,也可以說是新的瓶頸:指令訪問帶寬。為了最大化並行處理器的解碼數量,Barcelona開始支持每時鐘周期32字節的指令訪問,而之前的K8架構只支持16字節。32字節的指令訪問帶寬不僅對處理器的SSE代碼有幫助,對整數指令也有效。
●巴薩新特點分析:記憶控制器再次加強。
當AMD將內存控制器集成到CPU中時,我們看到了壹個全新的強大的K8架構。如今,巴薩的內存控制器將在設計上再次大幅提升內存性能。
英特爾至強服務器中使用的所有FB-DIMM內存的壹個優點是,妳可以同時執行對AMB的讀寫命令,而在標準DDR2內存中,妳只能同時執行壹個操作,讀寫之間的切換將非常昂貴。如果是壹系列隨機混合執行,會帶來非常嚴重的資源浪費,而如果是先全部讀取再轉換為寫入,則可以避免性能的損失。K8內存控制器采用先讀後寫的策略來提高運行效率,但Barcelona更智能。
但讀取的數據會先存入緩沖區,而不是直接寫入,但當其容量達到極限時就會溢出。為了避免這種情況,需要在此之前進行讀寫切換,這樣也可以提高帶寬和延遲的效率。K8核心配備了單個內存控制器,寬度為128位,但在巴塞羅納,AMD將其分為兩個64位,每個控制器都可以獨立運行,因此可以帶來很多效率上的提升,尤其是在四核執行的環境下,每個核心都可以獨立占用內存訪問資源。
集成在Barcelonas中的北橋(註意不是主板北橋)也設計了更高的帶寬,更深的緩沖區會允許更高的帶寬利用率。同時,北橋本身已經可以使用未來的內存技術,比如DDR3。
內存控制器的預取功能是壹個應用廣泛且非常重要的功能。預取可以減少內存延遲對整體性能的負面影響。英偉達在發布nForce2主板時,主要介紹了nForce2芯片組的128位智能預取功能。當英特爾發布酷睿2處理器時,它還強調了內核架構的每個內核都有三個預取單元。
K8體系結構中的每個內核都有兩個預取器,壹個是指令預取器,另壹個是數據預取器。采用K8L架構的巴薩保持了2的數量,但是性能有了很大的提升。壹個明顯的改進是數據預取器直接在L1緩存中註冊數據。與K8架構中在L2緩存中註冊數據的方法相比,新的數據預取器具有更高的準確性和更快的速度,這將有利於內存性能和整體CPU性能。
●巴薩新特性解析:創新——三級緩存
受技術影響,AMD處理器的緩存容量壹直落後於英特爾。AMD自己也知道無法在珍貴的管芯上增加更多的晶體管來實現大容量緩存,但是創新的AMD找到了更好的辦法——集成內存控制器。
處理器集成內存控制器可以說是壹個傑作。集成了內存控制器的K8架構僅依靠512KB L2緩存就能擊敗對手奔騰4。直到現在,Athlon 64 X2仍然保持著2002年英特爾過時的512KB L2緩沖村。
現在Core 2有了4MB的L2緩存,看來Intel和AMD的緩存差距還會保持,因為巴薩的L2緩存還是512KB。相比之下,英特爾的四核Kentsfield芯片有8MB的L2緩存,而2007年底上市的新Penryn芯片將有12MB的L2緩存。
巴塞羅納的緩存系統在某種程度上類似於K8的架構。它的四個核心每個都有64KB L1高速緩存和512KB L2高速緩存。從簡化芯片設計的角度來說,四核* * *享受巨大的L2緩存並不適合K8L架構,所以AMD推出了L3緩存。得益於65納米工藝,Barcelona在壹個晶片上集成了四個內核,還集成了2MB三級高速緩存。也就是說L3緩存和四核原生在同壹個晶圓上,容量至少是2M。和L2緩存壹樣,L3緩存是獨立的,L1和L3緩存緩存的數據不會重復。
巴塞羅納緩存的工作原理是,L2緩存是L1緩存的備用空間。L1緩存存儲了CPU目前最需要的數據,當空間不足時,會將壹些不重要的數據轉移到L2緩存中。當將來再次需要它時,它將再次從L2緩存轉移到L1緩存。新增加的L3緩存繼續扮演L2緩存的角色,四個核心L2緩存臨時存儲L3緩存中的溢出數據。
L1緩存和L2緩存仍分別為2路和16路,L3緩存為32路。快速32路L3緩存不僅能更好地滿足多任務並行的要求,而且對單任務的執行也有積極的作用。特別是在3D應用中,2MB L3緩存將大大提升性能。