AMD是什么?

魏超半导体公司

公司概况AMD(Advanced Micro Devices的英文缩写,魏超半导体注:Advanced是高级的意思,Micro是微小的意思)字面上翻译为高级微半导体,但AMD公司在中文里给自己取名为魏超半导体,所以也可以叫超微半导体。这里用的官方说法是1969,总部在加州桑尼维尔。AMD专门为计算机、通信和消费电子行业设计和制造创新的微处理器、闪存和低功耗处理器解决方案。AMD致力于为技术用户提供基于标准和以客户为中心的解决方案,从企业、政府机构到个人消费者。其在CPU市场的份额仅次于英特尔。

AMD在全球设有业务办事处,在美国、中国、德国、日本、马来西亚、新加坡和泰国设有制造工厂,在全球主要城市设有销售办事处,员工超过654.38+0.6万人。2004年,AMD的销售额为50亿美元。

AMD有超过70%的收入来自国际市场,是一家真正的跨国公司。该公司在纽约证券交易所上市,代码为AMD。

[编辑此段落]

在AMD的业务发展中,坚持“客户导向和创新驱动”的理念,这是指导AMD所有业务运作的核心原则。

AMD为了更深入地了解客户的需求,与客户建立了成功的合作关系。AMD与技术领导者密切合作,开发下一代解决方案,拓展全球市场,推广AMD的品牌。我们还与一些世界级的领导者建立了合作关系,他们克服艰巨的困难,依靠技术取得成功。

到目前为止,全球已有2000多家软件和硬件开发商、原始设备制造商和分销商宣布支持AMD64位技术。在福布斯全球2000强的100家公司中,超过75%都在使用AMD Opteron?处理器系统运行企业级应用,性能大幅提升。

[编辑此段落]

AMD的产品线计算产品

AMD为需要高性能计算和IT基础设施的企业用户提供了一系列解决方案。

1981年,AMD 287 FPU,采用Intel 80287内核。产品的市场定位和性能与Intel 80287基本一致。至今也是AMD。

公司唯一生产的FPU产品非常罕见。

AMD 8080(1974),8085(1976),8086(1978),8088(1979),80186 (186)。产品的市场定位和性能与英特尔同名产品基本一致。

AMD 386(1991年)微处理器,核心代码P9,分为SX和DX,分别兼容Intel 80386SX和DX。AMD 386DX和Intel 386DX都是32位处理器。不同的是,AMD 386SX是完整的16位处理器,而Intel 386SX是准32位处理器——32位内部总线,16位外部处理器。AMD 386DX的性能和Intel 80386DX差不多,是当时的主流产品之一。AMD也开发了386 DE等基于386核心的嵌入式产品。

AMD 486DX(1993)微处理器,核心代码P4,AMD设计生产的第一代486产品。然后其他486级陆续推出。

常见的型号有:486DX2,核心代码P24;;486DX4,核心代码P24C;486SX2,核心码P23等。其他的

衍生型号有486DE和486DXL2,比较少见。AMD 486的最高频率为120MHz(DX4-120),这也是AMD首次在频率上超越其强大的竞争对手英特尔。

AMD 5X86(1995)微处理器,核心代码为X5,是AMD在486市场的利器。486时代后期,TI(德州仪器)推出高性价比的TI486DX2-80,迅速占领低端市场,Intel也推出了高端的奔腾系列。为了抢占市场空缺,AMD推出了5x86系列CPU(几乎与Cyrix 5x86同时推出)。是486级产品,最高频率——33 * 4,133MHz,0.35微米制造工艺,内置16KB一级回写缓存,性能直指奔腾75,功耗更低。

AMD K5(1997)微处理器,发布于1997。因为研发问题,它的上市时间比竞争对手英特尔的“经典奔腾”晚了很多,性能也不是很优秀。这款不成功的产品一度让AMD失去了不少市场份额。K5性能很一般,整数运算能力不如Cyrix 6x86,但比“经典奔腾”略胜一筹。浮点预算能力远不及“经典奔腾”,但略胜Cyrix 6x86。综合来看,K5是一款实力一般的产品,上市初期的低价比性能更能吸引消费者。此外,高端K5-RP200的产量非常小(惯例:),而且不在中国大陆销售。

AMD K6(1997)处理器和Intel PentiumMMX是一个档次。是AMD收购了NexGen,整合进了当时的高级NexGen。

686技术之后的代表作。它还包含MMX指令集和64KB L1缓存,是奔腾MMX的两倍大!总比率

相比较而言,K6是一款成功的作品,但是在性能方面,浮点运算能力还是低于奔腾MMX。

K6-2(1998)系列微处理器曾经是AMD的拳头产品,现在我们称之为经典。为了击败竞争对手英特尔,AMD K6-2系列微处理器在K6的基础上进行了大幅改进,其中最重要的是增加了“3DNow!”指令支持。“3DNow!”指令是X86系统的重大突破。这项技术的优势在于,它大大增强了计算机的3D处理能力,为我们带来了真正优秀的3D性能。当你使用一个为“3DNow!”在优化软件的时候,可以发现K6-2的潜力有多大。而且K6-2大部分都是不锁频的,加上0.25微米制造工艺带来的低发热量,很容易超频。也就是从K6-2开始,超频不再是英特尔的专有名词。同时,. k62也继承了AMD的传统,同频机型价格比Intel产品低25%左右,市场销量惊人。在推出之初,K6-2系列使用的名称是“k63d”(“3D”的意思是“3DNow!”),直到正式上市才改名为“K6-2”。正因为如此,K6 3D大部分都是ES(少数官方版本,毕竟没有量产:)。K6 3D曾经有一款非标250MHz的产品,但是并没有出现在官方的K6-2系列中。K6-2的最低频率为200MHz,最高频率为550MHz。

AMD在1999年2月推出了代号为“Sharptooth”的K6-3(1998)系列微处理器,这是AMD在超级架构和CPGA封装上支持的最后一款CPU。K6-3采用0.25微米制造工艺,集成256KB L2缓存(竞争对手英特尔新赛扬为128KB),运行于CPU主频速度。Socket 7主板上的L2此时被K6-3自动识别为L3,这对于高频CPU来说无疑是非常有优势的,虽然K6-3的浮点运算还是差强人意。由于种种原因,K6-3投放市场后一票难求,价格也不平易近人,甚至在更高级的K6-3+出现后也是如此。

AMD在2001和10推出了K8架构。虽然K8和K7使用相同数量的浮点调度窗口,但整数单位从K7的18扩展到24。此外,AMD还改进了K7的分支预测单元。相比Athlon,全局历史计数器缓冲区(用于记录CPU在一定时间段内对数据的访问情况,称为全历史计数缓冲区)大4倍,在分支调试前流水线可以容纳更多的指令。AMD在整数调度方面的改进使得K8的流水线深度比速龙多了两个级别。增加两级导管深度的目的是增加K8的核心频率。在K8,AMD增加了备份转换缓冲区,以满足Opteron在服务器应用程序中的巨大内存需求。

AMD在2007年下半年推出了K10架构。

K10架构的巴萨是四核,有4.63亿个晶体管。Barcelona是AMD首款四核处理器,原生架构基于65nm制程技术。与Intel Kentsfield四核不同的是,Barcelona封装的不是两个双核,而是真正的单芯片四核。

●巴萨新特点分析:引进SSE128新技术。

巴萨的一个重要改进是AMD称为“SSE128”的技术。在K8架构中,处理器可以并行处理两条SSE指令,但SSE执行单元一般只有64位带宽。对于128位的SSE操作,K8处理器需要将其视为两条64位指令。也就是说,在取一条128位的SSE指令时,需要先解码成两个微操作,因此单条指令也占用了额外的解码端口,降低了执行效率。

Barcelona将执行单元从64位拓宽到128位,因此所有128位SSE操作不再需要解码分解成两个64位操作,浮点调度器也可以支持这种128位SSE操作,提高了执行效率。

增加SSE指令执行单元的带宽也会带来一些新的变化,也可以说是新的瓶颈:指令访问带宽。为了最大化并行处理器的解码数量,Barcelona开始支持每时钟周期32字节的指令访问,而之前的K8架构只支持16字节。32字节的指令访问带宽不仅对处理器的SSE代码有帮助,对整数指令也有效。

●巴萨新特点分析:记忆控制器再次加强。

当AMD将内存控制器集成到CPU中时,我们看到了一个全新的强大的K8架构。如今,巴萨的内存控制器将在设计上再次大幅提升内存性能。

英特尔至强服务器中使用的所有FB-DIMM内存的一个优点是,你可以同时执行对AMB的读写命令,而在标准DDR2内存中,你只能同时执行一个操作,读写之间的切换将非常昂贵。如果是一系列随机混合执行,会带来非常严重的资源浪费,而如果是先全部读取再转换为写入,则可以避免性能的损失。K8内存控制器采用先读后写的策略来提高运行效率,但Barcelona更智能。

但读取的数据会先存入缓冲区,而不是直接写入,但当其容量达到极限时就会溢出。为了避免这种情况,需要在此之前进行读写切换,这样也可以提高带宽和延迟的效率。K8核心配备了单个内存控制器,宽度为128位,但在巴塞罗纳,AMD将其分为两个64位,每个控制器都可以独立运行,因此可以带来很多效率上的提升,尤其是在四核执行的环境下,每个核心都可以独立占用内存访问资源。

集成在Barcelonas中的北桥(注意不是主板北桥)也设计了更高的带宽,更深的缓冲区会允许更高的带宽利用率。同时,北桥本身已经可以使用未来的内存技术,比如DDR3。

内存控制器的预取功能是一个应用广泛且非常重要的功能。预取可以减少内存延迟对整体性能的负面影响。英伟达在发布nForce2主板时,主要介绍了nForce2芯片组的128位智能预取功能。当英特尔发布酷睿2处理器时,它还强调了内核架构的每个内核都有三个预取单元。

K8体系结构中的每个内核都有两个预取器,一个是指令预取器,另一个是数据预取器。采用K8L架构的巴萨保持了2的数量,但是性能有了很大的提升。一个明显的改进是数据预取器直接在L1缓存中注册数据。与K8架构中在L2缓存中注册数据的方法相比,新的数据预取器具有更高的准确性和更快的速度,这将有利于内存性能和整体CPU性能。

●巴萨新特性解析:创新——三级缓存

受技术影响,AMD处理器的缓存容量一直落后于英特尔。AMD自己也知道无法在珍贵的管芯上增加更多的晶体管来实现大容量缓存,但是创新的AMD找到了更好的办法——集成内存控制器。

处理器集成内存控制器可以说是一个杰作。集成了内存控制器的K8架构仅依靠512KB L2缓存就能击败对手奔腾4。直到现在,Athlon 64 X2仍然保持着2002年英特尔过时的512KB L2缓冲村。

现在Core 2有了4MB的L2缓存,看来Intel和AMD的缓存差距还会保持,因为巴萨的L2缓存还是512KB。相比之下,英特尔的四核Kentsfield芯片有8MB的L2缓存,而2007年底上市的新Penryn芯片将有12MB的L2缓存。

巴塞罗纳的缓存系统在某种程度上类似于K8的架构。它的四个核心每个都有64KB L1高速缓存和512KB L2高速缓存。从简化芯片设计的角度来说,四核* * *享受巨大的L2缓存并不适合K8L架构,所以AMD推出了L3缓存。得益于65纳米工艺,Barcelona在一个晶片上集成了四个内核,还集成了2MB三级高速缓存。也就是说L3缓存和四核原生在同一个晶圆上,容量至少是2M。和L2缓存一样,L3缓存是独立的,L1和L3缓存缓存的数据不会重复。

巴塞罗纳缓存的工作原理是,L2缓存是L1缓存的备用空间。L1缓存存储了CPU目前最需要的数据,当空间不足时,会将一些不重要的数据转移到L2缓存中。当将来再次需要它时,它将再次从L2缓存转移到L1缓存。新增加的L3缓存继续扮演L2缓存的角色,四个核心L2缓存临时存储L3缓存中的溢出数据。

L1缓存和L2缓存仍分别为2路和16路,L3缓存为32路。快速32路L3缓存不仅能更好地满足多任务并行的要求,而且对单任务的执行也有积极的作用。特别是在3D应用中,2MB L3缓存将大大提升性能。