cpu
目录
·cpu主要的性能指标 ·cpu的发展 ·cpu的厂商 ·cpu的内核
cpu是英语“central processing unit/中央处理器 ”的缩写,cpu一般由逻辑运算单元、控制单元和存储单元组成。在逻辑运算和控制单元中包括一些寄存器,这些寄存器用于cpu在处理数据过程中数据的暂时保存。
1.主频
主频也叫时钟频率,用来表示cpu内核工作的时钟频率(cpu clock speed),即cpu内数字脉冲信号震荡的速度。
2.外频
外频是cpu与主板之间同步运行的速度。
3.前端总线(fsb)频率
总线是将计算机微处理器与内存芯片以及与之通信的设备连接起来的硬件通道。前端总线将cpu连接到主内存和通向磁盘驱动器、调制解调器以及网卡这类系统部件的外设总线。人们常常以mhz表示的速度来描述总线频率。
前端总线(fsb)频率是直接影响cpu与内存直接数据交换速度。由于数据传输最大带宽取决于所有同时传输的数据的宽度和传输频率,即数据带宽=(总线频率×数据位宽)÷8。
4、cpu的位和字长
位:在数字电路和电脑技术中采用二进制,代码只有“0”和“1”,其中无论是 “0”或是“1”在cpu中都是 一“位”。
字长:电脑技术中对cpu在单位时间内(同一时间)能一次处理的二进制数的位数叫字长。所以能处理字长为8位数据的cpu通常就叫8位的cpu。同理32位的cpu就能在单位时间内处理字长为32位的二进制数据。字节和字长的区别:由于常用的英文字符用8位二进制就可以表示,所以通常就将8位称为一个字节。字长的长度是不固定的,对于不同的cpu、字长的长度也不一样。8位的cpu一次只能处理一个字节,而32位的cpu一次就能处理4个字节,同理字长为64位的cpu一次可以处理8个字节。
5.倍频系数
倍频系数是指cpu主频与外频之间的相对比例关系。在相同的外频下,倍频越高cpu的频率也越高。但实际上,在相同外频的前提下,高倍频的cpu本身意义并不大。这是因为cpu与系统之间数据传输速度是有限的,一味追求高倍频而得到高主频的cpu就会出现明显的“瓶颈”效应—cpu从系统中得到数据的极限速度不能够满足cpu运算的速度。一般除了工程样版的intel的cpu都是锁了倍频的,而amd之前都没有锁。
6.缓存
缓存大小也是cpu的重要指标之一,而且缓存的结构和大小对cpu速度的影响非常大,cpu内缓存的运行频率极高,一般是和处理器同频运作,工作效率远远大于系统内存和硬盘。实际工作时,cpu往往需要重复读取同样的数据块,而缓存容量的增大,可以大幅度提升cpu内部读取数据的命中率,而不用再到内存或者硬盘上寻找,以此提高系统性能。但是由于cpu芯片面积和成本的因素来考虑,缓存都很小。
l1 cache(一级缓存)是cpu第一层高速缓存,分为数据缓存和指令缓存。内置的l1高速缓存的容量和结构对cpu的性能影响较大,不过高速缓冲存储器均由静态ram组成,结构较复杂,在cpu管芯面积不能太大的情况下,l1级高速缓存的容量不可能做得太大。一般服务器cpu的l1缓存的容量通常在32—256kb。
l2 cache(二级缓存)是cpu的第二层高速缓存,分内部和外部两种芯片。内部的芯片二级缓存运行速度与主频相同,而外部的二级缓存则只有主频的一半。l2高速缓存容量也会影响cpu的性能,原则是越大越好,现在家庭用cpu容量最大的是512kb,而服务器和工作站上用cpu的l2高速缓存更高达256-1mb,有的高达2mb或者3mb。
l3 cache(三级缓存),分为两种,早期的是外置,现在的都是内置的。而它的实际作用即是,l3缓存的应用可以进一步降低内存延迟,同时提升大数据量计算时处理器的性能。降低内存延迟和提升大数据量计算能力对游戏都很有帮助。而在服务器领域增加l3缓存在性能方面仍然有显著的提升。比方具有较大l3缓存的配置利用物理内存会更有效,故它比较慢的磁盘i/o子系统可以处理更多的数据请求。具有较大l3缓存的处理器提供更有效的文件系统缓存行为及较短消息和处理器队列长度。
其实最早的l3缓存被应用在amd发布的k6-iii处理器上,当时的l3缓存受限于制造工艺,并没有被集成进芯片内部,而是集成在主板上。在只能够和系统总线频率同步的l3缓存同主内存其实差不了多少。后来使用l3缓存的是英特尔为服务器市场所推出的itanium处理器。接着就是p4ee和至强mp。intel还打算推出一款9mb l3缓存的itanium2处理器,和以后24mb l3缓存的双核心itanium2处理器。
但基本上l3缓存对处理器的性能提高显得不是很重要,比方配备1mb l3缓存的xeon mp处理器却仍然不是opteron的对手,由此可见前端总线的增加,要比缓存增加带来更有效的性能提升。
7.cpu扩展指令集
cpu依靠指令来计算和控制系统,每款cpu在设计时就规定了一系列与其硬件电路相配合的指令系统。指令的强弱也是cpu的重要指标,指令集是提高微处理器效率的最有效工具之一。从现阶段的主流体系结构讲,指令集可分为复杂指令集和精简指令集两部分,而从具体运用看,如intel的mmx(multi media extended)、sse、 sse2(streaming-single instruction multiple data-extensions 2)、see3和amd的3dnow!等都是cpu的扩展指令集,分别增强了cpu的多媒体、图形图象和internet等的处理能力。我们通常会把cpu的扩展指令集称为"cpu的指令集"。sse3指令集也是目前规模最小的指令集,此前mmx包含有57条命令,sse包含有50条命令,sse2包含有144条命令,sse3包含有13条命令。目前sse3也是最先进的指令集,英特尔prescott处理器已经支持sse3指令集,amd会在未来双核心处理器当中加入对sse3指令集的支持,全美达的处理器也将支持这一指令集。
8.cpu内核和i/o工作电压
从586cpu开始,cpu的工作电压分为内核电压和i/o电压两种,通常cpu的核心电压小于等于i/o电压。其中内核电压的大小是根据cpu的生产工艺而定,一般制作工艺越小,内核工作电压越低;i/o电压一般都在1.6~5v。低电压能解决耗电过大和发热过高的问题。
9.制造工艺
制造工艺的微米是指ic内电路与电路之间的距离。制造工艺的趋势是向密集度愈高的方向发展。密度愈高的ic电路设计,意味着在同样大小面积的ic中,可以拥有密度更高、功能更复杂的电路设计。现在主要的180nm、130nm、90nm。最近官方已经表示有65nm的制造工艺了。
10.指令集
(1)cisc指令集
cisc指令集,也称为复杂指令集,英文名是cisc,(complex instruction set computer的缩写)。在cisc微处理器中,程序的各条指令是按顺序串行执行的,每条指令中的各个操作也是按顺序串行执行的。顺序执行的优点是控制简单,但计算机各部分的利用率不高,执行速度慢。其实它是英特尔生产的x86系列(也就是ia-32架构)cpu及其兼容cpu,如amd、via 的。即使是现在新起的x86-64(也被成amd64)都是属于cisc的范畴。
要知道什么是指令集还要从当今的x86架构的cpu说起。x86指令集是intel为其第一块16位cpu(i8086)专门开发的,ibm1981年推出的世界第一台pc机中的cpu—i8088(i8086简化版)使用的也是x86指令,同时电脑中为提高浮点数据处理能力而增加了x87芯片,以后就将x86指令集和x87指令集统称为x86指令集。
虽然随着cpu技术的不断发展,intel陆续研制出更新型的i80386、i80486直到过去的pii至强、piii至强、pentium 3,最后到今天的pentium 4系列、至强(不包括至强nocona),但为了保证电脑能继续运行以往开发的各类应用程序以保护和继承丰富的软件资源,所以intel公司所生产的所有cpu仍然继续使用x86指令集,所以它的cpu仍属于x86系列。由于intel x86系列及其兼容cpu(如amd athlon mp、)都使用x86指令集,所以就形成了今天庞大的x86系列及兼容cpu阵容。x86cpu目前主要有intel的服务器cpu和amd的服务器cpu两类。
(2)risc指令集
risc是英文“reduced instruction set computing ” 的缩写,中文意思是“精简指令集”。它是在cisc指令系统基础上发展起来的,有人对cisc机进行测试表明,各种指令的使用频度相当悬殊,最常使用的是一些比较简单的指令,它们仅占指令总数的20%,但在程序中出现的频度却占80%。复杂的指令系统必然增加微处理器的复杂性,使处理器的研制时间长,成本高。并且复杂指令需要复杂的操作,必然会降低计算机的速度。基于上述原因,20世纪80年代risc型cpu诞生了,相对于cisc型cpu ,risc型cpu不仅精简了指令系统,还采用了一种叫做“超标量和超流水线结构”,大大增加了并行处理能力。risc指令集是高性能cpu的发展方向。它与传统的cisc(复杂指令集)相对。相比而言,risc的指令格式统一,种类比较少,寻址方式也比复杂指令集少。当然处理速度就提高很多了。目前在中高档服务器中普遍采用这一指令系统的cpu,特别是高档服务器全都采用risc指令系统的cpu。risc指令系统更加适合高档服务器的操作系统unix,现在linux也属于类似unix的操作系统。risc型cpu与intel和amd的cpu在软件和硬件上都不兼容。
目前,在中高档服务器中采用risc指令的cpu主要有以下几类:powerpc处理器、sparc处理器、pa-risc处理器、mips处理器、alpha处理器。
(3)ia-64
epic(explicitly parallel instruction computers,精确并行指令计算机)是否是risc和cisc体系的继承者的争论已经有很多,单以epic体系来说,它更像intel的处理器迈向risc体系的重要步骤。从理论上说,epic体系设计的cpu,在相同的主机配置下,处理windows的应用软件比基于unix下的应用软件要好得多。
intel 采用epic技术的服务器cpu是安腾itanium (开发代号即merced)。它是64位处理器,也是ia-64系列中的第一款。微软也已开发了代号为win64的操作系统,在软件上加以支持。在intel采用了x86指令集之后,它又转而寻求更先进的64-bit微处理器,intel这样做的原因是,它们想摆脱容量巨大的x86 isa架构,从而引入精力充沛而又功能强大的指令集,于是采用epic指令集的ia-64架构便诞生了。ia-64 在很多方面来说,都比x86有了长足的进步。突破了传统ia32架构的许多限制,在数据的处理能力,系统的稳定性、安全性、可用性、可观理性等方面获得了突破性的提高。
ia-64微处理器最大的缺陷是它们缺乏与x86的兼容,而intel为了ia-64处理器能够更好地运行两个朝代的软件,它在ia-64处理器上(itanium、itanium2 ……)引入了x86-to-ia-64的解码器,这样就能够把x86指令翻译为ia-64指令。这个解码器并不是最有效率的解码器,也不是运行x86代码的最好途径(最好的途径是直接在x86处理器上运行x86代码),因此itanium 和itanium2在运行x86应用程序时候的性能非常糟糕。这也成为x86-64产生的根本原因。
(4)x86-64 (amd64 / em64t)
amd公司设计,可以在同一时间内处理64位的整数运算,并兼容于x86-32架构。其中支持64位逻辑定址,同时提供转换为32位定址选项;但数据操作指令默认为32位和8位,提供转换成64位和16位的选项;支持常规用途寄存器,如果是32位运算操作,就要将结果扩展成完整的64位。这样,指令中有“直接执行”和“转换执行”的区别,其指令字段是8位或32位,可以避免字段过长。
x86-64(也叫amd64)的产生也并非空穴来风,x86处理器的32bit寻址空间限制在4gb内存,而ia-64的处理器又不能兼容x86。amd充分考虑顾客的需求,加强x86指令集的功能,使这套指令集可同时支持64位的运算模式,因此amd把它们的结构称之为x86-64。在技术上amd在x86-64架构中为了进行64位运算,amd为其引入了新增了r8-r15通用寄存器作为原有x86处理器寄存器的扩充,但在而在32位环境下并不完全使用到这些寄存器。原来的寄存器诸如eax、ebx也由32位扩张至64位。在sse单元中新加入了8个新寄存器以提供对sse2的支持。寄存器数量的增加将带来性能的提升。与此同时,为了同时支持32和64位代码及寄存器,x86-64架构允许处理器工作在以下两种模式:long mode(长模式)和legacy mode(遗传模式),long模式又分为两种子模式(64bit模式和compatibility mode兼容模式)。该标准已经被引进在amd服务器处理器中的opteron处理器。
而今年也推出了支持64位的em64t技术,再还没被正式命为em64t之前是ia32e,这是英特尔64位扩展技术的名字,用来区别x86指令集。intel的em64t支持64位sub-mode,和amd的x86-64技术类似,采用64位的线性平面寻址,加入8个新的通用寄存器(gprs),还增加8个寄存器支持sse指令。与amd相类似,intel的64位技术将兼容ia32和ia32e,只有在运行64位操作系统下的时候,才将会采用ia32e。ia32e将由2个sub-mode组成:64位sub-mode和32位sub-mode,同amd64一样是向下兼容的。intel的em64t将完全兼容amd的x86-64技术。现在nocona处理器已经加入了一些64位技术,intel的pentium 4e处理器也支持64位技术。
应该说,这两者都是兼容x86指令集的64位微处理器架构,但em64t与amd64还是有一些不一样的地方,amd64处理器中的nx位在intel的处理器中将没有提供。
11.超流水线与超标量
在解释超流水线与超标量前,先了解流水线(pipeline)。流水线是intel首次在486芯片中开始使用的。流水线的工作方式就象工业生产上的装配流水线。在cpu中由5—6个不同功能的电路单元组成一条指令处理流水线,然后将一条x86指令分成5—6步后再由这些电路单元分别执行,这样就能实现在一个cpu时钟周期完成一条指令,因此提高cpu的运算速度。经典奔腾每条整数流水线都分为四级流水,即指令预取、译码、执行、写回结果,浮点流水又分为八级流水。
超标量是通过内置多条流水线来同时执行多个处理器,其实质是以空间换取时间。而超流水线是通过细化流水、提高主频,使得在一个机器周期内完成一个甚至多个操作,其实质是以时间换取空间。例如pentium 4的流水线就长达20级。将流水线设计的步(级)越长,其完成一条指令的速度越快,因此才能适应工作主频更高的cpu。但是流水线过长也带来了一定副作用,很可能会出现主频较高的cpu实际运算速度较低的现象,intel的奔腾4就出现了这种情况,虽然它的主频可以高达1.4g以上,但其运算性能却远远比不上amd 1.2g的速龙甚至奔腾iii。
12.封装形式
cpu封装是采用特定的材料将cpu芯片或cpu模块固化在其中以防损坏的保护措施,一般必须在封装后cpu才能交付用户使用。cpu的封装方式取决于cpu安装形式和器件集成设计,从大的分类来看通常采用socket插座进行安装的cpu使用pga(栅格阵列)方式封装,而采用slot x槽安装的cpu则全部采用sec(单边接插盒)的形式封装。现在还有plga(plastic land grid array)、olga(organic land grid array)等封装技术。由于市场竞争日益激烈,目前cpu封装技术的发展方向以节约成本为主。
13、多线程
同时多线程simultaneous multithreading,简称smt。smt可通过复制处理器上的结构状态,让同一个处理器上的多个线程同步执行并共享处理器的执行资源,可最大限度地实现宽发射、乱序的超标量处理,提高处理器运算部件的利用率,缓和由于数据相关或cache未命中带来的访问内存延时。当没有多个线程可用时,smt处理器几乎和传统的宽发射超标量处理器一样。smt最具吸引力的是只需小规模改变处理器核心的设计,几乎不用增加额外的成本就可以显著地提升效能。多线程技术则可以为高速的运算核心准备更多的待处理数据,减少运算核心的闲置时间。这对于桌面低端系统来说无疑十分具有吸引力。intel从3.06ghz pentium 4开始,所有处理器都将支持smt技术。
14、多核心
多核心,也指单芯片多处理器(chip multiprocessors,简称cmp)。cmp是由美国斯坦福大学提出的,其思想是将大规模并行处理器中的smp(对称多处理器)集成到同一芯片内,各个处理器并行执行不同的进程。与cmp比较, smt处理器结构的灵活性比较突出。但是,当半导体工艺进入0.18微米以后,线延时已经超过了门延迟,要求微处理器的设计通过划分许多规模更小、局部性更好的基本单元结构来进行。相比之下,由于cmp结构已经被划分成多个处理器核来设计,每个核都比较简单,有利于优化设计,因此更有发展前途。目前,ibm 的power 4芯片和sun的 majc5200芯片都采用了cmp结构。多核处理器可以在处理器内部共享缓存,提高缓存利用率,同时简化多处理器系统设计的复杂度。
2005年下半年,intel和amd的新型处理器也将融入cmp结构。新安腾处理器开发代码为montecito,采用双核心设计,拥有最少18mb片内缓存,采取90nm工艺制造,它的设计绝对称得上是对当今芯片业的挑战。它的每个单独的核心都拥有独立的l1,l2和l3 cache,包含大约10亿支晶体管。
15、smp
smp(symmetric multi-processing),对称多处理结构的简称,是指在一个计算机上汇集了一组处理器(多cpu),各cpu之间共享内存子系统以及总线结构。在这种技术的支持下,一个服务器系统可以同时运行多个处理器,并共享内存和其他的主机资源。像双至强,也就是我们所说的二路,这是在对称处理器系统中最常见的一种(至强mp可以支持到四路,amd opteron可以支持1-8路)。也有少数是16路的。但是一般来讲,smp结构的机器可扩展性较差,很难做到100个以上多处理器,常规的一般是8个到16个,不过这对于多数的用户来说已经够用了。在高性能服务器和工作站级主板架构中最为常见,像unix服务器可支持最多256个cpu的系统。
构建一套smp系统的必要条件是:支持smp的硬件包括主板和cpu;支持smp的系统平台,再就是支持smp的应用软件。
为了能够使得smp系统发挥高效的性能,操作系统必须支持smp系统,如winnt、linux、以及unix等等32位操作系统。即能够进行多任务和多线程处理。多任务是指操作系统能够在同一时间让不同的cpu完成不同的任务;多线程是指操作系统能够使得不同的cpu并行的完成同一个任务。
要组建smp系统,对所选的cpu有很高的要求,首先、cpu内部必须内置apic(advanced programmable interrupt controllers)单元。intel 多处理规范的核心就是高级可编程中断控制器(advanced programmable interrupt controllers--apics)的使用;再次,相同的产品型号,同样类型的cpu核心,完全相同的运行频率;最后,尽可能保持相同的产品序列编号,因为两个生产批次的cpu作为双处理器运行的时候,有可能会发生一颗cpu负担过高,而另一颗负担很少的情况,无法发挥最大性能,更糟糕的是可能导致死机。
16、numa技术
numa即非一致访问分布共享存储技术,它是由若干通过高速专用网络连接起来的独立节点构成的系统,各个节点可以是单个的cpu或是smp系统。在numa中,cache 的一致性有多种解决方案,需要操作系统和特殊软件的支持。图2中是sequent公司numa系统的例子。这里有3个smp模块用高速专用网络联起来,组成一个节点,每个节点可以有12个cpu。像sequent的系统最多可以达到64个cpu甚至256个cpu。显然,这是在smp的基础上,再用numa的技术加以扩展,是这两种技术的结合。
17、乱序执行技术
乱序执行(out-of-orderexecution),是指cpu允许将多条指令不按程序规定的顺序分开发送给各相应电路单元处理的技术。这样将根据个电路单元的状态和各指令能否提前执行的具体情况分析后,将能提前执行的指令立即发送给相应电路单元执行,在这期间不按规定顺序执行指令,然后由重新排列单元将各执行单元结果按指令顺序重新排列。采用乱序执行技术的目的是为了使cpu内部电路满负荷运转并相应提高了cpu的运行程序的速度。分枝技术:(branch)指令进行运算时需要等待结果,一般无条件分枝只需要按指令顺序执行,而条件分枝必须根据处理后的结果,再决定是否按原先顺序进行。
18、cpu内部的内存控制器
许多应用程序拥有更为复杂的读取模式(几乎是随机地,特别是当cache hit不可预测的时候),并且没有有效地利用带宽。典型的这类应用程序就是业务处理软件,即使拥有如乱序执行(out of order execution)这样的cpu特性,也会受内存延迟的限制。这样cpu必须得等到运算所需数据被除数装载完成才能执行指令(无论这些数据来自cpu cache还是主内存系统)。当前低段系统的内存延迟大约是120-150ns,而cpu速度则达到了3ghz以上,一次单独的内存请求可能会浪费200-300次cpu循环。即使在缓存命中率(cache hit rate)达到99%的情况下,cpu也可能会花50%的时间来等待内存请求的结束- 比如因为内存延迟的缘故。
你可以看到opteron整合的内存控制器,它的延迟,与芯片组支持双通道ddr内存控制器的延迟相比来说,是要低很多的。英特尔也按照计划的那样在处理器内部整合内存控制器,这样导致北桥芯片将变得不那么重要。但改变了处理器访问主存的方式,有助于提高带宽、降低内存延时和提升处理器性能。
cpu从最初发展至今已经有二十多年的历史了,这期间,按照其处理信息的字长,cpu可以分为:四位微处理器、八位微处理器、十六位微处理器、三十二位微处理器以及六十四位微处理器等等。 1971年,早期的intel公司推出了世界上第一台微处理器4004,这便是第一个用于计算机的四位微处理器,它包含2300个晶体管,由于性能很差,其市场反应十分不理想。
随后,intel公司又研制出了8080处理器、8085处理器,加上当时motorola公司的mc6800微处理器和zilog公司的z80微处理器,一起组成了八位微处理器的家族。
十六位微处理器的典型产品是intel公司的8086微处理器,以及同时生产出的数学协处理器,即8087。这两种芯片使用互相兼容的指令集,但在8087指令集中增加了一些专门用于对数、指数和三角函数等数学计算指令,由于这些指令应用与8086和8087,因此被人们统称为x86指令集。此后intel推出的新一代的cpu产品,均兼容原来的x86指令。
1979年intel推出了8088芯片,它仍是十六位微处理器,内含29000个晶体管,时钟频率为4.77mhz,地址总线为20位,可以使用1mb内存。8088的内部数据总线是16位,外部数据总线是8位。1981年,8088芯片被首次用于ibm pc机当中,如果说8080处理器还不为各位所熟知的话,那么8088则可以说是家喻户晓了,个人电脑╠╠pc机的第一代cpu便是从它开始的。1982年的80286芯片虽然是16位芯片,但是其内部已包含13.4万个晶体管,时钟频率也达到了前所未有的20mhz。其内、外部数据总线均为16位,地址总线为24位,可以使用16mb内存,可使用的工作方式包括实模式和保护模式两种。
三十二位微处理器的代表产品首推intel公司1985年推出的80386,这是一种全三十二位微处理器芯片,也是x86家族中第一款三十二位芯片,其内部包含27.5万个晶体管,时钟频率为12.5mhz,后逐步提高到33mhz。80386的内部和外部数据总线都是32位,地址总线也是32位,可以寻址到4gb内存。它除了具有实模式和保护模式以外,还增加了一种虚拟86的工作方式,可以通过同时模拟多个8086处理器来提供多任务能力。1989年intel公司又推出准三十二位处理器芯片80386sx。它的内部数据总线为三十二位,与80386相同,外部数据总线为十六位。也就是说,80386sx的内部处理速度与80386接近,也支持真正的多任务操作,而它又可以接受为80286开发输入/输出接口芯片。80386sx的性能优于80286,而价格只是80386的三分之一。386处理器没有内置协处理器,因此不能执行浮点运算指令,如果您需要进行浮点运算时,必须额外购买昂贵的80387协处理器芯片。
八十年代末九十年代初,80486处理器面市,它集成了120万个晶体管,时钟频率由25mhz逐步提升到50mhz。80486是将80386和数学协处理器80387以及一个8kb的高速缓存集成在一个芯片内,并在x86系列中首次使用了risc(精简指令集)技术,可以在一个时钟周期内执行一条指令。它还采用了突发总线方式,大大提高了与内存的数据交换速度,由于这些改进,80486的性能比带有80387协处理器的80386提高了4倍。早期的486分为有协处理器的486dx和无协处理器的486sx两种,其价格也相差许多。随着芯片技术的不断发展,cpu的频率越来越快,而pc机外部设备受工艺限制,能够承受的工作频率有限,这就阻碍了cpu主频的进一步提高,在这种情况下,出现了cpu倍频技术,该技术使cpu内部工作频率为处理器外频的2-3倍,486dx2、486dx4的名字便是由此而来。
九十年代中期,全面超越486的新一代586处理器问世,为了摆脱486时代处理器名称混乱的困扰,最大的cpu制造商intel公司把自己的新一代产品命名为pentium(奔腾)以区别amd和cyrix的产品。amd和cyrix也分别推出了k5和6x86处理器来对付intel,但是由于奔腾处理器的性能最佳,intel逐渐占据了大部分市场。
此后cpu的发展情况不用我说想必大家都已经很了解了,97年初pentium mmx上市,年中pentium ii和amd k6上市,年末cyrix 6x86mx面市,98年更是“三足”鼎立,pii、赛扬、k6-2、mii杀得你死我活。自从推出pentium ii后,intel便放弃了逐渐老化的socket 7市场转而力推先进的slot 1架构,但是这一次intel却打错了主意,随着全球低于1000美元低价pc需求量的增长,amd的k6-2处理器填补了intel在这个低端领域的空白,agp总线技术、100mhz外频,这些原先只有在slot 1上才能实现的技术在amd首先倡导的super 7时代也实现了,虽然k6-2和super 7的性能比起同主频的pii来说还有差距,但是低廉的价格还是让amd抢得了将近30%的cpu零售市场份额。amd更是以一副不畏强者的姿态,博得了众多消费者的好感。
可惜到了99年,面对intel猛烈反扑,amd开始走下坡路,市场销量很糟。cyrix更是在这场处理器大战中一败涂地,本想依*ns(美国国家半导体公司)东山再起,无奈时机已晚,最终在六月份被芯片组厂商via(威盛)收购。
随后的idt和rise两家新杀入处理器市场的公司在技术的创新上以及市场定位上均有自己的独到之处,idt的winchip c6、winchip c6-2主要面向低端家用市场,rise的处理器则主要进军移动电脑领域。无奈生不逢时,在intel产品的挤压下,它们的日子也是举步为坚,99年年中,也正是cyrix被收购一个月以后,威盛又收购了idt公司,同时,rise也被另一家芯片组厂商sis(矽统科技)收购,随后传出rise退出pc处理器市场,主攻家电处理芯片市场的消息,这样,经过重新调整之后,pc处理器市场呈现新三足鼎立的局面:intel凭借自己优秀的产品以及良好的市场运作继续占领大部分市场份额;amd则通过8月份发布的athlon—k7打了个漂亮的翻身仗,k7成为历史上首次性能全面超越intel同类产品的最快处理器,其市场占有率有进一步扩大的趋势;威盛在收购cyrix和idt之后,集成两家公司的最新技术,计划在2000年初推出socket370兼容的joshua—约书亚处理器,主攻低端市场。1999年2月底,intel公司发布了采用katmai核心的新一代处理器-pⅢ。该处理器采用0.25微米工艺制造,内部集成了950万个晶体管。由于第一代pⅢ处理器性能不如amd公司发布的k7 athlon处理器,intel公司于1999年底推出了第二代pⅢ,给予coppermine结构,采用0.18微米工艺制造,核心频率达到1g以上。2000年11月,intel公司发布了采用willamette结构的第四代pentium处理器,主频频率为1.5ghz,随后陆续推出了更高频率的处理器,目前处理器的最高频率已经达到3.8ghz。2004年底,amd和inel公司先后推出了64位个人用处理器。随后又推出了双核处理器,将cpu的发展带了一个新的时代。
1.intel公司 intel是生产cpu的老大哥,它占有80%多的市场份额,intel生产的cpu就成了事实上的x86cpu技术规范和标准。最新的pii成为cpu的首选。
2.amd公司目前使用的cpu有好几家公司的产品,除了intel公司外,最有力的挑战的就是amd公司,最新的k6和k6-2具有很好性价比,尤其是k6-2采用了3dnow技术,使其在3d上有很好的表现。
3.ibm和cyrix 美国国家半导体公司ibm和cyrix公司合并后,使其终于拥有了自己的芯片生产线,其成品将会日益完善和完备。现在的mii性能也不错,尤其是它的价格很低。
4.idt,曾经的cpu厂商
核心(die)又称为内核,是cpu最重要的组成部分。cpu中心那块隆起的芯片就是核心,是由单晶硅以一定的生产工艺制造出来的,cpu所有的计算、接受/存储命令、处理数据都由核心执行。各种cpu核心都具有固定的逻辑结构,一级缓存、二级缓存、执行单元、指令级单元和总线接口等逻辑单元都会有科学的布局。
为了便于cpu设计、生产、销售的管理,cpu制造商会对各种cpu核心给出相应的代号,这也就是所谓的cpu核心类型。
不同的cpu(不同系列或同一系列)都会有不同的核心类型(例如pentium 4的northwood,willamette以及k6-2的cxt和k6-2+的st-50等等),甚至同一种核心都会有不同版本的类型(例如northwood核心就分为b0和c1等版本),核心版本的变更是为了修正上一版存在的一些错误,并提升一定的性能,而这些变化普通消费者是很少去注意的。每一种核心类型都有其相应的制造工艺(例如0.25um、0.18um、0.13um以及0.09um等)、核心面积(这是决定cpu成本的关键因素,成本与核心面积基本上成正比)、核心电压、电流大小、晶体管数量、各级缓存的大小、主频范围、流水线架构和支持的指令集(这两点是决定cpu实际性能和工作效率的关键因素)、功耗和发热量的大小、封装方式(例如s.e.p、pga、fc-pga、fc-pga2等等)、接口类型(例如socket 370,socket a,socket 478,socket t,slot 1、socket 940等等)、前端总线频率(fsb)等等。因此,核心类型在某种程度上决定了cpu的工作性能。
一般说来,新的核心类型往往比老的核心类型具有更好的性能(例如同频的northwood核心pentium 4 1.8a ghz就要比willamette核心的pentium 4 1.8ghz性能要高),但这也不是绝对的,这种情况一般发生在新核心类型刚推出时,由于技术不完善或新的架构和制造工艺不成熟等原因,可能会导致新的核心类型的性能反而还不如老的核心类型的性能。例如,早期willamette核心socket 423接口的pentium 4的实际性能不如socket 370接口的tualatin核心的pentium iii和赛扬,现在的低频prescott核心pentium 4的实际性能不如同频的northwood核心pentium 4等等,但随着技术的进步以及cpu制造商对新核心的不断改进和完善,新核心的中后期产品的性能必然会超越老核心产品。
cpu核心的发展方向是更低的电压、更低的功耗、更先进的制造工艺、集成更多的晶体管、更小的核心面积(这会降低cpu的生产成本从而最终会降低cpu的销售价格)、更先进的流水线架构和更多的指令集、更高的前端总线频率、集成更多的功能(例如集成内存控制器等等)以及双核心和多核心(也就是1个cpu内部有2个或更多个核心)等。cpu核心的进步对普通消费者而言,最有意义的就是能以更低的价格买到性能更强的cpu。
在cpu漫长的历史中伴随着纷繁复杂的cpu核心类型,以下分别就intel cpu和amd cpu的主流核心类型作一个简介。主流核心类型介绍(仅限于台式机cpu,不包括笔记本cpu和服务器/工作站cpu,而且不包括比较老的核心类型)。
intel
tualatin
这也就是大名鼎鼎的“图拉丁”核心,是intel在socket 370架构上的最后一种cpu核心,采用0.13um制造工艺,封装方式采用fc-pga2和ppga,核心电压也降低到了1.5v左右,主频范围从1ghz到1.4ghz,外频分别为100mhz(赛扬)和133mhz(pentium iii),二级缓存分别为512kb(pentium iii-s)和256kb(pentium iii和赛扬),这是最强的socket 370核心,其性能甚至超过了早期低频的pentium 4系列cpu。
willamette
这是早期的pentium 4和p4赛扬采用的核心,最初采用socket 423接口,后来改用socket 478接口(赛扬只有1.7ghz和1.8ghz两种,都是socket 478接口),采用0.18um制造工艺,前端总线频率为400mhz, 主频范围从1.3ghz到2.0ghz(socket 423)和1.6ghz到2.0ghz(socket 478),二级缓存分别为256kb(pentium 4)和128kb(赛扬),注意,另外还有些型号的socket 423接口的pentium 4居然没有二级缓存!核心电压1.75v左右,封装方式采用socket 423的ppga int2,ppga int3,ooi 423-pin,ppga fc-pga2和socket 478的ppga fc-pga2以及赛扬采用的ppga等等。willamette核心制造工艺落后,发热量大,性能低下,已经被淘汰掉,而被northwood核心所取代。
northwood
这是目前主流的pentium 4和赛扬所采用的核心,其与willamette核心最大的改进是采用了0.13um制造工艺,并都采用socket 478接口,核心电压1.5v左右,二级缓存分别为128kb(赛扬)和512kb(pentium 4),前端总线频率分别为400/533/800mhz(赛扬都只有400mhz),主频范围分别为2.0ghz到2.8ghz(赛扬),1.6ghz到2.6ghz(400mhz fsb pentium 4),2.26ghz到3.06ghz(533mhz fsb pentium 4)和2.4ghz到3.4ghz(800mhz fsb pentium 4),并且3.06ghz pentium 4和所有的800mhz pentium 4都支持超线程技术(hyper-threading technology),封装方式采用ppga fc-pga2和ppga。按照intel的规划,northwood核心会很快被prescott核心所取代。
prescott
这是intel最新的cpu核心,目前还只有pentium 4而没有低端的赛扬采用,其与northwood最大的区别是采用了0.09um制造工艺和更多的流水线结构,初期采用socket 478接口,以后会全部转到lga 775接口,核心电压1.25-1.525v,前端总线频率为533mhz(不支持超线程技术)和800mhz(支持超线程技术),主频分别为533mhz fsb的2.4ghz和2.8ghz以及800mhz fsb的2.8ghz、3.0ghz、3.2ghz和3.4ghz,其与northwood相比,其l1 数据缓存从8kb增加到16kb,而l2缓存则从512kb增加到1mb,封装方式采用ppga。按照intel的规划,prescott核心会很快取代northwood核心并且很快就会推出prescott核心533mhz fsb的赛扬。
athlon xp的核心类型
athlon xp有4种不同的核心类型,但都有共同之处:都采用socket a接口而且都采用pr标称值标注。
palomino
这是最早的athlon xp的核心,采用0.18um制造工艺,核心电压为1.75v左右,二级缓存为256kb,封装方式采用opga,前端总线频率为266mhz。
thoroughbred
这是第一种采用0.13um制造工艺的athlon xp核心,又分为thoroughbred-a和thoroughbred-b两种版本,核心电压1.65v-1.75v左右,二级缓存为256kb,封装方式采用opga,前端总线频率为266mhz和333mhz。
thorton
采用0.13um制造工艺,核心电压1.65v左右,二级缓存为256kb,封装方式采用opga,前端总线频率为333mhz。可以看作是屏蔽了一半二级缓存的barton。
barton
采用0.13um制造工艺,核心电压1.65v左右,二级缓存为512kb,封装方式采用opga,前端总线频率为333mhz和400mhz。
新duron的核心类型
applebred
采用0.13um制造工艺,核心电压1.5v左右,二级缓存为64kb,封装方式采用opga,前端总线频率为266mhz。没有采用pr标称值标注而以实际频率标注,有1.4ghz、1.6ghz和1.8ghz三种。
athlon 64系列cpu的核心类型
clawhammer
采用0.13um制造工艺,核心电压1.5v左右,二级缓存为1mb,封装方式采用mpga,采用hyper transport总线,内置1个128bit的内存控制器。采用socket 754、socket 940和socket 939接口。
newcastle
其与clawhammer的最主要区别就是二级缓存降为512kb(这也是amd为了市场需要和加快推广64位cpu而采取的相对低价政策的结果),其它性能基本相同。
问题解答
病毒、木马、间谍软件造成cpu使用率占用100%
出现cpu占用率100% 的故障经常是因为病毒木马造成的,比如震荡波病毒。应该首先更新病毒库,对电脑进行全机扫描 。接着,在使用反间谍软件ad—aware,检查是否存在间谍软件。论坛上有不少朋友都遇到过svchost.exe占用cpu100%,这个往往是中毒的表现。
svchost.exe windows中的系统服务是以动态链接库(dll)的形式实现的,其中一些会把可执行程序指向svchost.exe,由它调用相应服务的动态链接库并加上相应参数来启动服务。正是因为它的特殊性和重要性,使它更容易成为了一些病毒木马的宿主。
explorer.exe进程造成cpu使用率占用100%
在system.ini文件中,在[boot]下面有个“shell=文件名”。正确的文件名应该是“explorer.exe”,如果不是“explorer.exe”,而是“shell= explorer.exe 程序名”,那幺后面跟着的那个程序就是“木马”程序,就是说你已经中“木马”了。
在注册表中的情况最复杂,通过regedit命令打开注册表编辑器,在点击至:“hkey-local-machinesoftwaremicrosoftwindowscurrentversionrun”目录下,查看键值中有没有自己不熟悉的自动启动文件,扩展名为exe,这里切记:有的“木马”程序生成的文件很像系统自身文件,想通过伪装蒙混过关,如“acid battery v1.0木马”,它将注册表“hkey-local-machinesoftwaremicrosoftwindowscurrentversionrun”下的
explorer 键值改为explorer=“c:windowsexpiorer.exe”,“木马”程序与真正的explorer之间只有“i”与“l”的差别。当然在注册表中还有很多地方都可以隐藏“木马”程序,如:“hkey-current-usersoftwaremicrosoftwindowscurrentversionrun”、“hkey-users****softwaremicrosoftwindowscurrentversionrun”的目录下都有可能,最好的办法就是在“hkey-local-machinesoftwaremicrosoftwindowscurrentversionrun”下找到“木马”程序的文件名,再在整个注册表中搜索即可。
avi视频文件造成cpu使用率占用100%
在windows xp中,单击一个较大的avi视频文件后,可能会出现系统假死现象,并且造成exploere.exe进程的使用率100%,这是因为系统要先扫描该文件,并检查文件所有部分,建立索引。如果文件较大就会需要较长时间并造成cpu占用率100%。解决方法:右键单击保存视频文件的文件夹,选择”属性—>常规—>高级“,去掉”为了快速搜索,允许索引服务编制该文件夹的索引“前面复选框的对钩即可。
杀毒软件cpu使用率占用100%
现在的杀毒软件一般都加入了,对网页、邮件、个人隐私的即时监空功能,这样无疑会加大系统的负担。比如:在玩游戏的时候,会非常缓慢。关闭该杀毒软件是解决得最直接办法。
处理较大的word文件时cpu使用率过高
上述问题一般还会造成电脑假死,这些都是因为word的拼写和语法检查造成的,只要打开word的“工具—选项”,进入“拼写和语法”选项卡,将其中的“键入时检查拼写”和“键入时检查语法”两项前面的复选框中的钩去掉即可。
网络连接导致cpu使用率占用100%
当你的windows2000/xp作为服务器时,收到来自端口445上的连接请求后,系统将分配内存和少量cpu资源来为这些连接提供服务,当负荷过重,就会出现上述情况。要解决这个问题可以通过修改注册表来解决,打开注册表,找到hkey—local—machnesystemcurrentcontrolsetserviceslanmanserver,在右面新建一个名为";maxworkitems";的dword值.然后双击该值,如果你的电脑有512以上内存,就设置为";1024";,如果小于512,就设置为256.
一些不完善的驱动程序也可以造成cpu使用率过高
经常使用待机功能,也会造成系统自动关闭硬盘dma模式。这不仅会使系统性能大幅度下降,系统启动速度变慢,也会使是系统在运行一些大型软件和游戏时cpu使用率100%,产生停顿。
进程占用cpu 100%时可能中的病毒
system idle process
进程文件: [system process] or [system process]
进程名称: windows内存处理系统进程
描 述: windows页面内存管理进程,拥有0级优先。
介 绍:该进程作为单线程运行在每个处理器上,并在系统不处理其它线程的时候分派处理器的时间。它的cpu占用率越大表示可供分配的cpu资源越多,数字越小则表示cpu资源紧张。