期刊问答网 论文发表 期刊发表 期刊问答

CPU技术论文2000字

  • 回答数

    2

  • 浏览数

    138

沐沐目目
首页 > 期刊问答网 > 期刊问答 > CPU技术论文2000字

2个回答 默认排序1
  • 默认排序
  • 按时间排序

pachuang1

已采纳
GPU光线跟踪算法加速结构研究摘要:基于GPU的光线跟踪算法是当前图形学研究的一个热点,也是将来用于广告、电影、游戏等娱乐产业的关键技术。本文论述了如何对基于GPU的光线跟踪算法进行实现,以及利用各种加速结构,加速算法实现,提高算法执行效率,并对各种加速结构的效果进行了比较研究。关键词:GPGPU 光线跟踪 BVH KD-Tree1.引言近年来,CPU无论在运算能力,还是在可编程性上都得到了大幅的提高,GPU已经在需要大量运算的密集运算领域发挥了举足轻重的作用。各种基于CPU的密集运算被移植到GPU上,以利用GPU巨大的运算能力,加速整个算法的运算过程。光线跟踪算法是生成真实感图形的一种非常重要的方法,在电影、游戏、广告等产业,获得广泛的应用,而光线跟踪算法也是典型的密集运算算法,利用原始的基于CPU的光线跟踪渲染一幅图片是非常耗时的操作。因此,如果能够将CPU上的光线跟踪算法,映射到CPU上,加速光线跟踪算法的执行时间,将会带来巨大的经济效益。因此,基于CPU的光线跟踪算法已成为国内外科研人员的研究热点。2.基于GPU的光线跟踪1 相关工作当前,主要由两种方法利用CPU来加速光线跟踪算法。第一种是Carr等人提出来的,将CPU转换为一个蛮力的执行光线一三角形求交的计算器,而将任何的光线生成以及着色过程在CPU上完成。这就需要CPU依然执行绝大部分的渲染工作。C arr等人指出,在ATI Radeon 8500上,每秒最快能够执行1亿2千万次的光线一三角形求交。同时,作者也指出,由于GPU的单精度浮点的限制,图片上依然存在一些不太真实的地方。第二种方法由Purcell等人提出的,改种方法将整个光线跟踪器都移植到CPU上进行实现。从光线的产生,加速结构的遍历,到最后的着色过程都在GPU上执行。此后,有很多相同的项目都是基于Purcell的模型上进行的。2 GPU上的光线跟踪算法的映射方式将传统的CPU上执行的光线跟踪算法,映射成为一个GPU协助的,或者基于GPU的光线跟踪器有众多方法。下面重点介绍Purcell提出的映射模型,以及在本文的实现中提出的一个基于CPU的Whitted模型的光线跟踪器。该光线跟踪器的布局如图1所示:在Purcell的论文中,它将光线一三角形求交,以及遍历过程分离成两个独立的遍历内核和求交内核。本文的实现中,也按照上述模型图,将光线跟踪算法分解成光线生成,光线一三角形求交,着色这三个步骤。在对光线进行跟踪之前,需要生成从视点指向屏幕的原始光线( primary ray)。在一个GPU上,能够使用光栅器的插值的能力,在一个单一的内核调用中,产生所有的原始光线。给定观察矩形(被采样用于产生图片的投影平面的一部分)的四个角,以及视点,首先计算出这个视锥体的四条边线。如果让光栅器在这4条光线之间,按照512×512规格,在这四条光线之间按照方向进行插值,最终就可以获得能够产生一幅512×512图片(一个像素一个采样点)的所有原始光线的方向。同时能够将这些方向存储在一个纹理里,并把它作为求交内核的输入。所有的原始光线具有相同的起始点,但是仍然把它存储在一个同方向纹理具有相同维度的纹理内。因为当生成阴影光线或者反射光线的时候,光线的原点会发生改变。求交内核把光线的原点,方向,以及场景的描述作为输入数据。在内核被调用数次之后,我们对于每一个像素输出一个击中记录。如果一条光线击中了场景中的某个三角形,返回击中点的3个重心坐标,以及相关的被击中的三角形。此外,还将输出被发现的交点沿光线的距离,以及被击中三角形的材质。这就需要使用5个浮点数值组成一个击中记录。纹理只能够支持4个颜色通道( RCBA),所以,如果能把击中记录裁减到4个值,那么将是非常有益的。观察发现,只需要3个重心坐标的两个,因为在三角形内部,它们相加的和总是1。这就使得在一个单独的RGBA纹理中存储交点记录是可行的,并且它的维度同其它两个光线纹理的维度相同。Moller和Trumbore提出了一个高效的光线一三角形求交算法,使用这个算法,并利用CPU在向量计算上的优势来进行求交计算。下面列出了求交的代码,这个代码也展示了如何利用向量指令来提高效率。当所有的原始光线都已经计算出了相交的状态的时候,就能够查询着色过程所需要的表面法线和材质的信息。每一个击中记录都存储了一个指向材质纹理的索引,这个材质纹理包含了三角形的法线,材质颜色以及类型。三个顶点的法线根据击中记录的中心坐标进行了插值。最终的颜色能够按(N-L)C进行计算,此处Ⅳ是法线,L是光源的方向,G是三角形的颜色。现在根据击中的三角形所具有的材质的类型(漫反射材质,或者镜面反射材质),需要产生二次光线,以此来计算阴影和反射。1)如果一条光线射出场景之外,像素就被赋予全局的背景颜色。2)如果一条光线击中了一个漫反射材质表面,就发射一条阴影射线( shdow ray)。这些光线的起始点在击中点,方向为从击中点指向光源。3)如果一条光线击中了一个镜面反射材质表面。就发射一条镜面反射光线。镜面发射光线的起始点也在击中点,但是它的方向是在击中点处关于入射光线和插值后的法线对称的方向。一个真正的Whitted类型的光线跟踪器也支持透明材质,从而能够产生折射光线。但由于主要是研究加速结构,所以在本文的实现中,没有考虑折射光线。4)如果阴影光线击中了某个几何体,这就说明在光源和击中点之间,存在某个几何体,所以这个像素就应该是黑色(处于阴影中)。当跟踪阴影光线的时候,不关心最近的那个击中点,更加关心的是是否存在这样的击中点。因此,当有一个交点被发现,就可以停止整个求交过程,从而加速算法的处理过程。在本文的实现中,以相同的方式跟踪阴影光线和反射光线,因此,就没有使用到这个优化策略。已经对每一个像素产生了正确二次光线,如果需要,就能够执行另外一趟遍历/求交过程,对上述的二次光线进行跟踪。每一次调用着色程序就能够对每一个像素返回一个颜色值和一条新的光线。着色内核也可以将前一次着色程序的输出当作本次着色程序的输入。这就使得能够在跟踪连续的光线的时候合并这些连续的镜面反射的颜色。同Carr等人的程序不同,本文所采用的程序不存在浮点精度太低的问题,因为Ceforce 7300在整个管线中支持真正的32位浮点操作。3.加速结构的实现和比较1均匀栅格均匀栅格是第一个在GPU上实现的加速结构。Purcell给出了很多选择均匀栅格作为加速结构的理由,但是Purcell没有详细的说明为什么均匀网格对于硬件实现而言比其它的加速结构要更加的简单。当在探讨了均匀栅格的一些主要特性的时候,更加清晰的知道了均匀栅格为什么会成为一个好的GPU机速结构。首先,只用使用简单的算术运算,就能够对于每个体素的遍历在常量时间能被定位和存取。这就消除了对树的遍历的需要,以及重复的纹理查找工作,而纹理查找是相当耗时的。其次,体素的遍历是通过递增算术运算来完成的。这就消除了对堆栈的需要,使得我们能够从光线的起始点开始,以距离递增的顺序访问体素成为可能。再其次,由于对于体素的访问是沿着光线,以距离递增的方式遍历的,所以,一旦在一个被访问的体素中报道发现有一个交点,就可以停止这条光线对体素的遍历过程,从而提高整个遍历过程的速度。最后,用于遍历的代码非常适合用向量编写,而向量形式的编码风格又非常适合GPU的指令集。然而,均匀栅格的缺点就是由于它是空间细分结构的一种特殊情况,多个体素可能包含相同三角形的多个引用。由于无法使用mailbox技术,这就意味着需要对于相同的光线和三角形之间进行不止一次的相交测试。2 KD-tree最近,Havran等人对基于CPU的光线跟踪算法的加速结构进行了比较,得出的结论是对于众多不同类型的测试场景,平均而言,KD-tree是最快的。所以,有必要考察一下对于基于KD-tree的GPU光线跟踪算法,是否也会有相似的结论。就像均匀栅格一样,KD-tree也是一种空间细分结构。同均匀网格不同的是,KD-tree利用一个二叉树将场景表示成一个层次结构。在二叉树中,我们将内部节点和叶子节点区分开。叶子节点用来表示体素和与之相关的保存在该体素内的三角形的引用。一个内部节点用来表示空间区域的某个部分。所以,内部节点包含一个分裂面的两个子树的引用,而叶子节点只包含一个三角形列表。KD-tree的创建过程从上而下,根据一个评价函数,通过放置一个分离平面,递归的将场景分离成两个体素。我们能够以递归的方式遍历KD-tree,但是由于GPU没有堆栈结构,所以无法应用递归的策略。取而代之的是,我们能够通过记住我们沿着光线前进了多远来向上或者向下遍历树。这种策略消除了需要堆栈的限制,使得用CPU来完成对KD-tree结构的遍历成为可能。当使用GPU对KD-tree进行遍历的时候,KD-tree像均匀栅格那样被表示成一个纹理的集合。这就意味着有一个保存树数据的纹理,一个保存三角形列表的纹理,和一个保存实际的三角形数据的纹理。GPU的遍历首先调用一个初始化内核,然后按照需要,多次调用合并后的遍历和求交内核。3 包围体层次(BVH)给定一些随机的光线,通过计算遍历包围体层次的平均花费,就可以测量出该包围体层次的质量。迄今为止,还没有构建最优的包围体层次的算法,也就是说,如何准确的测量一个包围体层次的平均遍历时间还不是很明显。Goldsmith和Salmon提出了一个评价函数,通常被称为表面积启发式函数。他们通过父节点和孩子节点的表面积之比来形式化的表述这个关系,此评价函数如下所示:此处,hit(n)是光线击中节点n的情况,Sn是节点n的表面积,c和p分别表示父节点和孩子节点。这个评价函数给出了,当用一条随机的光线同层次结构求交的时候,成本上的估计。由于没有最优的方法去有效的构造一个最优的BVH,提出了不同的构造技巧。下面,将列出比较通用的方法。在实践中,对于包围体应用的最广泛的就是轴对齐包围盒(AABB)。AABB易于实现,并且同光线的求交测试非常快。大多数有关BVH的论文在描述BVH的创建的时候,通常分别以Kay和Kajiya,或者Goldsmith和Salmon这两种基本的想法为基础。Kay和Kajiaya建议以自上而下递归的方式进行BVH的创建。Goldsmith和Salmon提出了一个更加复杂的自底向上的构造方式。Goldsmith和Salmon指出,BVH的质量同作为输入传人的三角形的顺序有关。因此,他们建议在构造BVH之前,随机打乱三角形的顺序。下述算法就是利用Kay/Kajiya的思想创建某个场景的包围体层次的方法:4.结束语本文成功的在GPU上实现了用于光线跟踪算法中的各种加速结构,并对这些加速结构在GPU上的加速效果进行了比较。均匀栅格作为第一个在CPU上实现的光线跟踪器的加速结构,也被证明是最慢的,除非是只包含一个单独的物体的场景的情况。均匀栅格不适合几何体的密度非常高的场景。另外,对于均匀栅格的CPU上的遍历表示,也需要大量的数据。Foley和Sugerman认为,对于大多数场景,KD-tree的效率要比均匀栅格高。但是,在KD-tree的遍历过程中,无论是重置阶段还是回退阶段,片元程序都非常的复杂,但这种复杂性也使得其能够在场景的几何体的密度改变的时候做出适当的调整。本文实现的BVH被证明在加速效果上要超过均匀栅格和KD-tree,在现阶段,BVH是在GPU上实现的最快的加速结构。并且在GPU上实现BVH加速结构要比实现其他加速结构更加的简单。参考文献:[1]Randima Femado编,姚勇,王小琴译.GPU精粹一实时图形编程的技术,技巧和技艺[M].北京:人民邮电出版社,[2] Matt Pharr编著,龚敏敏译GPU精粹2-高性能图形芯片和通用计算编程技巧[M]北京:清华大学出版社.[3]昊恩华,柳有权.基于图形处理器(GPU)的通用计算叨.计算机辅助设计与图形学学报,2004,16(5): 601-[4] Philip JSchneider,David HEberly著,周长发译,计算机图形学几何工具算法详解[M]北京:电子工业出版社,[5] Martin C Implementing ray tracing on GPU Master´sthesis, University of Applied Sciences Basel,

CPU技术论文2000字

134 评论(9)

You2014

按照处理器支持的平台来分,Intel处理器可分为台式机处理器、笔记本电脑处理器以及工作站/服务器处理器三大类;下面我们将根据这一分类为大家详细介绍不同处理器名称的含义与规格。由于Intel产品线跨度很长,不少过往产品已经完全或基本被市场淘汰(比如奔腾III和赛扬II),为了方便起见,我们的介绍也主要围绕P4推出后Intel发布的处理器产品展开。 台式机处理器 Pentium 4(P4) 第一款P4处理器是Intel在2000年11月21日发布的P4 5GHz处理器,从那以后到现在近四年的时间里,P4处理器随着规格的不断变化已经发展成了具有近10种不同规格的处理器家族。在这里面,“P4 XXGHz”是最简单的P4处理器型号。 这其中,早期的P4处理器采用了Willamette核心和Socket 423封装,具256KB二级缓存以及400MHz前端总线。之后由于接口类型的改变,又出现了采用illamette核心和Socket478封装的P4产品。而目前我们所说的“P4”一般是指采用了Northwood核心、具有400MHz前端总线以及512KB二级缓存、基于Socket 478封装的P4处理器。虽然规格上不一样,不过这些处理器的名称都采用了“P4 XXGHz”的命名方式,比如P4 5GHz、P4 8GHz、P4 4GHz。 Pentium 4 A(P4 A) 有了P4作为型号基准,那么P4 A就不难理解了。在基于Willamette核心的P4处理器推出后不久,Intel为了提升处理器性能,发布了采用Northwood核心、具有400MHz前端总线以及512KB二级缓存的新一代P4。由于这两种处理器在部分频率上发生了重叠,为了便于消费者辨识,Intel就在出现重叠的、基于Northwood核心的 P4处理器后面增加一个大写字母“A”以示区别,于是就诞生了P4 8A GHz、P4 0A GHz这样的处理器产品。需要提醒大家的是,在这些新P4当中未与早期P4发生频率重叠的产品依旧沿用“P4”的名称,比如P4 4GHz。 Pentium 4 B(P4 B) 在Northwood核心全面推广以后,Intel决定再次对P4处理器进行改进,推出了基于Northwood核心、采用533MHz前端总线、具有512KB二级缓存的P4处理器。尽管这些处理器在核心架构与二级缓存容量上都与P4 A相同,但由于前端总线被提升到了533MHz,性能也得到了提升。为了与主频相同的P4 A处理器区分开来,Intel又在处理器名称后面增加了字母“B”,未出现频率重叠的P4则不需要添加字母后缀。这类处理器的代表产品有P4 4B GHz等。 Pentium 4 C(P4 C) 2003年二季度,Intel对Northwood核心的P4处理器进行了一次大规模的升级,不仅处理器的前端总线从原来的533MHz一举提升到了800MHz,而且改进后的P4处理器还能够支持超线程技术(由于处理器仍然沿用了Northwood内核,因此处理器的二级缓存容量仍然是512KB)。此次升级彻底奠定了P4处理器在市场上的领先优势,产品型号也相应地改为P4 C。其中P4 4C GHz与P4 8C GHz是该系列最具代表意义的两款处理器,也是2003年5月至2004年上半年Intel在中高端市场的主打产品。 Pentium 4 E(P4 E) 进入2004年,Intel发布了全新的Prescott核心,并以此推广下一代基于LGA 775封装的P4处理器。不过考虑到对现有平台的兼容,Intel推出了采用Socket 478接口、基于Prescott核心的P4处理器。这些处理器具有16KB的一级数据缓存以及高达1MB的二级缓存,支持增强型超线程技术。由于Prescott P4在频率上同样与原有的P4 B、P4 C发生了重叠,所以Intel将Prescott P4命名为P4 E以示区别。目前市场上P4 0E与P4 8E的性价比非常出色,深受中高端消费者的欢迎。 需要注意的是,在采用Prescott核心的P4中有一些比较特殊的产品,它们前端总线仅为533MHz且不支持超线程技术,主要目的是接替原来由P4 A、P4 B系列所把持的市场分额。或许是出于市场划分的考虑,Intel将此类“缩水”的Prescott P4处理器归类到了P4 A系列中,比如P4 4A GHz、P8A GHz,希望大家在购买的时候注意区别。 Pentium 4 5XX(P4 5系列) 针对新发布的若干款处理器,Intel于今年4月制订了新的处理器命名规范,引入了“处理器号”的概念。该规范中规定,基于Prescott核心、具有800MHz前端总线、1MB二级缓存、支持超线程技术并采用LGA 775封装的P4处理器对应的处理器号为5系列(即P4 5XX)。以P4 520为例,它具有8GHz的主频,与P4 8E规格基本相当,唯一的区别就在于P4 520采用了LGA 775封装,而则P4 8E采用了Socket 478封装。 Pentium 4 Extreme Edition(P4 XE,P4至尊版) P4 XE也被部分玩家称为P4 EE,是Intel面向骨灰级玩家推出的一款极高端的桌面处理器产品。早期P4 XE采用了Northwood内核,具有800MHz前端总线以及512KB二级缓存容禀支持朝鲜成技术。为了提高处理器的性能,Intel不惜血本地为P4 XE增加了容量高达2MB的三级缓存,这在Intel的桌面级处理器中是史无前例的。从以上规格我们不难发现,早期P4 XE实际上就是追加了三级缓存的P4 C处理器。 随着P4核心与封装形式的升级,Intel在今年4月发布了采用LGA 775封装的P4 4XE GHz处理器,该处理器基于全新的Prescott内核,同样配备了2MB三级缓存,可以看作是P4 5XX系列的加强版。由于历代P4 XE处理器制造成本极高,售价也相当昂贵,但性能提升却与价格不成正比,看来只有特别发烧的玩家才能体会到“物有所值”的乐趣。 Pentium 4 F(P4 F) P4 F是Intel首次面向桌面市场发布的64位处理器产品。它基于Prescott核心,采用09微米制程,具有800MHz前端总线以及容量高达1MB的二级缓存。与P4 5XX系列不同,P4 F处理器内建了Intel EMT64计算技术,同时兼容64位和32位计算。目前市场上推出的几款P4 F处理器均采用了LGA775封装,至于今后是否会推出Socket 478封装的产品目前还不得而知。从性能和价格来看,P4 F同样是面向硬件发烧友的高端产品。 Celeron(赛扬) 自赛扬处理器问世以来,尽管处理器的内核、封装形式以及规格发生了多次改变,但是Intel始终保持了“赛扬”一种型号。至于平时大家听到的“赛扬三”、“赛扬四”等均为用户或经销商自行创造的说法,不符合官方规范。目前低端市场上常见的赛扬处理器主要有“赛扬四”,该系列处理器采用了Northwood核心,具有128KB二级缓存以及400MHz前端总线,不支持超线程技术。大家非常熟悉的赛扬8GHz、赛扬4GHz均属于该系列产品,是Intel目前在低端市场的主要力量。 Celeron D 3XX(赛扬D 3系列) 赛扬D 3XX是由P4 E衍生出来的新一代赛扬处理器,它采用了Prescott核心,但取消了对超线程技术的支持,前端总线频率及二级缓存容量也分别被降低至533MHz和256KB。由于该系列处理器推出的时候Intel已经开始执行新的处理器命名规则,因此就在原有名称“Celeron”后添加字母“D”以示区别,并归 入“3XX”系列(例如赛扬D 325)。赛扬D 3XX 的出现较好地衔接了低端P4与传统“赛扬四”之间的市场空白,出色的性能也获得了市场的认可。 笔记本电脑处理器 Mobile Pentium 4-M(P4-M)与Mobile Pentium 4(Mobile P4) P4-M处理器是由基于Northwood核心的P4处理器发展而来,它具有400MHz前端总线、512KB 二级缓存。P4 - M与普通P4处理器的最大区别在于它支持Intel Speedstep节能技术,能够根据笔记本电脑的使用状况自动调整CPU的工作频率,延长笔记本电脑在电池供电情况下的使用时间。除了P4-M,Intel还推出了Mobile P4处理器,早期Mobile P4具有533MHz前端总线并支持Speedstep技术,但功耗大于P4-M,兼顾了台式处理器的高效能与笔记本的能耗控制。2003年9月以后,Intel为Mobile P4处理器增加了超线程功能。 随着奔腾M处理器的发展,目前我们在主流笔记本市场上已经很难看到P4-M与Mobile P4的身影,不过对于旨在取代台式机充当移动工作站的笔记本电脑来说,Mobile P4还是大有市场的,为此Intel在今年6月推出了基于Prescott核心、具有533MHz前端总线、1MB二级缓存、支持Stepspeed以及超线程技术的Mobile P4 5XX系列。 Pentium M(奔腾M) 奔腾M系列处理器是Intel专门为笔记本电脑设计的处理器产品,它使用了Banias核心,具有400MHz前端总线、1MB二级缓存以及Speedstep节能技术。由于核心架构十分先进,因此即便是在实际频率大大低于P4-M的情况下,奔腾M依旧保持了非常高的性能水准,较低的功耗也为笔记本电脑赢得了更长的使用时间。奔腾M的频率从900MHz一直覆盖到了7GHz,是目前笔记本电脑市场上的主流处理器之一。 Pentium M 7XX(奔腾M 7系列) 为了进一步提升奔腾M处理器的性能,Intel在Banias内核的基础上开发出了新一代的Dothan核心,Dothan具有533MHz前端总线以及容量高达2MB的二级缓存。此外,它还在Banias的基础上追加了高级数据预取、高级记录数据重获两项新技术,性能更加优秀。受Intel处理器新命名规则的影响,采用Dothan核心的奔腾M处理器被统一命名为为奔腾M 7系列,比如Pentium M 735,该处理器实际频率7GHz,新命名能够有效地将它与奔腾M 7G区分开来。 Mobile Celeron(Mobile赛扬)与Mobile Celeron D 3XX(Mobile赛扬3系列) 针对笔记本市场的Mobile赛扬处理器并不具备Speedstep节能技术,它们大多由桌面版的赛扬四处理器改进而来。早期Mobile赛扬采用了Willamette核心,但推出后不久由于功耗和性能均不理想,于是Intel迅速推出了基于Northwood核心的Mobile赛扬处理器。就以Mobile赛扬4G为例,它在赛扬四4G的基础上将二级缓存容量提升到了256KB,封装形式也由桌面版的FC-PGA2改为更加适合笔记本电脑使用的Micro-FCPGA,但两者在其他规格上并没有任何区别,主要用于低端笔记本电脑。 在Intel推出桌面版的赛扬D 3系列处理器之后,Mobile赛扬3系列的出现也就变得顺理成章。它同样不支持Intel Speedstep节电技术,但是前段总线被提升到了533MHz,二级缓存容量也增加至512KB。性能较过去的Mobile赛扬更加出色。 Celeron M(赛扬M)与Celeron M 3XX(赛扬M 3系列) 在奔腾M和奔腾M 7系列处理器发布以后,Intel也推出了与之对应的赛扬M与赛扬M 3XX系列处理器。它们分别采用了与奔腾M、奔腾M 7系列相同的Banias/Dothan核心,能够支持Speedstep节能技术,但是二级缓存容量相应地减少到了512KB/1MB,是同级别奔腾M处理器的一半,前端总线均为400MHz。即便如此,赛扬M与赛扬M 3XX由于性能尚可、功耗较低,因此得到了很多笔记本厂商的青睐。 工作站/服务器处理器 Xeon(至强) 至强处理器是Intel面向高性能工作站推出的一系列处理器产品,它在很多特性上与同时期的P4处理器相近,但整体规格更强。比如过去至强处理器采用的Foster核心和Gallatin/Prestonia核心就与P4使用过的Willamate和Northwood核心较为相似。不过,至强处理器配备了大容量的三级缓存并支持双处理器技术,P4则不支持。随着Prescott核心的出现,至强也转向了更新的Nocona核心。这种与Prescott P4非常相似的至强处理器前端总线高达800MHz,它配备了1MB大容量二级缓存(但未配备三级缓存)并能够支持支持Intel Speedstep、超线程以及EMT64计算技术,最高主频达到6GHz,是目前至强系列中首款兼容64位处理的产品,也是性能最强悍的产品。 Xeon MP(至强MP) 至强MP处理器可以看作是至强的增强型版本,它提供了对双处理器、4处理器、8处理器甚至8处理器以上多路技术的支持,主要针对中高端32位服务器市场。至强MP处理器采用了400MHz前端总线并支持超线程技术,其中用于多路服务器的至强MP处理器配备了256KB二级缓,而用于双路服务器的至强MP处理器则具有512KB二级缓存。根据处理器的档次不同,至强MP配套的三级缓存容量也具有1MB、2MB、4MB三种规格。至强MP普遍适用于包括部门级、企业级和电子商务在内的多路服务器平台。 Itanium(安腾) 为了满足企业服务器和技术应用平台的苛刻要求,Intel推出了安腾系列64位处理器。该处理器采用了不同于传统CISC“复杂指令”以及RISC“精简指令”的EPIC“显示并行指令计算体系结构”,具有支持双路以上的并行处理能力。目前最新型号的安腾2处理器具有400MHz前端总线、32KB一级缓存、256KB二级缓存以及超大容量的三级缓存(根据型号不同可分为3MB、4MB和6MB三种容量),主频从3GHz到5GHz不等。由于是一款纯64位处理器,因此安腾2要运行32程序必须通过软件模拟的方式执行对应的32位指令。目前安腾2主要用于面向大型数据库、高性能计算以及大规模数据分析的服务器或工作站,是名副其实的企业级处理器。Pentium-D指的是Dual core,还有EE(Extreme Edition),是高性能版本,为高端用户设计生产的
92 评论(9)

相关问答