何传秋
英特尔公司于6月21日至25日期间在北京举行的国际计算机系统结构学术会议(ISCA)上提交了三篇技术论文,并参与和领导了16个专题研讨会。 英特尔高级院士、副总裁兼首席技术官贾斯汀先生(Justin Rattner)在本届ISCA大会上进行了主题演讲。他强调架构师更需要了解最终用户期待的平台性能,在关注微处理器性能提升的同时应该更加注重整体系统。其主要机会在于通过缩小CPU和IO性能之间的差距、提高电池寿命、快速为客户提供新功能以及增强可视体验来提供更好的客户体验。 目标系统级架构因而可以提供如下功能: · 融合的平台电源管理:通过创建确定和有限度的电源管理机会来积极地管理所有平台组件的闲置能耗。经过这样的改变,当前平台的能耗可以降低50%以上。 · 可重新配置的架构:研究探讨了在CPU售出后快速集成功能的能力。高灵活性和更快速的上市时间让需要特定功能的客户不必再等待新款芯片上市。 · 内存层次结构修改:新型内存和更高水平的缓存,加上源于3D堆栈和多芯片封包等更新封包技术。这能够缩小处理器和硬盘性能的提升(造成更快速的平台升级)与用户期望的总体性能之间的差距。 · 可视体验及其他:提供能够智能化执行各种应用的架构,包括图片处理、高性能计算、物理、金融等领域的应用。 论文简介 芯片多处理器上的原子向量操作 本论文展示了首个新的架构扩展方案(包括两个新的IA指令),可以通过更好地利用并行处理提高性能。另外,新方法扩展了SIMD(单指令多数据)来支持“原子操作”,后者是指令序列,其行为类似单个操作,在很多新应用软件中很常见。虽然这些操作带来了并行化挑战,但本论文提出的创新方案可以为典型的未来工作负载带来高达54% 的性能提升。 缓存容量换可靠性,实现低电压操作 本论文提出了一种为处理器缓存实现低电压、低功率操作的新方案。所有芯片在操作电压上都有最低限制(通常称作Vccmin),低于此电压时电路的可靠性无法保证。在新方案下,当降低缓存电压且内存单元出现错误时,它们将单独关闭,而设备整体继续工作。论文提出了两种方案,都允许超低功率操作(小于5伏),同时保持50%-70%的缓存继续工作。当电压上升到正常水平时,全部功能将恢复正常。这种技术可以为未来的计算机、服务器和移动设备实现新的低功率模式。 面向指令细度计划监控的灵活硬件加速 系统设计人员传统上专注于性能的最大化,而最近开始关注如何将功率最小化。但从用户的角度来看,如果软件出现问题,快速或高能效没有任何意义。本论文中提及的新方法可以让工具在指令一级监控操作是否正确,这是可能的最精细水准。通常,高性能会消耗大量资源而造成这种方法代价过高,但模拟显示这个方法可以把现有的资源消耗降低33%-50%,而且灵活性更高。 
计算机的体系结构(computerarchitecture),通常是指涉及机器语言或者汇编语言的程序设计人员所见到的计算机系统的属性,更多说的是计算机的外特性,是硬件子系统的结构概念及其功能特性。这其中最重要的问题都直接和计算机的指令系统有关,例如计算机的字长,计算机硬件能够直接识别和处理的数据类型及其表示、存储、读写方式,指令系统的组成,指令类别、格式和功能,指令中使用的寄存器数量和表示方法,支持的寻址方式,存储器、输入输出设备和CPU之间数据传送的方式和控制,也包括中断的类型和处理流程,系统中对各类信息的保护,计算机运行状态的定义和切换,对各种运行异常或者出错的检测和处理方案等等,这些都是程序设计人员编写出高质量程序并确保其正常运行必须深入了解的计算机的有关属性。计算机体系结构主要研究硬件和软件功能的划分,确定硬件和软件的界面,即哪些功能应划分给硬件子系统完成,哪些功能应划分到软件子系统中完成。 计算机组成(computerorganization),是依据计算机体系结构确定并且分配了硬件子系统的概念结构和功能特性的基础上,设计计算机各部件的具体组成,它们之间的连接关系,实现机器指令级的各种功能和特性。从这一点又可以说,计算机组成是计算机体系结构的逻辑实现。为了实现相同的计算机体系结构所要求的功能,完全可以有多种不同的计算机组成设计方案。因为半导体器件性能的提高,新的技术成果的面世,或者又有新的价格/性能比的需求出现,都会带来计算机组成的变化。 在计算机组成的领域内,需要重点解决的问题之一是合理的性能价格比,关键的技术措施在于处理好计算机内部的数据流和控制流,合理地匹配各功能部件的性能参数,也就是尽力避免因一个部件形成的“瓶颈”问题而影响计算机的整体性能。例如,对运算器部件,可以通过实现数据运算的流水线处理和设置多个运算功能部件,在运算器内安排更多的寄存器等措施以提高其处理数据的能力;对控制器部件,可以通过指令预取,指令流水线处理,多指令流水线,选用RISC(reduced instruction set computer)结构设计方案等措施以提高执行指令的速度;对存储器部件,使用由高速缓冲存储器、主存储器、虚拟存储器构成的层次结构的存储系统,使用由可以交替运行的多个存储器构成的多体结构,使用性能更高的改进型的存储器芯片等措施,以提高存储器系统的存储容量和读写速度。对输入输出设备,实现通道、外围处理机等方式,合理地设置缓冲器和排队策略,配备速度更快的设备,配备更多数量的设备,以提高单位时间内数据输入输出的流量。对计算机系统而言,关键是尽可能地使计算机各个功能部件都以自己所具有的高速度运行,避免或者减少不同功能部件彼此之间的相互制约和等待现象,例如通过支持多线程、多进程、多道程序、多任务等措施,选用最合理的资源调度算法和分配策略,以便最大限度地提高系统的资源利用率。 计算机实现(computerimplementation),是计算机组成的物理实现。包括中央处理机、主存储器、输入输出接口和设备的物理结构,所选用的半导体器件的集成度和速度,器件、模块、插件、底板的划分,电源、冷却、装配等技术,生产工艺和系统调试等各种问题,一句话,就是把完成逻辑设计的计算机组成方案转换为真实的计算机,也就是把满足设计和运行、价格等各项要求的计算机系统真正地制作并调试出来。 计算机体系结构,计算机组成和计算机实现是三个不同的概念,各自有不同的含义,但是又有着密切的联系,而且随着时间和技术的进步,这些含义也会有所改变。在某些情况下,有时也无需特意地去区分计算机体系结构和计算机组成的不同含义。