确定
不能具体点吗?比如说云计算的定义,服务模式,优势劣势,关键技术还是案例啊? 1.云计算的概念1.1 NIST云计算定义草案美国标准局(NIST)专家于2009年4月24日给出了一个云计算定义草案,概括了云计算的五大特点、三大服务模式、四大部署模式。1 云计算定义 云计算是一种按使用量付费的模式,这种模式提供可用的、便捷的、按需的网络访问,进入可配置的计算资源共享池(资源包括网络,服务器,存储,应用软件,服务),这些资源能够被快速提供,只需投入很少的管理工作,或与服务供应商进行很少的交互。云计算模式提高了可用性。云计算模式由五个主要特点、三个服务模式、四个部署模式构成。2 主要特点(1)按需自助服务。消费者可以单方面按需部署处理能力,如服务器时间和网络存储,而不需要与每个服务供应商进行人工交互。 (2)通过网络访问。可以通过互联网获取各种能力, 并可以通过标准方式访问,以通过众多瘦客户端或富客户端推广使用(例如移动电话,笔记本电脑,PDA等)。 (3)与地点无关的资源池。供应商的计算资源被集中,以便以多用户租用模式服务所有客户,同时不同的物理和虚拟资源可根据客户需求动态分配和重新分配。客户一般无法控制或知道资源的确切位置。这些资源包括存储、处理器、内存、网络带宽和虚拟机器。 (4)快速伸缩性。可以迅速、弹性地提供能力,能快速扩展,也可以快速释放实现快速缩小。对客户来说,可以租用的资源看起来似乎是无限的,并且可在任何时间购买任何数量的资源。 (5)按使用付费。能力的收费是基于计量的一次一付,或基于广告的收费模式,以促进资源的优化利用。比如计量存储,带宽和计算资源的消耗,按月根据用户实际使用收费。在一个组织内的云可以在部门之间计算费用,但不一定使用真实货币。注:云计算软件服务着重于无国界、低耦合、模块化和语义互操作性,充分利用云计算模式的优势。 3 服务模式(1)云计算软件即服务。提供给客户的能力是服务商运行在云计算基础设施上的应用程序,可以在各种客户端设备上通过瘦客户端界面访问,比如浏览器。消费者不需要管理或控制的底层云计算基础设施、网络、服务器、操作系统、存储,甚至单个应用程序的功能,可能的例外就是一些有限的客户可定制的应用软件配置设置。 (2)云计算平台即服务。提供给消费者的能力是把客户利用供应商提供的开发语言和工具(例如Java,python, Net)创建的应用程序部署到云计算基础设施上去。客户不需要管理或控制底层的云基础设施、网络、服务器、操作系统、存储,但消费者能控制部署的应用程序,也可能控制应用的托管环境配置。 (3)云基础设施即服务。提供给消费者的能力是出租处理能力、存储、网络和其它基本的计算资源,用户能够依此部署和运行任意软件,包括操作系统和应用程序。消费者不管理或控制底层的云计算基础设施,但能控制操作系统、储存、部署的应用,也有可能选择网络组件(例如,防火墙,负载均衡器)。四、部署模式(1)私有云。云基础设施被某单一组织拥有或租用,该基础设施只为该组织运行。(2)社区云。基础设施被一些组织共享,并为一个有共同关注点的社区服务(例如,任务,安全要求,政策和准则等等)。 (3)公共云。基础设施是被一个销售云计算服务的组织所拥有,该组织将云计算服务销售给一般大众或广泛的工业群体。 (4)混合云。基础设施是由两种或两种以上的云(内部云,社区云或公共云)组成,每种云仍然保持独立,但用标准的或专有的技术将它们组合起来,具有数据和应用程序的可移植性(例如,可以用来处理突发负载)。2云计算领域现状的特点是:(1)当前市场上主要的云计算厂商都是一些IT巨头,都处在攻城略地阶段。(2)标准尚未形成。在标准问题上基本各说各的。目前,市场上的云计算产品与服务千差万别,用户在选择时也不知道该如何下手。 
张兆代 王圣洁 刘京鹏 宋宏伟(青岛海洋地质研究所)摘 要 云计算继承和整合了虚拟化技术、海量数据存储、分布式并行计算框架、智能化与自动管理等多项关键技术,形成了具有高性能、可伸缩、低成本及面向服务的新的计算模式。目前学术界及产业界对云计算的研究和探讨均呈快速增长趋势,大量论文发表在计算机类和图书情报类期刊,研究的重点集中在云计算的基础理论、云计算的关键技术、云服务的应用领域、云计算与信息资源管理等多个方面。本文以 2000 ~ 2012 年发表在国内核心期刊上关于云计算的研究文献为统计样本,分析了云计算的研究热点及其演化方向,结合我国地质资料集群化产业化服务的发展状况,探讨云计算应用策略。关键词 云计算模式 地质资料 信息共享和服务1 前言“云计算(Cloud Computing)”一词出现于 2006 年,是谷歌总裁埃里克 施密特(Eric Schmidt)在搜索引擎大会(SES San Jose 2006)首次正式提出的一个概念。它不仅揭开了谷歌搜索背后关键技术的神秘面纱,而且在短短的数年内就迅速超越“网格计算(Grid Computing)”并成为新的潮流(图 1)。图 1 网格计算与云计算搜索量变化趋势图2006 年后,在谷歌、亚马逊、IBM 等企业的推动下,“云计算”作为新兴的计算模式已经有了广泛应用。云计算作为一种基础设施与服务的交付和使用模式,正深刻地影响着互联网的发展。近年来,国内外掀起了关于云计算的研究热潮,涌现了大量的研究文献和应用案例,云计算已经成为学术界和产业界共同关注的热点。本文首先介绍了云计算的基本概念和关键技术,并通过对现有的云计算研究文献的综合分析,结合我国地质资料集群化产业化服务的发展状况,提出其在云计算应用中需要注意的问题。2 云计算及其关键技术1 云计算的基本概念云计算的概念仍存在不同的定义。一般认为云计算是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需提供给计算机和其他设备[1]。美国国家标准与技术研究院(National Institute of Standards and Technology,NIST)也给出了云计算的定义,认为云计算是一种能够通过网络以便利的、按需使用的方式获取计算资源并显著提高可用性的方式,这些计算资源来自一个共享的、可配置的资源池,并能够以自动的方式获取和释放[2]。中国电子学会云计算专家委员会认为:云计算是一种基于互联网的、大众参与的计算模式,其计算资源(计算能力、存储能力、交互能力)是动态、可伸缩、且被虚拟化的,并以服务的方式提供。这种新型的计算资源组织、分配和使用模式,有利于合理配置计算资源并提高其利用率,从而促进节能减排,实现绿色计算[3]。尽管云计算有不同的定义,但对于云计算的特点已有很多深入的讨论。下面五个基本特征可以用来判断一个计算服务是否是云计算。(1)服务按需即取。云计算是把信息技术作为服务提供的一种方式。由于这种服务是从用户角度出发,按需即取的自助服务是其最重要的特征之一。用户可以自行获得计算能力,包括服务器的使用和网络存储的使用,而整个过程通常是自动进行的。(2)便捷网络访问。云计算支持广泛和便捷的网络访问能力,用户可以使用多种设备,如手机、移动计算机或工作站等获取云服务。(3)资源共享池。云计算带来的一个好处是能够提高资源的利用率,通过把资源集中到一个公共的资源共享池中,可以为大规模的用户群提供共享服务。由于资源池可以动态分配所有物理和虚拟资源,达到了通过共享提高资源利用率的目的。(4)高可扩展性及弹性服务。云计算具有快速及可伸缩地提供服务的能力。根据需求变化,云计算所提供的服务可以自动并快速地扩展或收缩。(5)服务可度量。云系统通过自动监控资源的使用,可以提供定量的运行报告,从而保证云服务处于应有的水平。2 云计算的体系架构计算机技术的发展经历了传统主机计算模式到个人普及计算模式及分布式网络计算模式的转变[4]。云计算作为一种新的计算模式,既是分布式计算、并行计算和网格计算等技术快速演化的结果,也是信息社会中信息需求的必然选择。社会化、集约化与专业化的信息服务通过各种云计算得以体现,其中既包括了各种通过网络提供给用户的互联网应用、软件或计算资源服务,也包含了用来支撑这些服务可靠和高效运行的软硬件平台。美国国家标准与技术研究院的技术报告给出了关于云计算体系架构的完整模型(图 2),该顶层模型定义了云计算模式中的角色(Actors)、行为(Activities)和功能(Functions)[5]。云计算的核心角色有云用户(Cloud Consumer)、云服务商(Cloud Provider)、云审计者(CloudAuditor)、云代理商(CloudBroker)和云运营商(Cloud Carrier)共五类(表 1)。在该模型中,云用户可以获得包括 ERP、CRM、HR 等商业智能或信息、通讯、协作、存储、备份以及软件、硬件托管等多种服务,云服务商则通过云计算中心的建设、运行和管理提供在线的软件服务(SaaS)、平台服务(PaaS)和基础设施服务(IaaS),云运营商通过提供网络接入、通讯系统等保障云计算的提供和使用,云审计者和云代理商的参与则保证了云计算和云服务的稳定性、持续性和透明度及服务水平。图 2 云计算体系架构参考模型(引自 NIST)表 1 云计算模式中的主要角色及定义3 云计算的关键技术云计算是计算机技术发展的产物,其中虚拟化技术、海量数据存储、分布式并行计算框架、智能化与自动管理被认为是实现云计算的关键技术[6]。1 虚拟化技术虚拟化(Virtualization)技术是将各种计算及存储资源充分整合和高效利用的关键。虚拟化技术包括两个方面:物理资源池化和资源池管理。物理资源池化是把物理设备由大化小,将一个物理设备虚拟为多个性能可配置的最小资源单位;资源池管理是对集群中虚拟化后的最小资源单位进行管理,根据资源的使用情况对资源进行灵活分配和调度,实现按需分配资源。虚拟化技术主要应用在服务器虚拟化、存储虚拟化和网络虚拟化三个方面。2 海量数据存储海量数据存储是云计算的主要任务。为了保证可用性、可靠性和经济性,云计算采用分布式存储的方式来存储数据,由于采用了分布式冗余存储的方式,数据既有高可靠性,也能并行地为大规模用户提供服务。云计算的数据存储技术主要有谷歌的分布式文件系统(GFS,Google File System)和 Hadoop 的HDFS(Hadoop Distributed File System)。3 分布式并行计算框架并行计算是云计算的核心。云计算采用 Map-Reduce 的编程模式实现分布式并行计算。Map-Reduce通过“Map”和“Reduce”这样两个过程来简化并行计算,所有应用只需要提供 Map 函数以及 Reduce 函数就可以在集群上进行大规模的分布式数据处理。Map-Reduce 不仅仅是一种编程模型,同时也是一种高效的任务调度模型,该模型的使用使计算任务高度并行及分布式实现成为现实。4 智能化与自动管理技术云计算具有高度自治的特点,智能化与自动管理是云计算模式的重要技术支撑。通过对集群系统各节点的全面监控、自动反馈、智能调配,实现了包括设备、虚拟资源、通讯与服务等的动态管理和自动迁移。以第四代大规模数据中心为基础的云计算,既能灵活扩展部署,也能满足服务计算和多粒度计算的要求。3 我国云计算研究热点分析1 国内外云计算搜索量变化趋势比较搜索量的大小通常反映关注度的高低,使用 Google Trends 工具还可以分析一些长期的趋势和变化。这里选择“Cloud Computing”和“云计算”分别作为世界和我国在云计算领域的指标性关键词,从分析结果可以看出以下几个特点(图3):①世界上对于云计算的关注开始于 2007 年,我国则自 2008 年才开始关注该领域。因此,我国仍属于学习—跟随型研究模式。②自 2007 年后,世界上关于“Cloud Computing”的搜索量出现迅速增长趋势,目前,已超过“Grid Computing”成为新的信息技术热点,我国对此的关注则较为平缓和滞后。③如果把搜索量代表的关注度看做是“海上的冰山”,那些“水下的部分”,包括基础理论、关键技术、应用实践等方面,国内外存在更大的差距。图 3 国内外云计算搜索量变化趋势比较2 国内云计算研究文献的计量分析本文利用中国知网 CNKI 学术期刊数据库,检索 2000 年 1 月至 2012 年 3 月发表的有关云计算研究的核心期刊文献 852 篇(表 2)。我国对于云计算的研究始于 2007 年,之前罕见相关研究。2008 ~2011 年,云计算的研究开始引起广泛关注,论文数量开始急剧上升,同时发表云计算论文的期刊数量也同步快速增多,显示出云计算研究领域的广泛性。由于只统计到 2012 年 4 月的部分数据,从表面看检索到的 2012 年的成果不多,实际并未改变论文数量快速增加的趋势。表 2 云计算论文发表时间分布表对于检索到的 852 篇论文,对其关键词进行了计量分析,其中涉及关键词 1376 个,累计出现频次3020 次。按频次从大到小排列,排在前十位的关键词有:云计算(645)、虚拟化(115)、图书情报(115)、云服务(94)、安全(65)、存储(42)、物联网(33)、MapReduce(24)、档案(20)、数据中心(13)等。从关键词分析可以看出,云计算的研究涉及基础理论、关键技术、应用领域、信息资源管理等诸多方面,对于虚拟化、存储、MapReduce 等关键技术有较多论述;但整体来讲,多数仍为综述性、展望类的论文。就应用领域来讲,图书情报界对云计算进行研究和借鉴的趋势比较明显[7],而地质资料界对云计算的关注和应用研究仍较少。4 云计算与地质资料服务1 地质资料数据与服务现状地质资料是国家重要的基础资料。新中国成立以来,通过实行地质资料统一汇交制度,积累了大量的地质资料。我国现有全国性基础地质与战略性矿产地质数据资源 12 大类 50 余种数据库,数据量达10TB 以上,涉及区域地质、矿产地质、水文—工程—环境地质、农业地质、海洋地质、基础地质、地球化学、地球物理、地学科研、地质资料、遥感等领域[8]。我国目前实行的是二级监管、三级保存的地质资料管理框架。由于条块分割等原因,地质资料的共享与服务尚存在很大差距,突出表现在数字化程度低,信息孤岛现象严重,地质资料不能及时、有效地满足国家建设与社会需求。2002 年,国务院颁布了《地质资料管理条例》,2003 年,国土资源部发布了《地质资料管理条例实施办法》,地质资料的管理与共享服务得到了前所未有的重视。国土资源部又相继推动地质资料汇交、地质资料委托保管、地质资料集群化、产业化服务等,地质资料的管理与服务开始出现一个新的局面。由于管理与服务模式的转变是一个较长期的过程,地质资料工作的重要性仍未完全显现,社会对地质、矿产等的关注度仍远落后于“土地”“海洋”“气象”,仅稍高于“测绘”(图 4)。2 云计算是改变地质资料服务模式的契机从云计算的产生和发展过程来看,云计算是在继承和整合了虚拟化技术、海量数据存储、分布式并行计算框架、智能化与自动管理等多项关键技术的基础上,形成的具有高性能、可伸缩、低成本及面向服务的新的计算模式。云计算正在推动着信息产业实现社会化、集约化、专业化的大转型。社会化:互联网计算正成为社会基础设施,建立集中的、各种各样的云计算中心实现规模化的社会服务,是当前发展的趋势。图 4 地质等搜索量变化趋势比较集约化:归并分散、粗放的软件开发与应用,软件模块构件化,提高平台利用率,使计算资源以虚拟化组织和配置、弹性伸缩,通过软件的重用和柔性重组,进行服务流程的优化与重构。专业化:面向多租户使服务更为精细、规范,并对服务透明使用,按需租用[9]。地质资料服务及信息共享是一种典型的数据密集型计算服务,这恰与云计算模式的基本特点相符合。因此,引入云计算是推进地质资料信息服务集群化产业化的天然契机。从技术层面上来讲,国家地质资料数据中心建设十分重要,建议规划为提供完整 SPI(软件即服务 SaaS、平台即服务 PaaS、基础设施即服务 IaaS)服务的地质资料专业云,全面涵盖二级监管、三级保存及社会化服务,这种集中式的部署方式既降低了技术难度,也有利于提高投入和使用效率。其次,国家地质数据中心也可以规划为“逻辑统一、物理分布”的三级数据中心体系,这种社区云的部署方式符合我国地质资料行业现状,组织实施均较为简单。需要注意的是,无论哪种方式,统一的体系架构、成熟技术的采用、一致的标准和安全性都是需要重点考虑的问题。5 结语与网格计算相反,云计算更多地经历了从实践到理论的过程,从研究者关注云计算开始,其实已经大量出现云计算的实例。我国在云计算领域的基础研究仍然落后,但图书情报界对云计算的跟踪和应用却十分突出,一些基于知识的服务已经达到专业化和产业化服务水平。相信云计算模式的引入,将会极大地推动地质资料服务向集群化产业化方向转型,以更好地实现地质资料和成果的全社会共享。参 考 文 献[1] 维基百科云计算http:///wiki/ 云计算,[2]Peter Mell,Timothy GThe NIST Definition of Cloud CNIST Special Publication 800 ~ 145,[3] 李德毅,林润华,郑纬民等云计算技术发展报告 [M[北京:科学出版社,[4] 杨春霞,王圣洁,王春民谈计算模式的演变及其对海洋地质数据处理的影响 [J]海洋地质动态,2004,20(2):32 ~ [5]Fang Liu,Jin Tong,Jian Mao et NIST Cloud Computing Reference ANIST Special Publication 500 ~ 292,[6]Michael Armbrust,Armando Fox,Rean Griffith et Above the Clouds: A Berkeley View of Cloud Chttp://du/Pubs/TechRpts/2009/EECS-2009-pdf,[7] 张正禄我国图书情报界云计算研究述评 [J]国家图书馆学刊,2010,(3):73 ~ [8] 国土资源部矿产资源储量司推进地质资料信息服务集群化产业化 [M]北京:地质出版社,[9] 李德毅云计算支撑信息服务社会化、集约化和专业化 [J]重庆邮电大学学报,2010,22(6):698 ~
在过去的半个多世纪,信息技术的发展,尤其是计算机和互联网技术的进步极大地改变了人们的工作和生活方式。大量企业开始采用以数据中心为业务运营平台的信息服务模式。进入新世纪后,数据中心变得空前重要和复杂,这对管理工作提出了全新的挑战,一系列问题接踵而来。企业如何通过数据中心快速地创建服务并高效地管理业务?怎样根据需求动态调整资源以降低运营成本?如何更加灵活、高效、安全地使用和管理各种资源?如何共享已有的计算平台而不是重复创建自己的数据中心?业内人士普遍认为,信息产业本身需要更加彻底的技术变革和商业模式转型,虚拟化和云计算正是在这样的背景下应运而生的。虚拟化技术很早就在计算机体系结构、操作系统、编译器和编程语言等领域得到了广泛应用。该技术实现了资源的逻辑抽象和统一表示,在服务器、网络及存储管理等方面都有着突出的优势,大大降低了管理复杂度,提高了资源利用率,提高了运营效率,从而有效地控制了成本。由于在大规模数据中心管理和基于互联网的解决方案交付运营方面有着巨大的价值,服务器虚拟化技术受到人们的高度重视,人们普遍相信虚拟化将成为未来数据中心的重要组成部分。虽然虚拟化技术 可以有效地简化数据中心管理,但是仍然不能消除企业为了使用IT系统而进行的数据中心构建、硬件采购、软件安装、系统维护等环节。早在大型机盛行的20世纪五六十年代,就是采用“租借”的方式对外提供服务的。IBM公司当时的首席执行官Thomas Watson曾预言道:“全世界只需要五台计算机”,过去三十年的PC大繁荣似乎正在推翻这个论断,人们常常引用这个例子,来说明信息产业的不可预测性。然而,信息技术变革并不总是直线前进,而是螺旋式上升的,半导体、互联网和虚拟化技术的飞速发展使得业界不得不重新思考这一构想,这些支撑技术的成熟让我们有可能把全世界的数据中心进行适度的集中,从而实现规模化效应,人们只需远程租用这些共享资源而不需要购置和维护。云计算是这种构想的代名词,它采用创新的计算模式使用户通过互联网随时获得近乎无限的计算能力和丰富多样的信息服务,它创新的商业模式使用户对计算和服务可以取用自由、按量付费。云计算融合了以虚拟化、服务管理自动化和标准化为代表的大量革新技术。云计算借助虚拟化技术的伸缩性和灵活性,提高了资源利用率,简化了资源和服务的管理和维护;利用信息服务自动化技术,将资源封装为服务交付给用户,减少了数据中心的运营成本;利用标准化,方便了服务的开发和交付,缩短了客户服务的上线时间。虚拟化和云计算技术 正在快速地发展,业界各大厂商纷纷制定相应的战略,新的概念、观点和产品不断涌现。云计算的技术热点也呈现百花齐放的局面,比如以互联网为平台的虚拟化解决方案的运行平台,基于多租户技术的业务系统在线开发、运行时和运营平台,大规模云存储服务,大规模云通信服务等。云计算的出现为信息技术领域带来了新的挑战,也为信息技术产业带来了新的机遇。然而,真正系统、全面地阐述云计算概念和技术及虚拟化在云计算中的发展和应用的书却是寥寥无几。本书作为全球第一本介绍虚拟化和云计算的图书,正好弥补了这一空白,为对云计算和虚拟化技术感兴趣的人员讲述相关的知识和理论。本书前4章着重介绍数据中心管理和虚拟化技术,后4章着重介绍云计算的概念和动态。下面简要介绍一下各章的主要内容。第1章介绍了数据中心的构建与管理。首先讲述了数据中心的概念、历史和发展情况,随后介绍构建数据中心的最佳实践方法和数据中心的管理维护,最后分析了新一代数据中心的需求和挑战。第2章对虚拟化技术进行了概述。首先介绍虚拟化技术的定义,以及常见的虚拟化技术;接着,鉴于服务器虚拟化的重要性,着重讨论服务器虚拟化的概念、支撑技术、特点、性能和优势;最后对其他类型的虚拟化技术做了简要介绍。第3章介绍虚拟化的关键技术。首先介绍如何创建虚拟器件和虚拟化解决方案;然后描述如何部署虚拟化服务,包括部署、激活虚拟器件及将现有服务迁移到虚拟化环境等;最后介绍了运行、维护虚拟化数据中心的关键技术。第4 章对虚拟化技术的业界动态进行了介绍,主要涉及IBM、VMware、Xen/Citrix和Microsoft等几个虚拟化厂商。内容涉及每个厂商的简介、产品线及产品的特性等。第5章对云计算技术进行了概述。首先介绍云计算的概念,对云进行分类,而且为了使读者清晰地了解云计算,在后面还针对云计算与其他相似概念进行了辨析;然后分析云计算的优势及为信息产业带来的变革;最后讨论云计算产生的源动力。第6章着重介绍云架构。定义云架构的不同层次,分析每个层次的核心功能和技术挑战,并通过示例加深读者对每个层次的理解。第7章概述云计算的关键技术与挑战。介绍云计算中的关键技术,包括已有的研究成果和发展状况,然后讨论了一系列经典问题在云计算中所面临的新挑战。第8章介绍云计算的业界动态,主要涉及几个领先的云计算厂商,包括IBM、Amazon、Google、Salesforce和Microsoft。介绍每个厂商的云计算产品线,分析其产品的功能和特点,使读者能够对主要的云计算厂商和产品有个总体认识,对业界的最新动态有较为全面的了解。在附录中我们列出了2009年超级计算机的世界排名。有兴趣的读者可以通过本书最后的参考文献获取更多的虚拟化和云计算的知识。在编写本书时,我们力图使不同职业和背景的读者都能从本书中获益。如果您是企业的技术负责人或数据中心运行维修人员,您将更深刻体会到虚拟化和云计算技术为企业IT部门、信息系统规划和数据中心运行维修带来的深刻变革。我们提供的技术讨论、产品比较和案例分析,将有助于您在脑海中勾画下一步的战略。如果您是从业的技术研发人员,您能系统地了解虚拟化和云计算的产生背景、发展现状、技术要点和未来趋势。通过本书的梳理,能够更加准确地把握业界前沿的科技和理念,认清信息业界发展的大脉络,形成适用于产业未来的大局观。如果您是大专院校计算机及相关专业的学生,您将获得无法从现有课本中得到的技术知识。本书将为您打开一扇通往未来的窗户,帮助您拓宽视野,完善知识结构,储备适用于未来信息产业的知识和技能。本书适合于从头至尾阅读,也可以按照喜好和关注点挑选独立的章节阅读。我们希望本书的介绍能加深您对虚拟化与云计算的理解,获得您所期待的信息。