期刊问答网 论文发表 期刊发表 期刊问答

网络数据库论文

  • 回答数

    4

  • 浏览数

    176

悲催的化学
首页 > 期刊问答网 > 期刊问答 > 网络数据库论文

4个回答 默认排序1
  • 默认排序
  • 按时间排序

gwll5711

已采纳
人们把客观存在的事物以数据的形式存储到计算机中,经历了对现实生活中事物特性的认识、概念化到计算机数据库里的具体表示的逐级抽象过程,即现实世界-概念世界-机器世界三个领域。有时也将概念世界称为信息世界;将机器世界称为存储或数据世界。 一、三个世界 1、现实世界 人们管理的对象存于现实世界中。现实世界的事物及事物之间存在着联系,这种联系是客观存在的,是由事物本身的性质决定的。例如学校的教学系统中有教师、学生、课程,教师为学生授课,学生选修课程并取得成绩。 2、概念世界 概念世界是现实世界在人们头脑中的反映,是对客观事物及其联系的一种抽象描述,从而产生概念模型。概念模型是现实世界到机器世界必然经过的中间层次。涉及到下面几个术语: 实体:我们把客观存在并且可以相互区别的事物称为实体。实体可以是实际事物,也可以是抽象事件。如一个职工、一场比赛等。 实体集:同一类实体的集合称为实体集。如全体职工。注意区分"型"与"值"的概念。如每个职工是职工实体"型"的一个具体"值"。 属性:描述实体的特性称为属性。如职工的职工号,姓名,性别,出生日期,职称等。 关键字:如果某个属性或属性组合的值能唯一地标识出实体集中的每一个实体,可以选作关键字。用作标识的关键字,也称为码。如"职工号"就可作为关键字。 联系:实体集之间的对应关系称为联系,它反映现实世界事物之间的相互关联。联系分为两种,一种是实体内部各属性之间的联系。另一种是实体之间的联系。 3、机器世界 存入计算机系统里的数据是将概念世界中的事物数据化的结果。为了准确地反映事物本身及事物之间的各种联系,数据库中的数据必须有一定的结构,这种结构用数据模型来表示。数据模型将概念世界中的实体,及实体间的联系进一步抽象成便于计算机处理的方式。 数据模型应满足三方面要求:一是能比较真实地模拟现实世界;二是容易为人所理解;三是便于在计算机上实现。数据结构、数据操作和完整性约束是构成数据模型的三要素。数据模型主要包括网状模型、层次模型、关系模型等,它是按计算机系统的观点对数据建模,用于DBMS的实现。 关系数据库采用关系模型作为数据的组织方式。 关系数据库因其严格的数学理论、使用简单灵活、数据独立性强等特点,而被公认为最有前途的一种数据库管理系统。它的发展十分迅速,目前已成为占据主导地位的数据库管理系统。自20世纪80年代以来,作为商品推出的数据库管理系统几乎都是关系型的,例如,Oracle,Sybase,Informix,Visual FoxPro等。 网络数据库也叫Web数据库。促进Internet发展的因素之一就是Web技术。由静态网页技术的HTML到动态网页技术的CGI、ASP、PHP、JSP等,Web技术经历了一个重要的变革过程。Web已经不再局限于仅仅由静态网页提供信息服务,而改变为动态的网页,可提供交互式的信息查询服务,使信息数据库服务成为了可能。Web数据库就是将数据库技术与Web技术融合在一起,使数据库系统成为Web的重要有机组成部分,从而实现数据库与网络技术的无缝结合。这一结合不仅把Web与数据库的所有优势集合在了一起,而且充分利用了大量已有数据库的信息资源。图1-1是Web数据库的基本结构图,它由数据库服务器(Database Server)、中间件(Middle Ware)、Web服务器(Web Server)、浏览器(Browser)4部分组成。 Web数据库的基本结构 它的工作过程可简单地描述成:用户通过浏览器端的操作界面以交互的方式经由Web服务器来访问数据库。用户向数据库提交的信息以及数据库返回给用户的信息都是以网页的形式显示。 1 Internet技术与相关协议 Internet技术在Web数据库技术中扮演着重要的角色。Internet(因特网)专指全球最大的、开放的、由众多网络相互连接而成的计算机网络,并通过各种协议在计算机网络中传递信息。TCP/IP协议是Internet上使用的两个最基本的协议。因此也可以说Internet是全球范围的基于分组交换原理和TCP/IP协议的计算机网络。它将信息进行分组后,以数据包为单位进行传输。Internet在进行信息传输时,主要完成两项任务。 (1)正确地将源信息文件分割成一个个数据包,并能在目的地将源信息文件的数据包再准确地重组起来。 (2)将数据包准确地送往目的地。 TCP/IP协议的作用就是为了完成上述两项任务,规范了网络上所有计算机之间数据传递的方式与数据格式,提供了数据打包和寻址的标准方法。 1.TCP/IP协议 TCP协议(Transmission Control Protocol,传输控制协议)规定了分割数据和重组数据所要遵循的规则和要进行的操作。TCP协议能保证数据发送的正确性,如果发现数据有损失,TCP将重新发送数据。 2.IP协议 在Internet上传送数据往往都是远距离的,因此在传输过程中要通过路由器一站一站的转接来实现。路由器是一种特殊的计算机,它会检测数据包的目的地主机地址,然后决定将该数据包送往何处。IP协议(Internet Protocol,网际协议)给Internet中的每一台计算机规定了一个地址,称为IP地址。IP地址的标准是由4部分组成(例如11),其中前两部分规定了当前使用网络的管理机构,第3部分规定了当前使用的网络地址,第4部分规定了当前使用的计算机地址。 Internet上提供的主要服务有E-mail、FTP、BBS、Telnet、WWW等。其中WWW(World Wide Web,万维网)由于其丰富的信息资源而成为Internet最为重要的服务。

网络数据库论文

354 评论(15)

tjushang

人们把客观存在的事物以数据的形式存储到计算机中,经历了对现实生活中事物特性的认识、概念化到计算机数据库里的具体表示的逐级抽象过程,即现实世界-概念世界-机器世界三个领域。有时也将概念世界称为信息世界;将机器世界称为存储或数据世界。 一、三个世界 1、现实世界 人们管理的对象存于现实世界中。现实世界的事物及事物之间存在着联系,这种联系是客观存在的,是由事物本身的性质决定的。例如学校的教学系统中有教师、学生、课程,教师为学生授课,学生选修课程并取得成绩。 2、概念世界 概念世界是现实世界在人们头脑中的反映,是对客观事物及其联系的一种抽象描述,从而产生概念模型。概念模型是现实世界到机器世界必然经过的中间层次。涉及到下面几个术语: 实体:我们把客观存在并且可以相互区别的事物称为实体。实体可以是实际事物,也可以是抽象事件。如一个职工、一场比赛等。 实体集:同一类实体的集合称为实体集。如全体职工。注意区分"型"与"值"的概念。如每个职工是职工实体"型"的一个具体"值"。 属性:描述实体的特性称为属性。如职工的职工号,姓名,性别,出生日期,职称等。 关键字:如果某个属性或属性组合的值能唯一地标识出实体集中的每一个实体,可以选作关键字。用作标识的关键字,也称为码。如"职工号"就可作为关键字。 联系:实体集之间的对应关系称为联系,它反映现实世界事物之间的相互关联。联系分为两种,一种是实体内部各属性之间的联系。另一种是实体之间的联系。 3、机器世界 存入计算机系统里的数据是将概念世界中的事物数据化的结果。为了准确地反映事物本身及事物之间的各种联系,数据库中的数据必须有一定的结构,这种结构用数据模型来表示。数据模型将概念世界中的实体,及实体间的联系进一步抽象成便于计算机处理的方式。 数据模型应满足三方面要求:一是能比较真实地模拟现实世界;二是容易为人所理解;三是便于在计算机上实现。数据结构、数据操作和完整性约束是构成数据模型的三要素。数据模型主要包括网状模型、层次模型、关系模型等,它是按计算机系统的观点对数据建模,用于DBMS的实现。 1 层次模型 若用图来表示,层次模型是一棵倒立的树。在数据库中,满足以下条件的数据模型称为层次模型: ① 有且仅有一个结点无父结点,这个结点称为根结点; ② 其他结点有且仅有一个父结点。 根据层次模型的定义可以看到,这是一个典型的树型结构。结点层次从根开始定义,根为第一层,根的子结点为第二层,根为其子结点的父结点,同一父结点的子结点称为兄弟结点,没有子结点的结点称为叶结点。 2 网状模型 在现实世界中,事物之间的联系更多的是非层次关系的,用层次模型表示非树型结构是很不直接的,网状模型则可以克服这一弊病。网状模型是一个网络。在数据库中,满足以下两个条件的数据模型称为网状模型。 ① 允许一个以上的结点无父结点; ② 一个结点可以有多于一个的父结点。 从以上定义看出,网状模型构成了比层次结构复杂的网状结构。 3 关系模型 在关系模型中,数据的逻辑结构是一张二维表。 在数据库中,满足下列条件的二维表称为关系模型: ① 每一列中的分量是类型相同的数据; ② 列的顺序可以是任意的; ③ 行的顺序可以是任意的; ④ 表中的分量是不可再分割的最小数据项,即表中不允许有子表; ⑤ 表中的任意两行不能完全相同。 个人版权,请勿复制
148 评论(15)

xx1120

国外网络数据库:当前特点与发展趋势  摘 要:网络数据库是重要的电子资源,有着独特的优势与良好的发展前景。文章从8个方面分析了国外网络数据库的当前特点,并对其未来发展趋势进行了探讨。  关键词:网络数据库 电子资源 特点 发展趋势  On Special Features and Development Trends of Web Databases  ABTRACT As one of important electronic resources, network databases have distinctive advantages and bright In this paper, the author analyzes the present characteristics of network databases and discuss its development 9   KEY WORDS Network Electronic resources  近年来,随着互联网的扩展和升级,网络数据库有了迅猛的发展。及时了解、探讨国外网络数据库的特点与发展趋势有助于图书馆对电子资源的评估、引进及其开发利用;同时亦可为国内网络数据库开发商提供有益的启示。  1. 网络数据库的特点  网络数据库是重要的电子资源,与印刷型文献及光盘、磁盘等电子出版物相比,网络版数据库有着独特的优势,正日益受到图书馆及其用户的青睐。  1.1 数据量大、增长迅速、更新速度快  在国外,数据库生产已形成规模,走向产业化和商业化,这就使得网络数据库的整体发展呈现出以下两个特点。一是数据库规模大、数据量多,增长迅速。如号称世界上最大学术电子出版物供应商的Elsevier Science,通过ScienceDirtect可在线提供多个数据库产品服务,包括一个综合性的学术期刊全文数据库、多个专题数据库、12种参考工具书及15个书目数据库,可检索、浏览的信息资源包括1500多种全文学术期刊、 5900万条文摘记录、2百万篇学术期刊论文。ISI的Web of Knowledge 信息平台上目前可提供服务的数据库有:ISI三大引文索引数据库、期刊目次库、多个专业文献信息及事实数据库、会议录及专利信息数据库;现有数据容量为:核心期刊8600多种、学术会议录论文记录2百多万条,专利信息2千多万条、化学反应60多万个、化合物1百多万个;其数据的年增长量为:12000多个学术会议的22万多条会议录论文记录,收入的期刊数量则以3%的速度递增。  二是数据更新速度快、周期短,如SCI、ISTP、BA、EI等著名文摘索引的印刷版、光盘版一般为每季度或每月更新,而相应的网络版数据库通常是每周更新;电子期刊数据库的更新通常早于其相应的印刷版,为每周或每日更新;而电子报纸的更新速度则可以以小时、分秒计算。  1.2 品种齐全,内容丰富  网络数据库品种繁多,内容丰富。从文献的加工程度看,既有目录、索引、文摘等二次文献数据库,如ISI的三大引文索引、Biosis Preview、EI Village等,又有期刊论文、会议论文等一次文献数据库,如 Elsevier Science的全文期刊数据库、IEEE/IEE Electronic Library等。从文献类型看,既有电子期刊、电子报纸、电子图书, 如Science、Nature Publishing Group、Springer-Link、netLibrary等,又有学位论文、会议录、专利、标准等数据库,如ProQuest的 Digital Dissertations、ISI Proceedings、IEEE/IEE Electronic Library、Derwent Innovations Index等。从学科范围看,既有单学科的,又有多学科综合性的,如RSC(化学)、IOPP(物理学)、L (法律、法学)、ABI、Business Source Premier(商业与经济管理)、Elsevier Science 全文电子期刊数据库(综合性)、Springer-Link(人文社会科学、自然科学与医学)。从数据库的开发与供应看,既有书刊代理商,如,EBSCO、 Blackwell,又有出版商,如Elsevier Science、Springer、John Wiley 、World Scientific等著名出版商,还有研究所、学协会等,如ISI、Royas Society of Chemistry 及Institue of Physics等。  1.3 使用便捷、无时空限制  网络数据库借助于互联网出版发行,除极少数外,绝大多数是连续作业,24小时不停机,通过互联网为世界各地授权终端用户提供服务,且同一数据库可同时为多人取用。这就为人们检索、利用数据库提供了极大的便利,只要网路畅通,用户足不出户,即可查找、获取、利用所需信息资源,无须受信息资源储存的地理位置及图书馆开放时间的影响与限制,可克服图书馆传统服务受时空限制的缺陷。  网络数据库的用户界面友好,易于理解、便于使用。首先,网络数据库的用户界面设计通常直观清晰、图文并茂,如不同的文献类型用不同的图形符号标示,生动直观;其次数据库往往设有专门的功能帮助键,且帮助信息详略适当、清晰、便于查阅;第三,对信息资源的查找利用具有选择与限定的自由,如,可在不同的数据库或文档、不同检索方式之间自由切换与选择,可对文献类型、出版时间、出版形式、可检字段等进行限定与选择,用户只需点击鼠标,即可完成选择与链接操作。这是其他形式的出版物所无法比拟的。  1. 4 数据标准、规范、多元  网络数据库的生产标准、规范,如采用超文本、多媒体等先进成熟的信息处理技术,遵循Z50等通用的标准、协议与规范,使用Internet Explorer、Netscape等通用、标准浏览器,以及PDF格式文档标准阅读器Acrobat Reader等,既便于用户的操作使用,又便于数据的交换与系统的扩展整合,同时也为数据库的稳定、畅通使用提供了保证。  数据档案格式多元,可包含更多传统纸本媒体无法提供的文档格式。目前,网络数据库数据文档常用的格式有PDF、ASCII(TEXT)及HTML,可满足不同的需要。此外,Word、PostScript格式文档亦常有所见,例如在计算机科学领域,有时可发现许多电子期刊全文内还附上了计算机执行档供使用者取用执行。  图书馆及其网络终端用户只须熟悉常见、通用计算机解读软件的使用,无需特别加以培训,即可充分利用网络数据库检索、浏览、打印、下载所需信息资源。  1.5 数据库的检索功能强  网络数据库的检索功能往往较为强大,这就使得网络数据库在信息检索的检全率、检准率以及检索的灵活性、方便性等方面较之其他形式的出版物更突出、更具优势。其主要表现在以下几个方面:  (1)检索模块灵活、多样  除提供基本或简易检索模块,供初学者及一般用户使用外。还可提供各种形式的高级检索模块,以方便用户进行限定字段检索,或使用逻辑算符(AND 、OR和 NOT)、括号、位置算符、截词符和词根符等构造检索式,进行组配检索,使得检索更为灵活,更为准确。  (2)检索途径(入口)多  除提供关键词、 题名、 著者、刊名及字顺等多种检索途径外,类似INSPEC、Web of Scince等检索途径(入口)多而广的数据库将越来越多,前者的字段检索(Search Fields)提供有40个字段列表,每个字段都可作为检索入口,后者则提供有分子式等特殊多样的检索入口。  (3)扩、缩检手段灵活、多变  除使用逻辑算符(AND 、OR和 NOT)、括号、位置算符、截词符和词根符等符号进行扩、缩检外;还可对不同的数据库、文档、可检字段(包括关键词(Keyword)、题名(Title)、著者(Author Name)、文摘(Abstract)、全文(Full Text)及所有字段(All Fields)、出版年代、文献类型(包括图书、期刊、报纸、文章等)等进行选择与限定。  1.6 检索结果的显示与输出灵活、多样  (1)检索结果的显示方式灵活、多样  主要表现在三个方面:一是每屏显示的记录数的限定;二是排序方式的多样化,可按相关度、出版时间、文献标题、著者、来源、语言、出版国等多种方式升序或降序排列。如INSPEC数据库检索结果的排序方式即多达10种;三是显示格式的多样化,可提供题录(Citation)、 题录+文摘(Citation+Abstract)、 全记录(Complete Field)或选择字段(Select Field)等多种格式显示。  (2)检索结果的输出方式多元化  不仅可提供存盘、 打印方式下载数据,且可利用E-mial发送检索结果,或将检索结果直接输出到文献信息管理软件,如ProCite 、Reference Manager、EndNote等中,亦或直接在网上订购文献全文。  1.7 数据库系统具有扩展整合功能  对用户来说,理想的状态是:透过一个数据库即可迅速查到所需信息并加以取用,系统扩展整合功能可帮助用户实现其理想。系统扩展整合功能是指数据库开发商借助互联网,利用超文本技术,在不同的信息资源之间进行链接,将原本相互独立、但互为联系的信息资源与服务整合在一块,使之形成为一个互动的有机整体,用户只需透过同一界面,即可迅速查到并获取自己所需要的信息。目前,数据库供应商提供的系统整合功能主要有以下几种:  (1)与图书馆馆藏的链接与整合  目前数据库供应商提供的链接方式有两种:一是数据转入或人工直接输入;二是单向式或双向式直接与OPAC链接,直接链接更为方便、经济、有效。数据库与图书馆馆藏的整合通常可通过数据的上载和下载实现。数据上载,即将图书馆的纸本馆藏记录上载到数据库中,对数据库中只有文摘,没有全文而本馆有纸本馆藏的期刊给予馆藏标示与链接,为读者提供最经济、快捷获取原文资料的信息。数据下载,即将数据库所收录的全部期刊的 MARC 数据下载到图书馆的OPAC中,予以揭示。数据库与图书馆纸本馆藏链接整合,既便于读者在图书馆的各种馆藏资源中串联,弥补单一馆藏资源的不足,从而迅速、有效地检索、获取所需文献信息,又便于图书馆充分、有效地揭示、开发与利用其纸本与电子馆藏。目前,可提供馆藏链接与整合功能的数据库供应商有不少,但整合方式则有所区别。如 SWETSNet 提供LINK-IN/OUT功能;OCLC的 SiteSearch 提供 Web界面,经由Z50协议达成整合;EBSCO的EBSCOhost 提供双向式链接。  (2)与其他数据库的链接与整合  由于收录的文献范围、侧重点的不同,数据库之间往往既交叉重复,又详略不等。若能在彼此间进行链接,即可帮助用户获取更为详细、更为丰富的相关信息,有利于科研创新与发现。ISI为扩展系统整合功能而特别建立的ISI Links即可满足这种要求。ISI Links通过在不同的数据库之间进行链接,将各种不同来源的数据库加以整合,使得用户只需透过同一的界面进行检索,即可迅速高效地找到自己所需的信息。目前,ISI Web of Knowledge平台可在ISI Web of Scienc、ISI Proceedings、CCC、JCR、BIOSIS Previews、ISI Chemistry、Derwent Innovation Index、NCBI GenBank及INSPEC等数据库之间进行双向链接。如透过ISI Chemistry所进行的文献调研可以经由Web of Science获得更多的相关文献的资料,而在Web of Science中所找到的文献又可透过ISI Chemistry 获得更为详细的反应信息。  (3)与原始文献的链接  即系统利用超文本链接功能,为用户直接提供其在数据库,尤其是书目、索引、文摘数据库中查到的相关文献的原始文献链接。在书目索引文摘等二次文献数据库与全文数据库之间建立链接,可帮助用户迅速、直接访问、获取所需原始文献信息,克服二次文献数据库的固有缺陷,增强数据库的全文提供能力,同时,亦可提高全文数据库的利用率,于读者、于图书馆而言均是十分有利的。目前,数据库供应商提供原始文献链接的方式主要有两种,一是链接到出版商的电子期刊全文,二是链接到相应的全文数据库。例如,ISI已与Academic Press、Americn Institute of Physics 、Elseriver 等16个机构建立了友好的合作关系,可链接到的数百家出版商的数千种全文电子期刊。CSA (Cambridge Scientific Abstracts)数据库的做法与此相似。EBSCO则通过EBSCOhost Electronic Journals Service (EJS),在 PsycINFO、 Socilogical Abstracts、 ERIC、 MEDLINE、 Econlit、CINAHL 、HealthSTAR 、Life Sciences(CSA)等索引文摘数据库中直接提供出版商以及Academic Search Elite、BioMedical FullTEXT Collection等全文数据库中相关电子期刊的全文链接,EBSCOhost EJS可链接的期刊现有8000种,可链接的全文期刊论文达340万篇。目前,可提供该种整合功能与服务的数据库还有OCLC 的ECO、SWETS等,但前提是图书馆必须订购这些全文数据库或相应电子期刊的纸本形式。  (4)与Internet 信息资源的链接  Internet中包含着丰富的信息资源,网络数据库利用网络便利,可提供相关的Internet信息资源检索与链接,读者只需输入一个检索式即可同时检索数据库及Internet 中的相关信息。该种链接不仅可补充、扩展数据库资源,且可为用户快捷、有效地利用Internet信息资源提供方便。如ISI 的专家对3700多个经过严格评估的学科站点的学术文献进行标引,通过Current Contents eSearch,用户可在检索期刊文献的同时,检索、浏览14万篇全文Web文献。值得一提的是,ISI的互联网文献的链接是基于每一篇以网页形式出现的学术文献具体内容的检索与标引,更细微、更深入。目前,可提供Internet信息资源检索与链接服务功能的数据库有CAS(Cambridge Scientific Abstracts)的Internet Databases Service (IDS)、EBSCO 的EBSCO Host、OCLC 的FirstSearch、、SliverPlatter 的SliverLinker等。  1.8 可提供相关电子信息服务  数据库产品与服务紧密结合,这是网络数据库的又一显著特征。目前,数据库开发商提供的相关电子信息服务主要有:  (1) 文献传递服务,当用户从二次文献数据库中查到所需信息并希望得到文献全文时,可通过电子方式在线订购所需要的文献全文。原文订购若选择电子文献传递方式,一般在24小时内即可获得所需文献,方便、快捷,可弥补书目索引文摘等二次文献数据库不能提供全文的不足。  (2) 定题服务,与传统的定题服务提供相似,基于网络数据库的定题服务允许图书馆及其用户根据需要开展多种形式的SDI服务。目前,数据库供应商提供的SDI服务主要有两种。一是指定参考用书(reserved list)服务,即系统提供图书馆依主题方式整理出类似所谓的指定参考用书(reserved list)功能选项,从而达成专门的SDI服务。  二是个性化文献报导服务,即由用户创建自己的检索策略,系统定期将符合条件的检索结果传递给用户。例如,Uncover的最新文献报导服务(Uncover reveal) 由用户选择自己感兴趣的关键词或期刊(最多可选50种)建立用户需求文档,系统每周一次,自动地将相关文献及用户所选期刊的最新一期目次信息发送到用户的Email信箱,用户只需定期查看自己的Email信箱,即可及时了解最新研究动态。而ISI的个性化信息代理服务( Discovery Agent, 又称个性化定题快讯服务),则是ISI基于其现刊题录数据库 Current Contents高质量的信息资源而建立的。利用Discovery Agent ,用户可根据需要,按主题、编著者、期刊名、地址/机构等项目自行制定、管理和编辑自己的检索策略,并不断检测检索结果以获得最合适的检索策略,随后系统便会每周将基于该检索策略的检索结果通过Internet Web 传送给用户,其传递方式主要有两种:即Email和 Web发布加上Email通知,需要时可通过电子方式订购由ISI Document Solution所提供的全文。个性化文献报导服务直接面向网络终端用户,个性化特色鲜明,与全文传递服务配合使用,可实现用户自行操作、完成由建立检索策略、查看检索结果到订购原始文献的文献检索与获取全过程的良好结合与循环,从而帮助用户方便、及时地了解、追踪、获取自己真正需要的最新信息(包括题录、文摘信息及原始文献),减少信息查询负担,提高工作效率。  近年来,国外网络网络数据库发展迅速,已形成一定的规模,但仍存在一些问题与不足,主要是:网络是必要条件,一旦断网或无网,数据库即无法使用;数据库内容存在交叉重复,如ABI与BSP、ARL与ASP;高水平学术电子期刊的品种与数量有限;数据库的开放程度有限,给数据库之间的整合带来困难;数据库的购买模式过于单一,不够灵活等。  2. 网络数据库的发展趋势  网络数据库作为一种主要的电子资源,其独特的优势在网络环境下日益突显。随着计算机、通信网络与信息技术的不断发展,未来几年网络数据库将继续呈现出良好的发展势头,成为图书馆发展电子馆藏、开展电子信息服务的重要资源与基础。  2.1 学术电子期刊迅速增长  在发展初期,由于数据库品种与数量有限,选择范围小,图书馆及其用户对数据库的要求不可能也无法要求太高、太多。但是,随着图书馆电子资源建设与电子信息服务的深入发展,图书馆及其用户对电子资源的需求将不断增加,要求亦将越来越高,将更加注重数据库的内容。书目索引文摘等二次文献数据库及普通期刊全文数据库将不再能满足图书馆,尤其是学术图书馆及其用户的需求,人们迫切需要高品质的学术电子期刊。未来几年,高品质的学术电子期刊是最具发展前途的,将迅速增长。据了解,越来越多的著名学术出版商、研究机构以及专业学协会,例如Springer-Verlag、John Wiley、World Scientific、Science、Nature Publishing Group等著名出版商以及英国皇家化学学会(RSC)、英国物理学会(IOP),美国计算机学会(ACM)等正在或拟在近期将其纸本期刊电子化,或者直接创办新的电子期刊。国外有专家预测,未来5年之内,在万维网上将可看到所有重要的自然科学、工程技术与医学学术期刊。届时,学术图书馆的电子期刊与纸本期刊的结构比例将发生变化。  2.2 电子图书迅速蔓延  继电子期刊后,电子图书潜在的巨大市场将引发出版社、数据库开发商及其代理商新一轮的竞争与合作,其结果必然是电子图书的迅猛发展。OCLC的netLibrary已获得10余家大学及其他出版社电子图书的发行权,现有电子图书4万种,2003年计划在此基础上新增2万种电子图书。Springer现有电子图书1300余种,并已成功将The Series Lecture Notes in Computer(LNCS)、 Lecture Notes in Mathematics、 Lecture Notes in Physics等20套丛书中的1000余种书电子化,这些丛书及其他图书的电子化工作将持续进行。John Wiley继2000年提供参考书在线服务后, 2001年11月又推出了在线图书Online Books, Online Books现有电子图书(手册、专著等)180多种,内容涉及化学、生命科学与医学、电子工程/通信等多个学科领域,预计2002年底可达300种。 ProQuest 的Safari Tech Books Online则将电子图书的重点放在IT领域,号称可提供50%以上已出版的IT图书,且通常情况下,新电子图书的提供将先于其印刷版。此外,Safari Tech Books Online 还具有较强的扩展与整合功能。难怪国外有专家预测,未来几年将是互联网上电子图书迅速蔓延的时期。从上述实例,我们不难预测,未来几年,电子图书将成为电子资源新的增长点。电子图书不仅在数量、品种和范围上有大的增长,且在结构、功能上有所发展,此外,电子图书的购买模式将更为灵活、多样。  2.3 文献全文取用即时方便  为了满足图书馆及其用户快速方便地获取所需原始文献的需要,实现信息检索、原文获取的一体化,数据库开发商与集成商日益重视数据库原始文献的提供,以强化数据库原文取用的即时性与方便性。其实现途径主要有以下几种:  (1)不断开发新的电子期刊全文数据库。未来几年电子期刊,尤其是高品质的学术期刊将迅速增加。此外,学术期刊过刊数据库回溯建设将进一步丰富全文电子期刊的品种与数量。例如,Elsevier Science已于2001年1月启动过刊数据库项目(Backfiles Program), 计划用3年时间,即到2003年底,完成其所收入的1500余种期刊中1995年以前出版的约300-350万篇期刊论文的回溯建库。届时,透过ScienceDirect可检索、浏览的期刊论文全文将多达800万篇、约4千万页。  (2)增加现有数据库中全文期刊的品种与数量,如Bell & Howell 公司(原UMI公司)的学术期刊图书馆( Proquest Research Library)1999年收录的报刊总数为2308种,其中,全文刊为1472种,2000年报刊总数达2345种,全文刊则增至1533种,2002年全文刊增至1700多种。 EBSCO的学术全文数据库(Academic Search Elite),1999年收录期刊3215种,其中,全文期刊996种,2002年其升级版Academic Search Premier收录的期刊达4425种,其中,全文期刊增至3467种。Elsevier Science的ScienceDirect 期刊数据库2000年收录期刊1100多种,2002年初增加到1200多种, 2002年5月成功收购IDEAL,将包括Academic Press、Mosby、Churchill Livingstone, WB Saunders等出版商在内的335种全文期刊纳入其系统,使其期刊总数增至1500多种,成为目前世界上最大的全文期刊数据库。  (3)提供原始文献链接,方式主要有四种。一是链接到出版商的电子期刊全文,例如,ISI近期将与Cambridege University Press、OCLC、Project Muse 等机构建立友好的合作关系,届时ISI的合作伙伴将近20个,可进行全文电子期刊链接的出版商将多达2300家,ISI的最终目标是力争与其收录的8000多种期刊种的所有电子版全文进行链接。二是链接到相应的全文数据库;三是链接到互联网上的文献全文;四是链接到图书馆的纸本馆藏期刊。  (4)直接在网上订购文献全文。  剩下的通过邮件发给你
279 评论(15)

安静的仔

有图片的,这里发不了图片,满意我的论文加分后联系我,我发给你。  基于关系数据库的模式匹配技术研究  摘 要 随着 网络 技术的 发展 ,信息处理需要对大量的、异构的数据源的数据进行统一存取,多源异构数据的集成 问题 就显得十分重要。而模式匹配是数据集成领域的一个基本技术。文章提出一种解决关系数据库语义冲突问题的模式匹配技术,以实现异构数据的共享与互操作。  关键词 数据集成;模式匹配;语义冲突  1 引言  随着 计算 机及网络技术的快速发展,网络上的各种信息以指数级爆炸性增长,成为了一个巨大的信息库,同时各 企业 单位开发了大量的软硬件平台各异的 应用 系统,在各种应用系统下又积累了丰富的数据资源。这样就形成了成千上万个异构的数据源,多为传统的关系数据库数据。这些数据资源由于软硬件平台各异、数据模型各异而形成了异构数据,使各数据源间的互操作变得复杂。为了更好地利用这些异构信息,以及不造成企业应用系统的重复建设和数据资源的浪费,模式匹配技术吸引了众多关注。本文针对模式匹配过程中存在的语义冲突进行分类,并提出了相应的解决策略,以达到异构数据源的共享和互操作。  2 模式匹配中的冲突问题  在数据集成领域中,由于数据源系统多是独立开发,数据源是相对自治的,因此描述数据的数据模型或存储结构经常会出现模式的不一致,数据源的自治性和数据源模式的异构性使数据源在共享和互操作上存在了语义冲突。这些正是模式匹配的焦点问题,它们形式上的性质使得人们很容易想到要用模式匹配去解决逻辑、语义和知识的描述问题。  对于描述模式匹配中的语义冲突有两种较有代表性的分类[4]。第一种分类将冲突分为异类冲突、命名冲突、语义冲突和结构冲突。第二种分类主要是对第一类异类冲突概念的一个细致的改进,但和其它分类仍有细微的不同,它把异类冲突看作是语义不一致的一类(如语义冲突),把冲突分为命名冲突、域冲突、元数据冲突、结构冲突、属性丢失和硬件/软件不同。  模式匹配是一项复杂而繁重的任务,所能集成的数据源越来越多,上述冲突情况也会越来越普遍,想解决所有的模式冲突是不现实的。本文主要解决关系数据模式之间的语义冲突。  3 模式匹配中的语义冲突  本文所提出的模式匹配 方法 是根据关系数据库的特点设计的。关系数据库中关系的基本单位是属性,属性本身就包含着语义信息,因此异构数据源语义相似性就围绕着数据源模式中的属性来进行,并在匹配的过程中解决异构数据源模式之间的一系列语义冲突。  1 语义匹配体系结构  本文提出的语义匹配体系结构采用数据集成中的虚拟法数据集成系统的典型体系结构,采用将局部模式匹配到全局模式的语义匹配体系结构,自下而上地建立全局模式。首先进行模式转化,消除因各种局部数据模式之间的差异所带来的 影响 ,解决各种局部模式之间的语义冲突等,然后在转化后的模式的基础上进行模式匹配,其主要手段是提供各数据源的虚拟的集成视图。  数据仍保存在各数据源上,集成系统仅提供一个虚拟的集成视图和对该集成视图的查询的处理机制。系统能自动地将用户对集成模式的查询请求转换成对各异构数据源的查询。在这种体系结构中,中间层根本不实际存储数据,当客户端发出查询请求时,仅是简单地将查询发送到适当的数据源上。由于该方法不需要重复存储大量数据,并能保证查询到最新的数据,因此比较适合于高度自治、集成数量多且更新变化快的异构数据源集成。  本文中的语义匹配的体系结构如图1所示。  2 关系数据库模式中语义冲突问题分类及其解决策略  大多数数据库系统提供了一套概念结构来对现实世界的数据进行建模。每一个概念结构被认为是一个类型,它可以是一种复杂类型或一种基本类型。类型和它所表示的数据间的联系就称为语义[3]。  在关系数据库中,一个关系模式是一个有序对(R,c),其中R为模式所指向的关系(表)的名称,而c则为具有不同名称的属性的有限集。同时,属性也是一个有序对(N,D),其中N为属性的名称,而D则为一个域。可以看出关系模式的基本单位是属性。属性本身就包含着语义信息,因此模式语义相似性就围绕模式中的属性来进行,并在模式匹配的过程中解决异构数据库模式之间的一系列语义冲突。  根据语义的定义,在关系数据库系统中,语义系统是由模式、模式的属性、模式中属性之间的联系和模式间的属性之间的联系构成。这里将语义分为3级:模式级、属性级和实例级。下面将异构模式中存在的语义冲突问题进行了分类,并阐述了各种语义冲突的解决策略:  1)模式级冲突  (1)关系命名冲突。包括关系名同义词和关系名同形异义词。前者进行换名或建立关系名同义词表以记载该类冲突;后者进行换名或建立关系名同形异义词表以记载该类冲突。  (2)关系结构冲突。分为包含冲突和相交冲突。包含冲突是指在含义相同的两个关系 R1 和 R2 中一个关系的属性集是另一个的属性子集。相交冲突是指两关系属性集的交不为空,我们用 attrset 代表关系的属性集。对包含冲突:①如果两个关系的属性集相同即attrset(R1)=attrset(R2),则合并这两个对象,Merge(R1, R2)into R3;②如果 attrset(R1) attrset(R2),则 attrset(R2')=attrset(R2)-attrset(R1),attrset(R1') = attrset(R1);③对相交冲突:通常概括语义进行如下解决:generalize(R1,R2)其中 attrset(R3)=attrset(R1)∩attrset(R2), attrset(R1')= attrset(R1)-attrset(R3);attrset(R2')=attrset(R2)-attrset(R3)。  (3)关系关键字冲突:两个含义相同的关系具有不同的关键字约束。包括候选关键字冲突和主关键字冲突。解决候选关键字冲突的 方法 是,将两关系的候选关键字的交集作为两关系的候选关键字;解决主关键字冲突的方法是,从两关系的公共候选关键字中选一个分别作为两关系的主关键字。  (4)多对多的关系冲突:两个数据库中用不同数量的关系来表达现实世界的相同语义信息,就产生了多对多的关系冲突,这种冲突分3种:一对多,多对一和多对多。解决方法是在表示相同语义信息的数据库中关系之间建立映射来表示多对多的关系。  2)属性级冲突  (1)属性命名冲突:分属性名同义词冲突和属性名同形异义词。前者的解决方法是,换名或建立属性名同义词字典;后者的解决方法是,换名或建立属性名同形异义词字典。  (2)属性约束冲突:分属性类型冲突和属性长度冲突两种。当在两个相关的关系R1和R2的属性N1和N2具有不同的属性类型时,就发生属性类型冲突。解决方法是在全局模式中将发生属性类型冲突的属性统一到某种属性类型。对属性长度的解决方法是,在全局模式中将发生属性长度类型冲突的属性对统一定义为最大者就可。  (3)多对多的属性冲突:两个数据库中的关系分别用不同数量的属性来表达现实世界中相同的语义信息时,就发生了多对多的属性冲突,这种冲突分3种:一对多,多对一和多对多。解决方法是在表示相同语义信息的数据库中关系的属性之间建立映射来表示这种多对多的关系。  3)实例级冲突  (1)不兼容关系实例冲突:当含义相同的数据项在不同的数据库中存在不一致的数据值时就发生了不兼容关系实例冲突。其解决方法是:将关系实例的最近修改作为关系实例冲突部分的值,但不能保证数据的正确性。  (2)关系实例表示冲突:关系实例表示冲突是指用不兼容的符号、量纲和精度来表示相关关系实例中等价的数据元素,主要包括表达冲突、量纲冲突和精度冲突。表达冲突是指在两个相关的关系R1和R2中含义相同的属性N1和N2具有不同的数据表达时,这种冲突使用语义值的概念来解决,即将表示同一概念的多种表达在全局数据中进行统一即可。量纲冲突是指在两个相关的关系R1和R2和中含义相同的属性N1和N2具有不同的量纲表示。量纲冲突也可以语义值加以解决,解决过程如下:分别定义发生量纲冲突的局部数据源的语义值模式和语义值说明,然后再定义全局数据模式中相应的语义值模式和语义值说明,将发生量纲冲突的属性值在全局模式中进行统一。精度冲突是指在两个相关的关系 R1 和 R2 中含义相同的属性具有不同的精度。其解决方法是在全局模式中将发生精度冲突的数据项定义为最高精度即可。  4 总结  本文针对异构数据源管理自治和模式异构的特点,提出了数据源集成模式匹配的体系结构,制定了匹配策略, 研究 了基于语义的模式匹配过程。以关系模式为 参考 模式,对异构数据源关系模式间可能存在的语义冲突 问题 进行了分类,并阐述了解决这些语义冲突的策略。  参考 文献  [1] Bergamaschi S, Castano S, Vincini M Semantic Integration of Semistructured and Structured Data Sources [J] SIGMOD Record, 1999, 28(1): 54-  [2] Li W, Clifton C, Liu S Database Integration Using Neural Network: Implementation and Experiences [J] Knowledge and Information Systems, 2000, 2(1)  [3] Reddy M P, Prasad B E, GReddy P A Methodology for Integration of Heterogeneous Databases [J] Information System, 1999,24(5)  [4] Rahm E,Bernstein PA Survey of Approaches to Automatic Schema Matching[J] The International Journal on Very Large Data Bases (VLDB),2001,10(4):334-  [5] 孟小峰,周龙骧,王珊数据库技术 发展 趋势[J]软件学报,2004,15(12):1822-1835  [6] 邓志鸿,唐世渭,张铭,等Ontology研究综述[J]北京大学学报( 自然 科学 版),2002,38(5):730-738  [7] 郭志鑫基于本体的文档引文元数据信息抽取[J]微 计算 机信息,2006,22(6-3)  相关文献:  基于XML的多数据库系统集成数据模型 - 华中科技大学学报:自然科学版 - 卢晓蓉 陈传波 等  基于CORBA和XML的多数据库系统研究 - 郑州轻工业学院学报:自然科学版 - 张素智,钱慎一,卢正鼎,  集成数据库和文件系统的多数据库事务模型 - 华中理工大学学报 - 卢正鼎 肖卫军  基于主动规则对象的分布式多数据库系统集成 - 小型微型计算机系统 - 胡华,高济,  基于CORBA的多数据库系统 - 计算机科学 - 石祥滨 张斌  基于XML的文件系统与多数据库系统的集成 - 小型微型计算机系统 - 卢正鼎 李兵 等  基于CORBA/XML的多数据库系统的研究与实现 - 计算机研究与发展 - 卢正鼎 李兵 等  多数据库系统集成平台CMDatabase体系结构 - 计算机工程 - 魏振钢 郭山清 贾忠伟  多数据库系统的数据模式集成与查询处理 - 电脑开发与应用 - 陶世群  数据库网格:基于网格的多数据库系统 - 计算机工程与应用 - 任浩 李志刚 肖侬  高校学生收费系统基于多数据库系统集成的一种实践 - 昆明冶金高等专科学校学报 - 杨滨生,蒋涛勇,张中祥,谢静静,  基于RDBMS的地理信息集成数据库系统 - 计算机工程 - 江崇礼 王丽佳 等  基于CORBA的异构数据库系统集成模型的研究 - 现代计算机:下半月版 - 陈刚  基于分布式对象技术的多数据库系统 - 计算机工程与科学 - 韩伟红 隋品波  基于CORBA的多数据库系统互操作技术 - 计算机科学 - 肖明,肖毅,
259 评论(8)

相关问答