期刊问答网 论文发表 期刊发表 期刊问答
  • 回答数

    3

  • 浏览数

    354

jgli2044
首页 > 期刊问答网 > 期刊问答 > 信息检索技术论文选题方向

3个回答 默认排序1
  • 默认排序
  • 按时间排序

持续的小温暖

已采纳
信息检索技术论文 –基于网格的面向专业内容的Web信息检索1 引言近年来,互联网得到了迅速的发展,网上信息资源愈来愈庞大,且信息具有量大、分散、异构等特性,因此,传统的Web信息检索工具开始暴露出它性能低下的一面,具体体现在现有的信息检索工具对用户的要求常常是找出了几千甚至上万条记录,根本无法从中再细找,或者找到的内容和要找的内容不是一个专业领域的,造成信息无效的现象。但随着人们信息意识的增强,对信息内容及信息服务的需求也在不断的演变和发展,对获取信息的专业化、实效性等方面有了新的要求。如何针对专业领域中特定的用户群为他们提供专业的、度身量造的信息服务,使用户在尽可能短的时间内有效的找到最需要的信息内容是大家普遍关注的一个问题。本文利用网格计算、集群系统、XML等技术设计了一个基于网格的面向专业内容的Web信息检索体系结构,它能将地理位置分散的、异构的信息按地区按专业内容从逻辑上进行合理的组织和管理,为用户快速、有效地获取自己所需要的信息提供了一种方法。2 基于网格的面向专业内容的Web信息检索体系结构的设计 网格计算是近年来国际上兴起的一种重要信息技术,其目的是将网上各种资源组织在一个统一的大框架下,为解决大型复杂计算、数据服务和各种网络信息服务提供一个方便用户使用的虚拟平台,实现互联网上所有资源的全面连通,实现信息资源的全面共享。 为解决不同领域复杂科学计算与海量信息服务问题,人们以网络互连为基础构造了不同的网格,他们在体系结构,要解决的问题类型等方面各不相同,但网格计算至少需要具有三种基本功能:资源管理、任务管理、任务调度。本文设计的信息检索体系结构,围绕网格计算的基本功能及信息检索的特点,主要有以下三个层次组成:见图1(1) 网格结点:结点是网格计算资源的提供者,本系统主要是由一系列的集群系统组成,它们在地理位置上是分布的,构成了一个分布检索群体,作为信息共享的基础结构平台。集群系统负责整个集群范围内的信息管理,维护和查询。(2) 网格计算中间件:中间件是信息资源管理和用户任务调度、任务管理的工具。它是整个网格信息资源管理的核心部分,它根据用户的信息请求任务,在整个网格内负责信息资源的匹配、定位,实现用户任务到集群系统的映射。(3) 网格用户层:主要为用户应用提供接口,支持用户对所需要的信息资源进行描述、创建、提交等。 图1本系统的主要思想是在逻辑上将地理位置分散的、异构的信息划分、组建成多个集群系统,集群系统对集群内的资源进行管理和任务调度,再利用网格中间件对各集群系统进行管理,从而形成对整个网格资源的管理,并对用户的信息需求进行统一的管理和调度。这种管理模型既可以尊重各个集群系统的本地信息管理策略,又可利用中间件在全局意义上对网格信息资源进行管理。1 集群系统的设计由于Web信息资源数量十分庞大,用户在利用现有搜索引擎检索信息时面临一个海量数据的查询问题,往往造成在消耗巨大的通信资源后依然存在资源查不准、查不全的问题。目前基于单一系统映射的Web服务器集群系统能把若干服务器用局域网连接成一个整体,并使其从客户端看来就如同一台服务器在服务,这使得在逻辑上合并、组织地理位置分布的信息资源成为可能。因此本文首先考虑采用分布协作策略,将Web信息资源按地区按专业内容分割,一方面使信息资源数量相对缩小,便于数据的组织、管理和维护,另一方面按专业内容易于制定一个公用的XML规范,便于集群内各类信息资源的描述,从而可建立一个基于XML的面向专业内容的信息集成系统。集群系统的具体结构见图2。集群服务器主要由接口Agent,基于专业内容的XML信息集成系统、资源服务Agent、资源发布Agent等组成。其中接口Agent根据任务提供的接口参数登记、接收、管理各种信息资源请求任务,并提供安全认证和授权。资源服务Agent根据信息资源请求任务,利用XML信息集成系统提供的数据,为用户提供实际的资源检索操作,并将检索结果信息发送给用户。资源发布Agent用于向网格中间件提供本地信息资源的逻辑数据及接口参数。下面主要说明基于专业内容的XML信息集成系统的构造方法:XML(the eXtensible Markup Language)是 W3C于1998年宣布作为Internet上数据表示和数据交换的新标准,它是一种可以对信息进行自我描述的语言,它允许开发人员通过创建格式文件DTD(Document Type Definitions)定制标记来描述自己的数据,DTD规范是一个用来定义XML文件的语法、句法和数据结构的标准。 XML使用普通文本,因此具有跨平台的优点,XML的优点在于(1)简单、规范性:XML文档基于文本标签,有一套严谨而简洁的语法结构,便于计算机、用户理解;(2)可扩展性:用户可以自定义具有特定意义的标签,自定义的标签可以在任何组织、客户、应用之间共享;(3)自描述性:自描述性使其非常适用不同应用间的数据交换,而且这种交换是不以预先定义一组数据结构为前提,因此具有很强的开放性;(4)互操作性:XML可以把所有信息都存于文档中传输,而远程的应用程序又可以从中提取需要的信息。XML数据是不依赖于某个特定的平台的应用,因此它为基于特定专业内容的表达提供了一种极好的手段,可以作为表示专业内容的语言。目前人们研制Web信息集成系统其基本方法可分成两类:存入仓库法(the ware-housing approach)和虚拟法(the virtual approach),可使用这两类方法利用XML在数据组织和交换方面的优越性,采用格式文件DTD和XML文档表示基于专业内容的集成模式和集成模式与资源之间的映射,建立基于XML的Web信息集成系统,其结构与获取信息的工作过程参见文献[2]。图2 网格中间件的设计图3所示的网格中间件的主要功能是(1)消除不同用户与集群系统之间数据表达的差异,使信息资源数据对用户来说是透明的;(2)管理、维护Web上分布的各集群系统,网格中间件以关系数据库方式记录所有集群系统及其所包含的专业内容的逻辑信息,对关系数据库的操作可维护集群系统的分布式逻辑,使本结构在可变性和扩充性上具有柔性;(3)接受用户的信息请求任务,能快速定位于满足要求的集群系统,通过对关系数据库的查询实现用户信息请求任务与集群系统的对应关系。内部主要功能模块说明如下:(1) 接收Agent模块:主要用于登记、接收、管理各种信息资源请求任务,并提供安全认证和授权。(2) 关系数据库及数据服务Agent:关系数据库记录了所有集群系统及其所包含的专业内容的逻辑信息。数据服务Agent提供集群系统对关系数据库的使用权限和对数据记录的增加、删除、检索和修改等操作。(3) 格式转换Agent模块:提供用户信息资源请求文档与各集群系统中文档的格式转换功能。由于XML是自定义的,各用户对同一数据有不同的表示方法(对信息资源描述存在差异)由于XML文档中这种格式差异体现在与之相关的DTD/Schema上,因此经过格式转换,可使信息资源的格式对用户是透明的。(4) XML文档分析Agent模块:提取格式转换后的XML文档中各个标签,通过查询网格中间件中的关系数据库,实现用户信息请求任务与集群系统的对应关系,并得到满足条件的集群系统的相关信息,获取各集群系统的接口参数。(5) 发送Agent模块:将转换过的信息资源请求XML文档发送到相应的集群系统中。其中Agent技术是解决分布式智能应用问题的关键技术,Agent是指能够自主地、连续地在一动态变化的、存在于其它系统中运行的、且不断于环境交互的实体。在系统中引入Agent可使系统具有人的特征,代表用户完成用户的任务,并能动态适应环境的变化更好地满足用户的需求,提高信息检索的能力。文秘杂烩网

信息检索技术论文选题方向

279 评论(14)

superjdhxc

网络信息检索方法与应用这个原创。联系看我资料
145 评论(15)

有颗小柠檬

科研方法与论文写作发布时间:2014-11-18 来源:毕业论文网  一、科研论文及其特点  论文  论文是以事实和理论根据为基础,用无可辩驳的逻辑证明,议论说理的文章。论文必须具备三个基本要素,即论点、论据、论证。论点是作者对所议论的事情或问题所持的观点。论据是证明论点的根据,包括事实论据和理论论据两类。论证是用论据证明论点的过程。  论文必须通过概念、判断和推理来阐明道理,必须具有严密的逻辑性、语言的准确性和概括性。  科研论文  科研论文(也称学术论文)是论文的一种。它是专门讨论和研究自然科学和社会科学领域中的问题和表述研究成果的理论文章。理解这个概念要注意把握两个方面:(1)学术论文是进行科学研究的一种手段;(2)学术论文是表述科研成果、进行学术交流的一种工具。科学研究是学术论文写作的基础,学术论文写作是该科学研究过程的继续,学术论文是科学研究的成果。  科研论文的特点  学术性。学术论文是科研成果的载体,是作者在某一科学领域中对某一课题进行潜心研究而获得的科研成果的认真表述,具有系统性和专门性。  所谓学术,是指专门的、系统的学问。学术论文与一般论文的主要区别在于它具有学术性。一般论文可以有感而发,不求系统,只在某一点上谈感想、讲心得、说体会;学术论文则不是一般的点滴体会,必须有一定的理论深度,因而要求作者在专业上有深厚的理论功底,对所研究的课题有比较全面的了解,既了解它的历史,又掌握它的学术动态,把握好自己的主攻方向,解决学术上有价值的问题。  科学性。揭示所研究事物或问题的本质,阐述客观规律。一般论文只需要占有一部分材料,选取能够证明自己观点的论据,可以比较自由地展开议论;而学术论文必须具有一定的理论价值,揭示事物的本质,反映客观规律。这就要求作者具有实事求是的态度,详细地、大量地占有材料,采用科学的研究方法,从中发现固有的本质和规律,并且准确地表述出来。  创造性。学术论文中的理论观点是作者独到的理论或见解。学术论文的创新性表现在:选取的课题新、研究方法新、展开的角度新、取得的成果新等。作者能够站在某一学科的前沿,以自己的远见卓识捕捉住合适的研究对象,灵敏地发现需要解决的问题,深入研究并取得突破性的成果,提出富有创见的的理论或观点,在理论和实践上较之前人有创造性的进展。  科学研究的意义在于发现和创新。没有发现或创新的研究,或重复研究,必然造成时间、精力和财力的浪费。学术论文能够写出自己新的发现、新创造、新见解,能够在学术上有所突破,乃至填补一项空白,当然是非常理想的。但是,对于一般研究者来说,并非是轻而易举的事。中小学教师主要的任务是教书育人,我们不能用过高的标准要求他们论文的学术前沿水平。只要他们的论文有理论意义或实践意义,有新意,就应该予以肯定。所谓有新意,即能够对前人的研究成果,或对别人所作出的结论进行实事求是的补充和修订,加以捍卫或否定,而且有理有据,能够自圆其说,都可以算是一家之言;只要选题有新的角度、材料上有新的发现、论证上有新的进展、观点上有新的突破或者在认识上比前人有所提高,也可以说在一定程度上具备了创造性。  二、科研论文的选题  选题的原则  价值性原则。也叫需要性原则,即选择具有应用价值或理论价值的课题,它是选题的主要依据。科研课题的价值主要表现在两个方面:一是应用价值,即社会主义物质文明建设和精神文明建设中亟待解决的课题。也可以理解为所谓的“社会热点问题”。选择这类课题,社会需要,人们关心,研究目标明确,一旦突破,必然会带来显著的社会效益或经济效益。选择这类课题进行研究,要注意研究成果的可操作性。例如,当前下岗职工再就业问题,如何实施素质教育的问题,就属于这一类课题。二是理论价值。有些研究项目,属于基础理论研究项目,虽然目前还不能应用于社会实践,但是它对于科学文化的发展,对于解决理论上的疑难问题具有重大价值,或者对于应用课题的研究具有指导意义。例如,数学上的“歌德巴赫猜想”。研究这类课题,必须要掌握研究领域的学术动态。还有一些课题,既有理论价值,又有应用价值,当然是更好的选择对象了。例如,公有制在社会主义市场经济条件下的实现形式问题,它既是一个重大的理论问题,也是当前国有企业改革的关键问题。  创新性原则。即选择的课题要有创见,有新意,有特色。在选题过程中,要注意把握两点,一是选题要防止雷同,防止步别人后尘;二是要考虑所选择的课题,能否研究出新的成果。创新性原则具体表现在三个方面:(1)别人未曾涉足的领域,填补学术上的一项空白。客观世界是多样化的、复杂的和不断发展的,不管科学怎样发达,总有尚待人们去研究、去认识的新课题。选择这样的课题进行研究,一旦有所突破,就能把科学推向前进。(2)对前人的研究成果有重要的补充或发展。客观事物是不断发展的,人类的实践也是不断发展的,因此,人们的认识也永远不会停留在一个水平上。前人的理论或学说总有需要补充或发展的地方。事实上,多数理论都是在后人的不断补充和完善中发展起来的。选择这类课题,也是很有意义的。例如,如何当好班主任,这可以说是一个老生常谈的课题。但是,如果结合素质教育的实施,从一个新的角度去研究,就具有创新性。(3)对通说中的某些错误进行纠正。有些理论,一直被人们认为是对的,成了通说,看起来好象是对的,其实不对,或者在某些方面是错误的,应该有新的认识。如果我们通过研究,能够对其进行纠正,也是一种创见。  可行性原则。根据自己进行科研和写作的主观、客观条件进行选题。选择科研课题,既要考虑课题研究的必要性,又要考虑自己完成研究和写作的可能性。有些课题,虽然很有价值,但是,作者力不从心,无法完成或无法圆满完成,也是不适合的。因此,选择科研课题时,一定要考虑完成课题的主观条件和客观条件。主观条件包括:(1)专业特长与优势。这是一项非常重要的主观条件。所选择的课题,应该是自己经过认真学习、钻研的必然结果。自己对所研究的学科领域有比较多的积累,不但对前人取得的成果、达到的水平比较熟悉,而且对遗留的问题、争论的问题也比较清楚。在所研究的学科领域中,研究的薄弱环节是什么?在哪些方面仍有研究的必要和广阔前景?学科的发展趋势如何?对这些问题,应该心中有数。这样,才能避免盲目性,有利于发挥自己的专长和优势。搞学术研究,要扬长避短,扬长,即发挥自己的专业特长和优势;避短,即不要去搞自己不熟悉的课题。(2)自己的研究兴趣。研究兴趣是人们进行活动的内部动力。达尔文曾经说过:“我记得从我在学校时期的性格来说,其中对我后来发生影响的,就是我有强烈而多样的兴趣,沉溺于自己感兴趣的东西,深喜了解任何复杂的问题和事物。”这就是达尔文研究和撰写《物种起源》等论著的动力之一。陈景润如果不是对“歌德巴赫猜想”有浓厚的兴趣,也不可能以那么坚强的毅力,进行成千上万次的演算。(3)自己的能力与水平。选题的大小、难易要根据自己的水平。一般说来,论题大,难度也大;论题小,难度也小。因此,对于初次搞科研的同志来说,选题宜小不宜大。先从较小的课题开始,有了一定的积累之后,再研究较大的课题。有些较大的课题,一个人不可能完成,则需要集体合作。客观条件包括:(1)资料来源。科研资料的来源,一靠文献,二靠调查,三靠试验。因此,在选题时,要考虑课题所需的资料类型和来源。(2)时间。有无充足的时间进行研究。(3)经费。有无完成课题所需的最低限度的经费保证。(4)导师。有无导师的指导。  三、科研课题的论证  课题论证是对选定的科研课题进行分析、预测和评价。目的在于避免选题过程中的盲目性。尤其是在申请科研经费时,更要进行认真的论证。我国目前国家资助的科研项目,分为国家级、省部级、区县级和单位级。在申请科研经费时,首先要进行申请立项,申请被批准立项之后,还要进行开题论证。申请立项和开题论证,二者的内容基本相同,只不过后者比前者更详尽。进行课题论证,本身也是一种研究,确切地说,是研究的前期准备工作。它必须依据翔实的资料,以齐全的参考文献和精细的分析来支持自己的课题主张。通过课题论证,进一步完善研究方案,创设落实的条件。  课题论证的主要内容包括:  课题名称、类别、负责人(课题组成员)  本课题研究的具体内容  国内外同类课题的研究状况  本课题的理论意义和实践意义  完成本课题的研究条件  (1)课题负责人的研究水平和时间保证  (2)课题组成员的研究水平和时间保证  (3)资料设备和研究手段  (4)课题组人员分工  本课题研究所采用的方法  本课题研究的预期成果和研究计划  经费预算  专家评定意见
113 评论(11)

相关问答