yhy啊
全文信息检索是以全文本信息为主要检索对象,允许用户以布尔逻辑和自然语言,根据资料的内容而不是外在特征来实现检索的先进检索技术。全文检索系统标引方式有词典法标引、单汉字标引、特殊标引等。全文信息(Full Message)由WAA发布的一种广告标准,主要是针对SMS和GSM网络信息的发布。是一种了利用SMS发送包含全部160个字符的广告形式。全文数据库和全文信息检索,保存在数据库中的记录数据,从类型上可以分为两种。其一是结构化数据,象字符、日期、数值、货币等,这些数据都是具有有限长度或固定格式的数据;其二是非结构化数据,也叫全文数据,象简历、简介、论文等,这些数据都是以不定长、非固定格式保存的字符型数据。现有的数据库系统,都是以结构化数据为检索的主要目标,因为实现相对简单。比如数值检索,可以建立一张排序好的索引表,以二分法实现查找,速度很快。但对于非结构化数据,即全文数据,要想实现检索,相对难度要大的很多了。百度基于字词结合的信息处理方式。巧妙解决了中文信息的理解问题,提高了搜索的准确性和查全率。 百度支持主流的中文编码标准。包括GBK(汉字内码扩展规范)、GB2312(简体)、BIG5(繁体),并且能够在不同的编码之间转换。 百度的智能相关度算法。采用了基于内容和基于超链分析相结合的方法进行相关度评价,能够客观分析网页所包含的信息 百度的检索结果能标示丰富的网页属性(如标题、网址、时间、大小、编码、摘要等),并突出用户的查询串,便于用户判断是否阅读原文。 百度搜索支持二次检索。 