乔志娟
先按标题分段检测,然后按段落进行检测,一句话有8个连续字符重复就算是重复,一段话有13个字符重复就算是重复,记得是字符数。还有模糊匹配,一句话会先识别上下文,来判断是否重复。 
主要是根据查重率。也就是看抄袭的内容在整篇论文中所占的比例,超过30%就判定为抄袭,也就是判定为论文不合格。一般高校要求都是重复率必须低于30%,超过30%即为不合格。知网的论文查重系统在检测时,基本标准是,一句话内存在8个字或以上的字重复,或一个自然段内存在13个连续字符重复,即判定重复。
查重是系统将你论文中的内容,与检测系统数据库中的内容进行对比,如果一个句中的内容与数据库系统的中的内容相同或类似,那就会标记为重复内容,另外,系统还会抓取互联网数据进行对比较,如果重复字数内容越多,那最终得出的全文重复率也就越高。
查重软件在句子上判断重复,系统主要是看关键词,有几个相同或者相似,就有可能会判为重复