wan1313590
刚写的,也适合回答这个问题。绝对有参考作用,别忘了点个赞,嘿嘿!========================作为多年研发检测工具的工程(屌)丝,我给些干货。我告诉原理,希望能看懂。看懂了,方法就随便来了。查重就是找相同(重复),技术上最早来自搜索,但搜索限制在完全相同的,包含搜索词的,重复不光是完全一致或包含,包括相近或相似也是算的。所以技术采用的是比较技术,比较技术手段有很多,你可以用不同的,只要能找到就都是可以的。比较有2个突出指标,一个是触发阈值,一个是辨别敏感度。阈值,这么理解。有时你做知网检测时,发现报告为0%,很多人认为是不是假的啊,这些人基本都有抄袭的内容,所以知道自己有剽窃,认为结果不真。这个很大情况就是阈值的问题。详细的原因,太专业了,改天再说。敏感度,这么理解,有人发现同样文章,用其他工具测下来30%重复率,而知网测10%,就认为知网不行(知网不行,学术机构会用吗?!)。这个多半和敏感度有关。网上说连续13个字,就是敏感度指标之一,其实早就升级了,不仅仅是连续的才判别。你想比较技术,是简单到只是文字比对吗?核心还是pattern的相似性算法,但定义pattern,转化成结构化的字符码是最容易处理的,且可靠性精准性高。其实在实验中,图片比对、表格比对、公式已经不是问题了,找相似是很容易的,但是跳失率也高,在辨别敏感度的设定上还要调试,将来会有的。说个现在就有的,不连续的文字已经在对比了。所以不要机械的13个字,否则每隔12个字,加个字或标点,岂不是太容易过关了。那脑袋一定早就打成猪头了。所以修改也是蛮简单的,就是怎么能让pattern对不上,要么改头换面,不激发敏感辨别,要么稀释,不睬过阈值。基本算专业人员,给一些忠告:为了降重的,选什么工具都ok,多少的管点用,差别就是一分钱一分货。免费的尽量不要用,除非你的论文本身就很垃圾,没有什么价值,为什么就不说了,反正有时我们也需要测试数据的。为毕业的,不要瞎选工具,就选你们学校用的那个。去京东或淘宝就行了,这个不便宜的,不要选价格低的,假的多,淘宝货不对版更多些。也不要去网站那些,更不靠谱。 
论文查重是用知网的论文抄袭检测软件来进行的。一般这个软件会把你的论文分成一小段小段的,官方叫因子。然后把每一小段拿去和对比库里的资料进行对比,如果能找到相同的,基本就能确认这一小段是抄袭的了,所有小段检测完之后,会总结下,把所有抄袭的小段的字数统计出来,然后除以总字数就是抄袭率了。这只是个检测的描述,具体还是比较复杂的,你可以百度下 多戈论文检测网 ,上面关于知网的系统介绍的比较详细。
据学术堂了解论文查重怎么查,具体要看你学校用什么检测系统! 目前大部分高校采用的是知网学术不端检测系统。也有的学校用万方和知网的,也有paperpass的。不同的学校要求标准不同。对于不同的论文检测系统使用方式也不同: 首先说下知网的,有的学校会提供给学生1-2次的免费知网查重的机会,但这个机会非常宝贵。如果学生需要在学校外进行查重,一般就需要付一定的检测费用了。比如一些中国知网自助查重检测网站:学术不端网、中国知网学术不端检测系统、蚂蚁查重网等,全程学生自己操作,简单、快速、准确! 如果是投稿国外机构的,一般采用Turnitin,Turnitin国际版和uk版有一点区别,告诉你一个Turnitin查重官方入口:Turnitin查重官网。 其次是万方和维普,可以到某宝去查重,一搜一大堆。万方3秒就可以出结果,速度最快。 最后是paperpass,主要对比的是网络资源,没有正规的学术论文库。 总结:学校用什么系统,你就用什么系统提前检测。对于学校用知网的同学要注意,本科学校可以检测到大学生论文联合比对库,也就是本科学长论文库。研究生学校可以检测到学术论文联合比对库,也就是研究生学长论文。一般不能通过学校机检基本都是因为和学长论文重复的比较多!
进行论文查重,我们就需要使用到论文查重软件,如今市场上的论文查重软件还是比较多的,其中被众多单位机构和个人用户认可的主流论文查重系统是知网、维普和万方。进行论文查重的时候,我们只要选中一个合适的论文查重系统,然后将论文放入Word文档中,将论文Word文档上传提交进行检测即可。中国知网论文查重虽然收费价格比较贵,不过有90%以上的高校都与知网开展了协作,并且为毕业生们提供了1~2次的知网免费查重机会,所以我们是可以通过登录学校内网进行知网在线免费查重的;其次现在网上支持免费查重论文的软件主要是paper系列,包括有PaperPP、PaperQuery和PaperGood等软件,我们是可以使用这些免费论文查重软件在线检测毕业论文的。