知网查重常见问题重点是什么?-paperccb查查呗论文查重
知网查重常见问题重点是什么?就目前论文抄袭的情况相信大家应该是屡见不鲜吧,所以大多数高校也采取了一些必要的措施,知网查重就是目前最有效的工具,但在使用知网查重的过程中还是会遇到不少人遇到不少问题,今天小编就整理出几个关于知网论文查重的问题,一起来看看吧。
合理引用与抄袭之区别
对政府文件、领导讲话、重要著作、历史材料、法律法规、诊断标准、操作程序等的引用,往往会被误认为是段落复制或句子复制,造成文字复制比偏高。生物学医学领域的论文,许多研究方法和临床诊断与治疗方案相似,论文格式也基本固定,语句较为简单和通用,如:采用 SPSS统计软件进行数据分析,计量数据以 X± S表示,组间比较采用 t检验,计数组比较采用X2检验, P<0.05为差异有统计学意义。同方研究往往查询的文献相同,所用的技术和方法一致,甚至在词汇的运用和语言的表达上都容易造成重复。同一位作者在前期研究的基础上继续深入,后期文章的前言文字、研究方法、研究工具、资料、统计分析等许多文字说明都与前期文章一致,甚至会引用前期文章中的数据。中医论文中经常引用经典语句,但知网检测系统还无法识别这些语句来自经典著作。医学类文章容易出现文本重复,造成文本复制率偏高。还有一些论文整体文字重现率偏高,但核心内容基本不重复,用这些系统对医学论文进行检测时可能出现“假阳性”现象。知网检测系统虽然遏制了明目张胆的剽窃行为,但却给文化发展带来了负面影响。根据版权法,作者有引证的权利,但制度不能保证。这种情形应以同行评议的方式作为补充评议。
二是知网检测系统收录文献的完整性问题
万方、维普数据库与国内众多期刊有合作关系,但这三个数据库收录的期刊并非完全相同。导致各校收录论文之间存在差异,导致学术不端检测结果差异。如复制先前建库时的文献,则数据库无法核实。而 CNKI、万方数据分别与部分科技期刊编辑部签署独家合作协议,意味着期刊的全部文献只能在各自的数据库中检索,从而导致其它数据库缺乏统计源文献。另外,目前知网检测系统对图书的收录还有很大的空白,如果论文是抄袭图书内容,现有系统无法检测到。
三是检测技术问题
各个检测系统在工作方式、后台数据库、算法特点(对文章进行关键字语义片段识别检测、字段识别、近义同义识别)等方面存在着差异,技术上的差异,导致不同的检测系统对同一文章进行不同的检测,结果也不一样,有时结论也不一样。针对检测系统的检测原理,研究“反抄袭”方法,使论文的撰写成为一种文字游戏,通过调整语句顺序,替换同义词,改变语句表达方式来逃避系统的检测。更重要的是,在发表之前先把外文翻译成中文,或者把自己的中文稿件翻译成英文再投稿。知网论文检测系统在技术上只能检测到“文字”,无法检测到“思想”,因此只能避免“文字”复制的缺陷,而无法防止“思想”复制的缺陷[10]。这时需要通过同行评议的方式进行补充评议。
四、文字识别错误
对同一论文使用 Word版和 PDF版进行检测可以获得明显不同的论文重复率,这主要是由于两个版本的文本识别率不同所致。检测报告中有时还会出现乱码现象,也是由于提交的 PDF版论文或数据库中论文出现的字转换错误造成的。
五、转页文字处理错误
当两篇论文共用一页纸,或者同一论文的排版被标记为下一页纸时,检测结果可能会出现错误,即被检测论文与自己重复或误写了两篇,直接导致拷贝率升高,必须人工加以识别。
外文论文检测水平有待提高与突破
通过检查发现,目前外文论文检测结果的复制率较低,这与检测系统中缺乏底层数据和收录外文文献的局限性有关,较低的复制率不能反映论文的真实质量水平。
七、检查报告的阅读和解释
由于测试系统还没有完善,测试报告中还存在其他问题,一些外文会议论文没有标引作者,同作者提交的论文重合问题也不能排除;⑵参考文献与其他论文重合,也计入了总重合率(虽然系统有“删除参考文献后复制比”指标,但有些参考文献没有被识别);⑶外文名字不能自动识别,如XiaoYongSUNVSXiao-YongSun;文字识别错误,笔者检测过一篇论文,其中测试报告显示“删除本人学位论文的文献复制比”为43.4%,“单篇最大文字复制比”为18.4%。后来对比原文,发现检测到的字数为376个,与转换成文本时的4001个字数相差很大,所以考虑到知网论文检测系统中文字转换有误。向有关技术人员咨询后解释:收录资料处理问题导致系统无法读取原文。最后,以 PDF格式将论文以原文上传检测,其结果“排除本人学位论文会议论文中的文献复制率”为0.9%,“最大单字复制率”为0.9%。