论文查重-为何不推荐使用 PDF文件查重论文
我们大部分情况下将论文上传到论文查重检测系统进行查重检测时,都是使用 word文档模式提交检测,这种模式也适用于大多数论文查重网站。在知网的支持下,例如,它可以执行提交文件的查重文档模式,如 doc、 docx、 txt、 pdf等文档。但为何不提倡将 PDF文件用于论文查重?
假设自己的初稿作为查重检测和修改论文,其实并不需要上传除 Word以外的文件,因为 Word文档提交检测后,检测系统会主动进行鉴别,判断是否有本地进行检测。但是, pdf模式的检测结果容易出错,导致检测结果不准确,因为 pdf文件上传到论文查重系统后,系统会将其转码为文本,但只会导致由于转码不准确,系统无法准确地识别出哪些要检测,哪些不应该检测,从而容易出错。
知网查重系统会主动识别声明、目录、脚注、参考文献等不参与查重,不算重复率,但由于 pdf转码出现问题,会造成检测错误,查重结果不准确,下面剖析一下由于 PDF文件提交检测而经常出现错误的地方。
编目编排错误
如果对文件进行了代码转换,那么目录很可能也会被破坏,系统无法识别目录,将其作为主体检测,并将其算作重复率,这样重复率也会增加。
脚注参与主体检测
普通的 pdf转换为 word之后, pdf脚注内容将失去模式,并与正文混淆。这样导致了将参加检测的主体和检测脚注一般都是重复的,这样整个论文的重复率自然会很高。
参考文献,将其识别为正文
同理,参看文献由于装码呈现的是混乱的文献格局,也会导致系统无法识别,还会将后面的参看文献内容当作主体检测,这样必然是不科学的。
不能识别图像会乱码
有些 pdf文件内容是图象模式,这样会形成转换模式识别较差,会出现页面乱码现象,这样检测论文就不可能精确。
我们为更好地防止出现此类不必要的隐患,毕业论文在查重时,最好使用 wps文档模式,这样系统认可度较好,这种模式也是查重论文体系中最友好的模式,如果校园网要求 pdf模式文档提交检测的话,确实有那样的校园,但很少,明确规定,提交 pdf模式文档的校园网,这种情况也只能使用 pdf模式了,那样就可以与校园网基本相同,方便针对性的修改。