时间:2014-04-27 编辑整理:早检测网 来源:早检测网
在学术道德观念缺失、学术不端行为盛行的当下, 公众对于学术研究科研成果的真实性、原创性质疑声不断, 因此, 端正学术精神、净化学术空气成为公众和学术界的一致要求, 论文检测系统在此大环境下应运而生。国外的文献检测系统软件有TURNITIN, CROSSCHECK, MYDROPBOX; 国内有ROST 反剽窃(文档相似性检测)、PSDS (论文相似性检测服务)、AMLC (CNKI 多语种图文学术不端文献检测系统)。国外的TURNITIN, CROSSCHECK等系统用于英语领域, 中文资源少, 局限于文字相似的检测, 不能有效应对修改、图文等抄袭行为, 检测效果一般。对于中文领域, 大多采用国内PSDS 与AMLC。笔者所在的编辑部采用的是AMLC, 该系统是世界上第一个以海量全文文献为比对资源、大规模实际应用于学术出版和科研管理的多语种图文学术不端文献检测系统。
Application of CNKI Multilanguage Literatures Detection System for Image-text
Academic Misconduct in Editing and Reviewing Work
(North Automatic Control Technology Institute, Taiyuan 030006 China)
Abstract: The paper was introduced extensive use of AMLC, and analyzed advantages and some limitation of AMLC in editing
and reviewing work. Finally, the paper was researched and obtained editing should be combined with practical work, expanding
knowledge, using information tools, taking the necessary coping strategies and constantly improving refereeing work.
Key words: academic misconduct; literatures detection; editing and reviewing
根据2012 年“中国知网” 学术期刊数字出版重要成果的通报, 学术不端文献检测系统广泛应用于全国5 400 家期刊编辑部、543 家研究生培养单位、413 家本科院校、1 126 家科研管理机构, 1 月至9 月检测稿件370 万篇, 有效抑制了各种学术不端行为。
检测方法简单、使用便利。AMLC 在稿件检测过程中使用方便, 类似于电子邮箱的使用方法, 只要上传文献, 进行文献检测, 然后下载检测报告就可以, 简洁明快、使用便利。
检测速度快, 为编辑初审节省了时间。该系统, 检测普通期刊论文只需几秒种的时间, 且支持多种论文格式, 还提供批量检测, 并迅速给出检测报告。对于经过论文检测系统筛查的文章, 其抄
袭率和抄袭部分一目了然, 编辑可根据检测结果对文章进行评估。由于每个编辑部对于抄袭率的认定程度不同, 对于引用文献段落是否算作抄袭的认定不同, 检测结果作为编辑稿件初审的有效参考非常必要。对于一些有一定学术价值的文章, 部分编辑部还将文章的检测结果发回给投稿人, 作为其修改稿件时添加标注的依据, 这也在一定程度上方便了投稿人对文章的修改, 节省了审稿时间。
检测结果较为准确。该系统使用的支撑数据库是国家“十一五” 规划项目的中国知识总库,比对资源较全面。同时, CNKI 依托清华大学技术优势开发的自由专利技术———多阶自适应性指纹比对分析技术, 确保了结果的准确性。
避免了一稿多投和抄袭行为。检测报告可以在第一时间给出论文的相似度, 对于一稿多投和剽窃他人学术成果的论文当即作出判断, 这在很大程度上帮助编辑部节省了大量的时间和精力。全世界每年产出的论文不计其数, 编辑已经不可能针对某一领域的文章进行一一比对。因此, 检测系统帮助编辑初步实现了这一不可能完成的任务, 极大地避免了一稿多发的尴尬, 减少了学术腐败的可能性, 为编辑工作提供了极大的便利。
数据库资源的局限性。抄袭检测并非由检测系统独立完成, 它必须依靠强大的数据库做平台。数据库的不完整、不全面、不深入都将会给检测的真实性带来一定难度。虽然用做比对的资源库是成千上万篇学术文献及上百亿网络资源库, 但对专利、广播电视等文献数据源目前还无能为力。
存在检测盲区。笔者在实际使用中发现AMLC 存在一些检测盲区, 第一是没有实现跨语言匹配, 大量外文资料、文献没有被收录, 对外文文献检测存在技术障碍; 第二是对图表、框图、公式等自然科学类文章, 数据库不能完全比对, 一定程度也影响重复率的准确性; 第三是存在时间上的限制,早期的、最新文献和待审、待发表、未公开发表的文章仍收录不全。
对“反抄袭” 手段无法检测。该系统同时又成为学术不端行为的“升级” 因素, 有些作者通过玩文字游戏, 将他人的文章进行语序调整和分离, 也对检测造成一定难度。
时效性差。该系统为有效界定抄袭、剽窃、一稿多投、不当引证, 提供了简单、实用、高效的技术手段。从使用情况看, 检测结果绝大部分是客观、准确的。多数情况下, 当一篇文稿的文字复制比小于10%时, 稿件一般很少有问题; 大于20%时, 或多或少存在一些问题; 大于40%时基本可界定为存在抄袭。
笔者所在编辑部2011 年所刊登稿件当时全部通过不端文献监测系统(小于40%), 结果2012 年初接到中国知网对本刊2011 年刊出论文的检测反馈意见时, 发现有3 篇稿件检测结果大于40%。究其原因, 发现是年初和年底知网收录的稿件相差几十万篇, 那么2011 年刊登的稿件在2012 年检测的重复率自然就高, 这就是时效性的问题。
1) 针对在不端文献检测中出现的问题, 中国知网学术不端文献检测系统也在不断改进中。据中国知网2012 年8 月的重要成果通报, 该系统增加了表格检测、观点检测等多项功能, 那么有些过去被认为是检测盲区的内容以后将不再是盲区。
2) 针对时效性问题, 本编辑部采取增加检测次数的办法。初次检测系统显示合格但检测相似度较高的文章, 在发表前再做一次检测, 这样虽给编辑工作带来了不便, 但是可以防止因上传间隔时间长而带来的一稿多投、提前发表的学术不端行为。
3) 要正确利用AMLC 的检测结果。系统检测产生的报告只能当做参考, 不能取代专家, 其结果把可疑文字称为重合率, 并不是抄袭率, 所以, 编辑不能单纯依赖检测系统的重合率来决定稿件的取舍, 这就要求编辑要具体分析、仔细评判稿件。总之, 我们应该清楚地认识到, 事物都有两面性, 有好的一面必然有其不好的一面, 两方面相辅相成, 论文检测系统也是一样, 我们改变不了检测系统本身的功能, 但是希望检测系统功能不断完善, 使我们最大限度地做好编辑的工作。
参考文献:
[1] 王宇.学术不端文献检测系统研究综述[G]// 第10 届全国核心期刊与期刊国际化、网络化研讨会论文集,北京:中国科学技术期刊编辑学会,2012:9.
[2] 宋爽.论文相似性检测服务在编辑工作中的使用与思考[G]// 第10 届全国核心期刊与期刊国际化、网络化研讨会论文集,北京:中国科学技术期刊编辑学会,2012:9.
王丽华
(北方自动控制技术研究所,山西太原030006)