时间:2014-09-13 编辑整理:早检测网 来源:早检测网
中国科学技术信息研究所近期发布的《中国科技论文统计结果》显示:2001 年至2011 年11 月1 日,我国科技人员共发表国际论文83.63 万篇,排在世界第2 位[1].但是,数量并不代表质量.我们必须正视“高产”背后的学术不端科学和教育事业带来的负面影响.学术不端的常见的3种形式为:剽窃、不当引用和一稿多投.目前学术界利用计算机信息分析技术开发了反剽窃软件———科技期刊学术不端文献检测系统学术不端文献检测系统(AMLC).它不但检测文献总的文字复制比例,还详细列出检测文献中每一段雷同文字的详细出处,并准确定位,为编辑对稿件定性分析提供了较为准确的数据支持.医学属于自然科学,其研究均是在大量前人研究的基础上进行的.但抄袭与合理使用均会出现文字复制情况,杨柱星等发现医学论文多存在不同程度的文字复制情况,不同类型论文中重复文字,分布不同.本文通过分析医学论文的特点及AMLC 检测结果,探索了AMLC 的优化途径,以更好的遏制医学论文学术不端行为.
医学是实践性很强的经验科学,观察对象的齐同性、结果的可重复性是医学科学研究的两个重要原则.医学论文是科技论文的一种,其种类较多,但均有其独特的共同属性:内容要求有科学性、创新性和理论性;格式要有规范性;文字要简洁且具可读性.医学论文的共同点:
⑴很多医学科技期刊的同类的医学论文有其固定的书写格式.以论著为例,其基本格式包括:前言、临床资料、治疗方法、结果和讨论几部分.以报道某种疾病新的疗法为例,疾病的诊断标准、疗效判定指标、公认的检验方法及目前公认最有效的治疗方法和适用的统计学处理方法是一致的.而AMLC 系统对数字和符号不敏感,因此此类论文会有不少相同之处;
⑵疾病的概念、发病机制、治疗中使用的药物成分及其作用机制等均为公知公认的,故此方面的文字均可能会被AMLC 认定雷同;临床医学论文讨论的思路较为固定,均是在总结前人成果,探讨其存在的问题,分析原因,提出新方法的可行性及优越性,最后得出结论.然而,总结前人成果部分会导致AMLC 系统误认为“抄袭”.
⑶对于基层医院医生,因其条件有限,故其医学论文多为用他人方法重复自己的实验或对现行的公认有效的治疗方法进行观察、分析及总结,因此其论文中所涉及的语句亦难免有雷同.⑷同一作者或同一课题组撰写的延续性的研究成果或综述类文献会与其之前发表的相关文献在文字及内容上会有较多相似之处.
AMLC 系统是国内知晓度和认同度最高的反剽窃文献检测系统,对预防和检测科技期刊论文的学术不端行为起到了重要作用.该检测系统功能强大、检测速度快、检测结果客观.但此系统还存在着一定的局限性、滞后性及有待完善的地方,需不断地优化.
2.1 AMLC 的优势
⑴包容性强.不但可对目前常用的九种格式(txt,doc,docx,caj,pdf,kdh,nh,rtf,eml)不同的文档检索,还可使用压缩文件及手工录入. ⑵检测速度较快,其原因可能是:①不需要文献格式的转换;②所需检索及匹配的范国较少. ⑶结果清晰,对于文字完全重合的地方,系统会将其描红并做出链接,双击会显示出其与哪篇论文存在相似之处.检测结果列表表示. ⑷对其自身的局限性有一定认识,对检测对象的归档可由编辑部自行斟酌处置.⑸资源共享,如检索文献在它刊或其它时间已被检索过,其均可显示出来,有效预防了一稿多投或多次重复检索.
2.2 AMLC 的局限
(1)对软性抄袭还无能为力.软性抄袭即将抄袭别人的观点和论证方法,用自己的语言写出来;(2)无法识别图片和表格.科技期刊论文涉及大量的公式、符号以及图片而对有某些作者不同文章中图表中数据的雷同无法识别,难以遏制“编造数据”方面的学术不端;(3)只能按一定数量的文字是否相同来检测是否为抄袭,无法做到语义分析;(4)不收录外文资料且其文献源数据不够全面,对作者把外文直接翻译成中文后发表的现象未能检测出来; (5)对不同格式的同一篇文章检测结果会不同;(6)期刊上网有滞后期,且有部分期刊并未加入CNKI 网.
AMLC 系统进行检测的是受程序控制的机械比对,没有主观能动性的.因此AMLC 检测学术不端的功能可从两方面进行优化.
3.1 优化AMLC 系统
⑴增加公式、图表的检测.⑵完善源文献库,扩大收录的种类如专著、外文资料与文献、互联网资源尤其是专业网站;对已收录的期刊尽可能将其收录完全,如在此库建成前的文献均要收录;对合法的期刊均应收录;及时更新数据,最好是出刊即上网.⑶提高检测技术,采用更智能的比对算法和比对策略,杜绝软性抄袭. ⑷攻克跨语言匹配的技术难点.
3.2 发挥编辑能动性
AMLC 毕竟是基于计算机语言的识别系统,不具备人脑对文字所表达的科技文化内涵的理解能力,而越是机械的“安检”就越需人工的全局调控.因此,“人机合一”,发挥编辑能动性,才能更有效地遏制医学论文学术不端行为.
3.2.1 理性看待AMLC 系统检测结果
科研必须是在前人研究成果的基础上进行创新研究, 因此其论文往往会涉及前人学术论文的相关内容.引证是知识传承过程中的一个重要环节,是学术论文的一个非常重要的组成部分,但引用不等于运用或应用.参考文献是作者撰写论文而引用的有关期刊论文和图书资料,它显示论文的起点、深度和广度.作者撰写论文时引用了他人研究成果的是其权利,同时将其体现在参考文献中则是尊重他人成果的体现.如作者已将此注于参考文献则应视为合理引用而非抄袭.以医学综述为例,其为评论性文献,是对大量原始研究论文中的数据、资料和主要观点进行归纳整理、分析提炼而写成的论文.“综”即综合性,综合分析和归纳整理前人成果.“述”就是从文章中反映出作者赞赏、推崇、同意的论点或不赞赏或反对的论点.综述的参考文献一般30 条左右. 其正文又主要包括论据和论证两个部分, 因此综述的重合率较其它类型的偏高是合理的.当AMLC 检测结果较低时且论文涉及大量的图表、公式时,编辑要注意查重,因AMLC 系统对此类内容无检测能力,此时其检测结果的可信度会较低.因此编辑审查时如只以AMLC 系统的检测结果决定论文的学术质量是不完全客观公正的,因此不能过分依赖.由于医学论文的特殊性,编辑要理性看待适当的引用和临摹.
3.2.2 编辑的责任心以及专业技术水平是刊物质量保证
(1)编辑要有责任心、有使命感,必须以出版优秀出版物为己任,应做到逐字逐句查核,严格把好文字关与语言关,不应以“文责自负”作为省去论文的编辑加工工作,放弃了选择优化权,淡化了编辑在文章出版过程中的重要作用.
(2)自身专业知识的积累,对本领域了解的加强,英语水平的提高,均可提高编辑鉴别稿件的鉴赏与评价能力.
(3)正视AMLC 系统本身存在的局限性,发挥主观能动性,综合分析稿件的内容及参考文献引用的合理性.
(4)区分重合部分是合理的引用还是抄袭.需注意的是无论何种论文,其引证部分均不可作为文章的主体.
(5)辅助采用万方、维普、谷歌等较权威检索及数据库系统进行稿件辅助审查.
(6)注重细节:①看参考文献,如果一篇论文的参考文献几乎都是外文文献,则除非此作者的学术水平较高,否则作者翻译外文资料,甚至直接剽窃外文论文的可能性会较大,此时编辑需认真核对;②看电子版,如果一篇论文的电子版上有多处非正常使用Word 等留下的编辑符号,则也可以判断这篇文章有部分内容是直接粘贴复制其他文献资料,需要重点排查. 同时建立对编辑的问责制度可有效防止个别编辑把关不严甚至腐败的行为.借助AMLC 系统的优势,发挥审稿专家的作用,积极主动采取相应对策,尽可能在编辑初审前排除问题稿件,可以净化学术环境,防学术不端于未然,保证刊物的稿件质量.