首页论文查重动态文献学术不端与学术不端检测的多学科解读

文献学术不端与学术不端检测的多学科解读

时间:2014-05-06 编辑整理:早检测网 来源:早检测网

学术不端与学术不端检测这对矛盾产生的基础是全社会的知识产权保护制度的实施,他们的发展过程是多方博弈的结果,目前达成了动态的有利于学术不端检测系统发展的动态平衡,在法律学上明确了低于2500 字或少于10% 的非“主要部分或者实质部分”引用是合理引用。笔者建议构建一个有利于学术不端检测系统发展的环境,并强调惩戒制度是不可或缺的手段。

“学术不端”现象自古就有,随着20 世纪80 年代计算机技术的普及,变得更加容易也更加猖獗。提起“学术不端”现象,部分有真才实学的人对之痛恨不已,部分人表面上一边义愤填膺的批判,一边在偷偷的变着花样抄袭,还有一些更恶劣的明目张胆抄袭,这些行为直接导致了近10 年来,我国发表论文的增长速度位居世界第一,而论文的平均引用率排在世界100 名开外。[1] 因为是学术界的痼疾,对学术不端讨论的人很多,有识有智之士在批判之余研制了学术不端检测系统,专门用来甄别学术不端现象,自从学术不端检测系统诞生以来,双方就成为一对矛盾体的两面,互相牵制,也在共同发展。

矛盾体双方简介

文献学术不端现象

目前学界对学术不端的探讨非常多,其中有代表性的观点是:1. 无视学术规范,剽窃、抄袭现象;2.毫无新创的低水平重复造成学术泡沫;3. 课题套课题,一稿多投,著作内容重复出版等变相学术欺诈行为等。这些学术不端现象落实到计算机可以解读的方式是:简单抄袭,也就是文本复制;复杂抄袭,包括同义改写抄袭,观点借鉴等多个层次。


文献学术不端检测系统

学术不端文献检测系统以数字指纹、词频统计、自适应多阶指纹特征检测等计算机算法为基本原理,专门用来识别各种形式的抄袭。目前国际上共有10 多个学术不端检测系统,如国外最早的是诞生于2000 年的学生论文作业抄袭检查平台TurnItIn,其后陆续诞生了用于出版集团检测的CrossCheck 系统,用于期刊编辑论文检测的PERK《出版道德资源工具包》(Publishing Ethics Resource Kit) 等。[3] 我国知网于2008 年推出了学术不端检测系统,包括科技期刊、社科期刊和学位论文等端口。其后万方论文相似性检测系统、维普—通达论文引用检测系统和ROST反剽窃系统也相继问世。

目前的检测系统基本上只能对简单抄袭进行检测,对复杂抄袭的检测还处于理论探讨阶段,正是基于这个原因,文献学术不端和学术不端检测才多了很多值得探讨的空间。

矛盾产生的社会学解读

生产资料私有制对知识产权的保护

在生物界,模拟强势样态以获取有利于生存的机会本来是非常普遍的,“在自然界,拟态是竞争有限必需品的进化结果。关于科学变革的进化理论可以解释欺骗现象,就像用有机体的进化解释拟态一样。”基于此,学术不端行为可以被看做是一种在竞争中更容易取得成功的策略,从这个角度来说,其现象的存在是有一定的生物学基础的。

西方到了近代,随着生产资料的私有制,人的智力也自然成为生产资料的一种,并且是私有化的,知识产权成为人们智力成果的代名词,使用了别人的智力成果要么付出金钱,要么进行标引。我国自古以来这个观念就很淡漠,我们一直强调的是个人的成果是集体的一部分,弱化个人智慧的价值,但随着社会的发展,我们也越来越重视知识产权的保护。梳理学术不端及学术不端检测的产生及发展脉络,可以更清楚地辨析其性质。


越轨行为理论

为了从人们内心深处挖掘学术不端现象产生的根源,默顿提出了越轨行为理论,当社会文化很看重某一目标,而达到这一目标的手段对一定地位的人来说又不可获得时,一些人可能放弃文化规定的目标或社会认可的手段,从而产生各种越轨行为。在科学中,对原创性的极端重视和与之相关的名誉、声望以及研究资源的获取,足以构成失范的环境。[5]另外一个很现实的问题是在学术研究中,众多的研究者都对应于某个研究议题,题少人多,自然会出现重复研究的现象。

前人研究过的东西没有必要重复研究,借鉴本是无可厚非的,但关键是,借鉴要有严格的形式,很多人因为主观或客观的原因没有严格遵守借鉴的原则,就导致了学术不端产生。

学术不端现象猖獗到一定的程度,就会吸引整个社会的关注。从道德层面来说,学术不端现象对整个学术系统必将产生极其恶劣的影响,甚至会导致整个系统的崩塌,急需一个能够从技术上抑制的工具。从经济效益层面来说,由于学术不端现象已经非常普遍,对其遏制的系统一定会有广泛的应用,产生较好的效益,所以会吸引相关人士投身该检测系统的研制和普及。

这对矛盾的一方首先要形成一定的规模,才会有矛盾另一方的粉墨登场。只是对于有强烈的自适应性变化的个体文章来说,机器检测是否能够完美地完成其肩负的历史使命,这是我们下面要探讨的博弈理论。

矛盾双方竞争的博弈学分析

博弈的目标与策略选择

从博弈理论来看,这是一个复杂的博弈群体。博弈的一方是论文发表机构,博弈的目标是刊发没有抄袭的论文;博弈的另一方是作者群,博弈者又分为两种,一是没有抄袭需求的群体,一是有抄袭需求的群体。对于论文发表机构来说,利用学术不端检测系统,检测出抄袭者,或者退稿,或者举报,他们在长期的博弈斗争中也了解完全杜绝抄袭现象在目前是非常难的,只能通过不断提高检测的手段做到最大程度的杜绝。对于无需抄袭者来说,他们的学术素养和学术需求已经不需要抄袭,从博弈的角度来说,他们会站在发表机构的立场上对抄袭者谴责和批判。

对于有抄袭需求的博弈者来说,他们要达到通过检测的目的,就必须要遵守两条原则,首先是要站在检测者的立场上思考,其次是会向前展望,向后推理,

以最低的代价达到发表的目标。可以这样解读:大部分的抄袭者知道论文发表机构是强势的,他们也知道一味的抄袭会导致整个学术系统完全崩溃,对于不断提高的检测手段,他们会选择更高级别的抄袭方法。对于这种有强烈的自适应性的抄袭者来说,人的改变比机器的进化要快得多,这注定了抄袭是长期存在的,只是抄袭手段越来越高明,越来越难以检测出来。


博弈的发展结果

抄袭者和检测者都希望这场博弈是一场正和博弈,也就是双方都可以做得更好以在一定程度上维持这个系统正常运转。因为大家都知道“哈丁公用地悲剧”,不加限制的个人选择可能给社会带来灾难,所以博弈最终会达到一个“纳什均衡”,各方都经过一定的妥协形成一种“和平状态”——并不是最优的状态而是最可能出现的状态。目前所达到的“纳什均衡”条件可以解读为:只要被检测的论文没有被系统侦测出来有抄袭情况,检测者就默认通过检测,即使他们知道有更隐蔽的抄袭形式可能存在。这就引出一个必须探讨的终极问题,到底什么程度的抄袭有了作者的创作,已经脱离了抄袭的性质,也就是说除了简单的复制粘贴,隐蔽抄袭和合理引用的界限在哪里。依笔者的经验来看,文章的核心部位的抄袭和意义改写性质最恶劣,但如果作者化用其他作者的论据、推理过程等,以这种形式东抄一点,西抄一点,但最终将这些整合成为自己独创系统,得出了自己的结论,这样还能否称为抄袭,这是我们下面要探讨的论题。

抄袭与合理引用的法律学探讨

抄袭与适当引用的法律辨析

学术不端现象既然包括了文本复制、同义改写抄袭、观点借鉴等多个层次,随着学术不端检测软件功能的提升,学术不端现象也从简单粗暴的抄袭到较难侦测出来的复杂抄袭,甚至有可能有了个人创作的成分,这个界限可以从法律学找到依据。2002 年颁布的《著作权法》的第27 条明确规定了学术论文“适当引用”必须具备如下的条件:

①引用目的仅限于介绍、评论某一作品或者说明某一问题。

②所引用部分不能构成引用人作品的主要部分或者实质部分。

③不得损害被引用作品著作权人的利益。

④应当指明作者姓名、作品名称。也就是说,如果某人引用的目的为了说明、评论、介绍某问题,并且在质和量上不是该作者的主要或实质性部分,也指明了引用的作品,没有损害他人利益,就应该视为合理引用。这里,不太好判断的是“作品的主要部分或者实质部分”。有研究者对这个条例进行了解读,认为“主要部分”主要是对量的规定,“实质部分”是对质的规定。“主要部分”中的量可以参考我国1985 年颁发的《图书、期刊版权保护试行条例实施细则》第十五条:“适当引用”指引用非诗词类作品不得超过2500 字或被引用作品的l / l0,如果多次引用同一部长篇作品,总字数不得超过l 万字⋯⋯


“主要部分”质的判定可以参考我国著作权法中的“思想与表达二分法”原则,该原则认为:作品中思想不受著作权法保护是因为思想是创造表达性作品的基本建筑材料。公开发表作品的思想本来就是给后人借鉴的,不受法律保护,但是表达思想的“表达形式”是受法律保护的,包括书写风格、电影作品等方面。但是要注意“需要将作品中属于公有领域中思想的表达加以排除,因为这部分内容不属于著作权之保护范围”。

通过相关法律法规的介绍,低于2500 字或少于10% 的非主要部分的引用可以视为适当引用,已经脱离了抄袭的范畴了。

2. 判定原则

根据以上对法律和条例的分析,可以总结适当引用与抄袭的法律学界限是:

①著作权法保护的是“独创作品”原则,保护表达形式,而非思想。

②低于2500 字或少于10% 的引用可以视为适当引用。

③引用的部分不是作者作品的

“主要部分或者实质部分”。

对于第一条中,历史事实、客观事实、人类社会的共同文化财富均可适当引用,这有利于社会的进步和发展。另外有研究者解读,根据他人的思想、观点、方法进行创作,模仿别人的风格、方法进行创作,均不属于剽窃。 第三条中,要注意写作的素材可以适当借用,但不可以完全照搬。

矛盾解决的生态学解读

学术不端现象与学术不端检测系统进化论根据学术不端行为的特点,可以将学术不端行为视作是进化论理论框架内的事物。学术不端行为拥有强烈的自适应性。有学术不端想法的人会经过多次的尝试,找到机器的弱点并通过检测,例如现在鉴于“文本复制原理”已经被大部分作者了解,已经有人发明了“反反抄袭”法,包括“改写法”“翻译法”“GOOGLE 法”等,其精要就是,不改变原文的意思,而对文字进行调整、修饰,避免简单的复制粘贴,就可骗过以检测文章重复度为基本依据的“测谎仪”。所以说纯粹的程序和技术控制不是万能的,新标准有可能很快就成为新模式的不端行为超越的标准。学术不端检测系统进化较慢。学术不端检测系统是一个机器,是程序化的代表,一定的程序设定之后至少若干年时间内,是保持不变的,因为程序更新需要一定的时间。不可否认,学术不端检测对“复制粘贴”这种简单抄袭的行为进行了有效控制。要甄别更隐蔽的、没有创造性意义的抄袭,是国内外学术不端检测系统设计者的新目标,这需要对检测原理进行升级和改进,目前来说还是比较难的课题。不过为了解决这个难题,世界范围内普遍的做法是采用同行评议的方式进行补充评议。通过对双方的生态学分析来看,目前无法完全杜绝抄袭,那么选择两者在某种程度上达到生态平衡,并能向有利于遏制学术不端的方向发展,可能是更现实的选择。


利用生态原理建立有利于学术不端检测系统发展的生态环境

灵活运用生物拟态原理。检测人员可以向被检测者暗示拥有功能较强大的论文检测系统,这是基于被检测者并不了解系统进化的程度的假设。担任检测任务的检测人可以采用系统检测、辅以一定的专业知识的人工检测,甚至在送专家检测之后,若发现了复杂抄袭等问题,向抄袭者发出“通过学术不端检测,您的论文被发现有若干的不合理抄袭现象”,以此来模拟该系统拥有更强大的检测功能,抄袭者在接收到了这样的暗示之后,要么会研究新的可以通过检测的方法,要么会老老实实的进行论文写作,这样可以向有利于遏制学术不端的方向发展。利用生物竞争原理建立小型公示制。同行之间最了解相互的研究状况,而且存在竞争法则,以往稿件的专家评审采用的是1 ~ 2 个专家来评审稿件,笔者建议在专家评审前可以增加一个环节。成立一个小范围的有准入制度的学科论坛,将通过检测的待审文章在小范围内公示,选取部分有渊博的学识和高尚的道德的专家组成特别委员会,对公示的相关学科的文章进行甄别,看其是否存在抄袭的现象,由于扩大了该领域检测人员的数量,也更容易发现抄袭现象。


制度保障

学术不端现象之所以如此猖狂,原因之一是不容易被发现,另外对于检测出来的文章惩戒的力度更是缺失。有研究者统计了部分编辑部学术不端现象的处理结果,72.50% 的编辑部处理措施是退稿,25% 的编辑部宣布不再接受该作者稿件,还有进入黑名单、书面警告等措施。对于一旦被检测出来仅仅是退稿、列入黑名单等柔性惩戒措施,抄袭者认为是无关痛痒的,根本不会去理会。所以要有较为严厉的惩戒措施出台。

笔者以为可以依托中国知网等大型的学术网络库,专门设立举报部门和举报制度,对举报并查实的学术不端现象要在全学术圈内公开通报,并与该行为人的职称评定、社会信誉、职位等直接挂钩,实行一票否决制,或视情节轻重,采用更严厉的惩罚。

重塑一个健康的学术生态环境,需要全社会的关注,除了建立一个有利于学术不端检测发展的生态平衡外,惩戒制度也是不可或缺的手段。


文/ 赵 蔚

在线咨询
在线留言
系统列表
返回顶部