首页论文检测教程使用Turnitin检测系统研究英语专业硕士毕业论文的语言错误

使用Turnitin检测系统研究英语专业硕士毕业论文的语言错误

时间:2014-10-18 编辑整理:早检测网 来源:早检测网

本文基于自建语料库对高校英语专业硕士毕业论文中的语言错误进行分析和研究。研究结果表明,英语专业硕士毕业论文的语言错误比较严重,冠词错误、不完整句子、连写句等错误频率较高的5 类错误占总错误量的86. 43%,其中冠词错误频率最高。“985”高校和“211”高校硕士论文的语言错误率总体上不存在显著性差异,但普通高校和这两类高校硕士论文的语言错误率之间存在显著性差异。文章同时分析了英语专业硕士毕业论文语言错误产生的原因,并总结了研究结果对英语论文写作教学的启示。

1. 引言

外语学习是十分复杂的过程,学习者在这一过程中会不可避免地犯错,因而研究语言学习错误对于探索语言习得规律和指导学生写作具有重要作用。近些年来,外语学习者语言错误持续得到国内外学者的关注。然而,多数研究只是针对本科生英语学习者写作,关于研究生英语写作的语言错误研究十分有限。本文通过自建英语专业硕士毕业论文语料库,分析讨论英语专业硕士毕业论文写作中的常见英语语言错误及错误产生的原因,并提出相关问题解决建议,以期提高英语专业硕士研究生的论文写作水平。


2. 相关研究

Corder 于1967 年、1971 年发表两篇文章“The Significance of Learners' Language Errors”和“Idiosyncratic Dialectsand Error Analysis”,标志着语言错误分析研究的开始。之后,语言错误分析的研究成果相继出现。我国学者也逐渐探讨英语语言错误。桂诗春和杨惠中( 2000) 的《中国学习者英语语料库》是国内最早的大学生和中学生英语语言错误研究成果。不少学者分析研究了本科生英语语言错误( 如李景泉,蔡金亭2001; 刘芳2004; 陈正伦2012; 赵平静2012; 杨玲2013; 周一书2013 等) 。国内外也有学者对研究生论文写作进行了探讨。Hyland( 1990) 调查了非英语专业硕士研究生的科研论文结构等问题; Deng 等( 2010) 研究了研究生的学术论文写作,分析了写作语言错误; 王丹妮( 2004) 研究了硕士论文中的语篇错误; 向婵( 2006) 调查了华中科技大学非英语专业硕士论文结尾部分的共同特征; 刘敬伟和冯宗祥( 2010) 基于语料库对硕士论文中的被动语态使用情况进行了研究; 姜亚军( 2013) 研究了我国英语专业硕士学位论文标题的词汇句法特征。但是,总体而言,关于研究生论文写作语言错误的研究相对不足,且相关研究有的是文献综述,有的只涉及论文正文之外的部分。有鉴于此,本文基于自建小型语料库,尝试探讨分析英语专业硕士毕业论文的常见语言错误及其他语言问题,并提出相应解决建议,从而促进英语专业硕士研究生英语写作水平提高。


3. 研究设计

3.1 研究问题

本文主要探讨以下两方面问题:

( 1) 英语专业硕士毕业论文存在哪些高频英语语言错误? 是什么因素导致了这些错误?

( 2) 不同层次高校英语专业硕士毕业论文中的高频英语语言错误有何差别?

3. 2 研究材料

本研究使用的语料来自我们自建的十年语料库。语料包含从全国42 所高校2006 至2008 年硕士毕业论文中抽样选取的230 篇论文,论文按照作者所属高校分为“985 工程”高校、“211 工程”高校和普通高校论文3类以供研究。

3.3 研究工具

本研究采用国际上广泛使用的Turnitin论文检测系统作为研究工具。Turnitin 是一个基于互联网的反剽窃和语言错误检测系统,通过互联网将用户提交的文稿与Turnitin 海量的全球数据库和网页内容进行比对,能够快速识别、标注和归类上传文本中的错误。研究者根据Turnitin 定位的文稿语言错误对论文做出客观判断,从而能够更有效地评估论文。Turnitin 公司与ETS( 美国教育考试服务中心) 合作创建了GradeMark 语法分析工具,这一工具可用于语言错误甄别和反馈,自动标注文章中的拼写、语法、用法、风格错误等。Turnitin 系统极大提高了作文批改的速度和一致性,形成的错误诊断报告可直接导出至SPSS 系统,方便数据归类和分析。

3.4 研究过程

首先,将230 篇英语专业硕士毕业论文上传至Turnitin 系统网站,通过GradeMark 得到错误诊断反馈数据。有少量论文因格式受到Turnitin 系统的检测限制或其他原因未能得到反馈,最后共得到210 篇论文的数据用于分析研究。GradeMark 对论文语言错误进行诊断后,将错误分为15 类。然后,为保证诊断结果的可靠性,由专业人士再次检查核实语言错误。结果发现,有些正确的句子被Turnitin 系统误判为病句,这些“语言错误”在手动评审阶段被校对为正确。最后,对每种类型错误的数量进行统计,通过SPSS 分析语言错误的分布情况,并结合相关文献对语言错误展开进一步研究。


4. 结果与讨论

4.1 语言错误描述与分析

本节主要回答第一个研究问题: “英语专业硕士毕业论文存在哪些高频英语语言错误? 是什么因素导致了这些错误?”分析210 篇英语硕士毕业论文的15 类语言错误时,研究者去除了“拼写错误”类,具体统计了14 类错误的数量及其比例,剖析了几大类高频错误及其产生的原因。

4.1.1 语言错误频率

我们对英语专业硕士毕业论文中英语语言错误的数量和比例进行了统计分析,结果如表1 所示。


从表1 可以看出,在14 种语言错误中“冠词错误”发生的频率最高,“不完整句子”的频率位居第二,“连写句”的频率第三。频率末三位的错误是“表述错误”、“错误或遗漏词”和“代词错误”。频率位列前三的错误占错误总数的75. 26%,可以说是英语专业硕士毕业论文中十分普遍的错误。以下具体分析频率前三的语言错误。

4.1.2 冠词错误

由表1 可知,冠词错误是英语专业硕士毕业论文中出现频率最高的错误,占32. 91%。这说明研究生在英语冠词习得和使用方面普遍存在一定障碍,应该引起重视。冠词错误一般分为3 类: 冠词缺失( omission) 、冠词冗余( redundancy) 和冠词误用( confusion) 。冠词缺失的例子包括: ( 1) to certain extent,( 2) at same time;冠词冗余的例子有: ( 3) for an instance; 冠词误用的例子有: ( 4) the material in a newspaper is easy to understand。冠词错误之所以是英语专业硕士毕业论文中频率最高的错误,主要有两方面原因: 其一,汉语中没有冠词,因而中国学生在英语写作中更容易在使用冠词时出错。其二,传统英语教学重实词而轻虚词,这也使得冠词使用成为学生英语使用的弱项。


4.1.3 不完整句子

“不完整句子”( fragment) 是英语专业硕士毕业论文中的第二大类错误,占30. 99%。Turnitin Website 对这类错误是这样解释的: “A fragment is not a complete sentence because its thought is not complete,even though it starts with a capital letter and ends with a punctuation mark. It is missing either a subject or a verb or both. ”也就是说,一个完整的句子应该包含主语、谓语动词,并表达完整的句意。如果缺少这些元素中的任何一个,句子便是“不完整句子”,如:

( 5) Within each group,a wide range of features to choose from. It was difficult to distinguish between them.

( 6) By paying too much attention to the teaching material can make students unwilling to propose new ideas.

例( 5) 是不完整句子。虽然在一些诗歌和广告中有类似不完整句子,但论文写作要求语言使用严谨、规范,因而这种用法在Turnitin 中被判为错误。例( 6) 同样是不完整句子。出现这种错误的原因很可能是学习者用汉语思维写英语句子,或者将汉语句子翻译成英语句子进行写作。

4. 1. 4 连写句

英语专业硕士毕业论文中的第三大类错误是“连写句”( run-on sentence) ,占11. 36%。Turnitin Website对“连写句”的说明是: “An independent clause has a subject and a verb and can stand by itself as a sentence.When two or more independent clauses are joined incorrectly within a single sentence,the result is a run-on sentence.”连写句包含两个及以上的从句,却没有使用合适的连词。Turnitin 认定的连写句包括两类。第一类是两个从句之间缺乏合适的连词,如:


( 7) Students who don't pay enough attention to the rule restriction are careless they made such mistakes.第二类是直接使用逗号连接两个独立的句子,如:

( 8) The fourth step is the explanation of the error,explanation is concerned with establishing the source of the error.


例( 7) 和例( 8) 两个例句都比较长,学生在写长句时容易犯“连写句”错误。为减少此类错误发生,外语学习者在写作时应正确运用语法、句法规则,在写作过程中仔细检查,确保每一从句结构完整。母语负迁移是导致上述语言错误的最重要原因。也就是说,学生在英语写作中会用母语思维方式或语法规则写英语句子。根据语言对比分析理论,当母语和目标语结构差异较大时,容易产生负迁移。而当目标语和母语存在相似之处又不完全相同时,学生在目标语运用中却最容易“盲目照搬”,产生负迁移。

4.2 不同层次高校论文的高频语言错误对比

本节重点回答第二个研究问题: “不同层次高校英语专业硕士毕业论文中的高频英语语言错误有何差别?”在本文中,首先依据高校类别确定高校层次,“985”高校、“211”高校和普通高校分别代表从高到低3 种不同层次的高校。然后,再对不同层次高校英语专业硕士毕业论文中的高频英语语言错误进行对比分析。

4.2. 1 语言错误分布

图1 显示,在“985”高校学生的论文中,“不完整句子”的错误最多,占32. 10%。“冠词错误”接近30%,“连写句”错误占12. 17%,“介词错误”和“易混淆词”分别占5. 72%和5. 18%。这些错误的数量位居前五。


图2 表明,在“211”高校学生的论文中,“不完整句子”是最常犯的错误,占35. 95%,“冠词错误”占25. 72%,“连写句”错误占11. 26%,“介词错误”占6. 91%,“易混淆词”错误占6. 23%。这些是数量前五的语言错误。

从图3 可以看出,在普通高校学生的论文中,“冠词错误”最多,占40. 43%,这和“985”高校和“211”高校学生最容易犯的错误不同。“不完整句子”错误数量第二,占26. 68%,“连写句”错误占10. 83%,“介词错误”占6. 08%。其他错误的比例都不到5%。


根据统计结果,3类不同层次高校英语专业硕士毕业论文中具有显著性差异的错误包括介词错误、连写句、代词错误、冠词错误和不完整句子,尤其是介词错误和连写句的差异极为显著。以下主要以介词错误和连写句为例对不同层次高校英语专业硕士毕业论文中的高频英语语言错误进行分析。

4. 2. 2 介词错误分布

表2 表明,普通高校硕士论文介词错误的平均值( 14. 73) 最高,其次是“211”高校论文( 11. 81) ,“985”高校论文的平均值( 10. 10) 最低。普通高校论文中,介词错误率最高的一篇论文中出现了49 次介词错误,错误率最低的论文中出现2 次介词错误。“985”高校论文和“211”高校论文中介词错误的最大值和最小值则分别是25 和1、27 和2。


对介词错误的多重比较分析结果显示,“985”高校和“211”高校论文的介词错误频率分布非常接近( 10. 10, 11. 81) ,“985”高校论文和“211”高校论文的介词错误频率差异不存在统计意义上的显著性。然而,普通高校论文的介词错误频率( 14. 73) 则高于“985”和“211”高校论文,并与这两类高校论文存在显著性差异( 见表3) 。


4. 2. 3 连写句分布

表4 显示,“985”高校和“211”高校硕士论文连写句最高错误率分别是53 次和40 次,前者高于后者,两者的最低错误率则分别是2 次和4 次。在普通高校硕士论文中,连写句平均错误频率( 26. 23) 明显于“211”高校( 18. 71) 和“985”高校( 21. 50) 论文,错误频率范围也比其他两类学校大,最大值为78 次,最小值为7 次。


对连写句的多重比较分析结果( 见表5) 表明,普通高校论文和“211”高校论文连写句错误频率比较的Sig. 值是0. 000,和“985”高校论文比较的Sig. 值是0. 006,也就是说普通高校论文和“985”高校、“211”高校论文的连写句错误频率存在显著性差异。“985”高校和“211”高校论文的连写句错误频率比较的Sig. 值是0.104,两者之间不存在显著性差异。


此外,代词错误、冠词错误和不完整句子错误分析也得出了类似结果。据此可以推断,“211”高校和“985”高校硕士论文的错误总体上不存在显著性差异,但是普通高校硕士论文和“211”高校、“985”高校论文之间总体上存在显著性差异。

5. 结论与启示

5. 1 主要研究结论

本文对国内42 所高校210 篇英语专业硕士毕业论文的英语语言错误进行了分析和研究,得出了以下主要结论:

( 1) 英语专业硕士毕业论文常见的语言错误有15 种类型,冠词错误、不完整句子、连写句、介词错误和易混淆词是频率前五的错误,占所有错误的86. 43%。错误频率最高的是冠词错误( 32. 91%) ,其次是不完整句子( 占30. 99%) ,这说明中国学生在英语冠词使用上存在相当严重的问题,正确使用冠词和撰写准确完整的句子是英语写作的难点。关于英语语言错误产生的原因,则主要是母语负迁移、目的语规则应用错误或泛化以及写作策略运用不当。

( 2) 就不同层次高校英语专业硕士毕业论文的语言错误而言,在不完整句子、介词错误等错误上,“211”高校论文的错误率高于“985”高校论文,而在冠词错误、连写句等错误上,“985”高校论文的错误率高于“211”

高校论文,但总体上两者的语言错误率不存在显著性差异。普通高校论文和“211”、“985”高校论文的错误差别较大,在总体上存在显著性差异。从具体错误类型来看,虽然3 类高校论文在冠词错误等5 类错误的频率上存在显著性差异,但在其他9 类错误上的差异并不显著,这表明这些学校的英语硕士生普遍存在一定程度的写作困难。

5. 2 教学启示

本文结论对于英语论文写作教学具有一定启示意义,具体表现为以下方面:

( 1) 英语论文写作要高度关注语言使用的准确性和规范性。外语教师要特别关注冠词错误、不完整句子、连写句、介词错误等错误频率较高的语言错误,帮助和引导学生纠正这些错误。对学生而言,为减少和避免语言错误,应该多写多练,培养语感。写作是一种需要大量练习的技能,但是目前研究生的英语写作练习量远远不够,必须加大研究生的写作量,使学生在充分的写作实践中提高语言运用水平。写作和翻译考察的是语言产出能力( 王瑛,黄洁芳2014) ,而毕业论文是衡量研究生英语语言产出能力的重要标志,对毕业论文写作必须高标准严要求,切实促进研究生英语语言水平提高。

( 2) 不同层次高校教学相关人员应对硕士研究生的英语写作能力给予重视。尤其是普通高校应常到“985”高校和“211”高校学习取经,使研究生的英语写作能力能够迎头赶上。本文也发现部分语言错误由学生的粗心所致,因而学生一定要认真仔细反复阅读所写论文,及时发现、纠正错误,或者也可开展同伴互评,相互纠正错误,最大限度地降低英语写作错误水平。


在线咨询
在线留言
系统列表
返回顶部