刘小姐是北京一传媒集团老总的秘书。她工作的一项内容是验收员工的培训心得,但随之而来的网上搜索让她不胜其苦。 她说,“每次都有上百篇文章交上来,老总要求每篇都在网上搜索一下,看看是不是抄袭的。有时候,老板自己也亲自搜。”上个月,她查出两份学习心得是一字不改抄袭来的,老板很生气,当即开除了这两个经营部门的人。 刘小姐觉得,对每篇文章都上网搜索,工作量比较大。而且,遇到剪刀加浆糊式的抄袭,也不好判断人家是不是抄的,总不能把每段都拆开去搜。她希望能有个软件来自动完成这个工作,“这样,得罪人的事儿,就不用我来干了。”她从新闻上看到大学开始使用“反抄袭”软件检测学生论文时,很感兴趣,也去网上注册想要使用这个系统,但至今未获授权。 与刘小姐一样想找个“反抄袭”软件的,还有出版社的编辑严燕。她主要编辑文学类小说,“抄名著还好发现,但有些抄袭对象不是有名作品,我也不可能都看过,不好发现,一旦出版之后会很被动。”她也希望有个“反抄袭”软件帮她筛一下书稿,减轻一下工作量。 目前,国内的反抄袭软件主要有两套:一套是由中国学术期刊电子杂志社与清华同方知网共同研制的学术不端行为检测系统,另一套是武汉大学副教授沈阳研发的ROST反剽窃系统软件。这两套软件都只对高等院校和科研单位进行检测服务,而且免费,但并不对公众开放。 但记者在淘宝网上发现,用这两种系统提供检测服务的店铺为数不少,而且大多生意不坏。在开发这两家系统还都免费的时候,已经有人从中赚取了“第一桶金”。 “反抄袭”软件:一天注册用户6000个 今年年初,全国各大高等院校使用“反抄袭”软件检测毕业论文的新闻见诸报端,,“反抄袭”软件随后一直处在舆论的风口浪尖之上。“现在几乎天天都有人来找我们,要求授权他们使用‘学术不端行为检测系统’。”中国知网科研诚信管理系统研究中心主任孙雄勇告诉中国青年报记者,“每天大量用户注册申请使用,年初最高峰时,一天注册了6000个用户。” 孙雄勇说,虽然每天都有大量注册,但目前开放授权的,基本都是学术科研领域——机构用户和研究生导师,并且要签保密协议。因为担心一旦开放给个人用户之后,会产生不可预料的后果。 这个“学术不端行为检测系统”,是世界首个用全文文献为比对资源检测抄袭行为的软件系统,由中国学术期刊电子杂志社与同方知网公司联合研发。其耗时3年,2008年12月底研制成功,2009年3月研究生院开始使用。据孙雄勇介绍,到6月底,已有3000家期刊编辑部和360多家高校的研究生院在使用,基本上覆盖了全国重点院校。 虽然用户很多,但基本都是免费使用。因为这样的用户,都是知网的论文供应商。知网的主营业务是数字出版,主要是通过合法渠道收集论文,再把这些论文整合后打包卖出去,但近年收稿质量开始下降,“用户经常投诉论文库中有重复,编辑部也为此头疼。所以要求公司开发一套系统来检测。”孙雄勇说。 该系统的技术核心使用了“自适应多阶指纹特征检测技术”,能够防止抄袭中的一些方法,比如替换一些词句、颠倒顺序、重组段落等等。“指纹”是这篇文章的信息特征,简单的手段改变不了这些特征。每一次检测,待检文章首先按照篇章、段落、句子等层级分层处理,然后创建指纹,而比对资源库中的比对文献,也采取同样技术创建指纹索引,根据其重合处的比例,判断该论文是否存在抄袭行为。目前,这个系统用做比对的资源库,是有6000万条学术文献的数据库及上百亿网页的网络资源库。 反抄袭需求五花八门 目前,上述系统每天增加的用户,主要是企业的科研机构和各类科研院所。从用户反馈看,孙雄勇觉得效果挺好,“基本都是要求增加比对范围。” “有个知名出版社试用时检测了两部准备出版的书,一部60万字,一部80万字。其中一部检测出,作者大量发表过的文章充斥其间。而编辑约稿时明确要求,不能使用发过的文章。” “还有来检测公务员出国考察报告的,一次,检测出了两篇考察德国和澳大利亚经济运行模式的报告,都是抄的。” 今年3月,给各高校研究生院做培训的时候,有一知名大学的老师提出,应该开发跨语言检测系统,“有些作者不参考中文材料,而是直接拿英文文章翻译成中文属上自己名字。”孙雄勇说,目前正在开发跨语言的检测系统,已经接近完成,可以有效解决此类问题。 还有各种需求找到知网的,都要使用这套“学术不端行为检测系统”。包括,有的单位人事处要查职称论文的,也有导师想查学生作业的,还有要查征文是否为抄袭的。目前,各种行业的这类需求都非常多。 期间,也有各种声音在质疑这套系统——除了在校等待毕业学生的很多抱怨外,也有专家质疑这套系统治标不治本。有观点称,每年研究生毕业好几万人,不可能每篇文章都有新观点。 孙雄勇也认同这样的判断。但他认为,是大家误解了这套系统的目的——不是检测创新,只是防止抄袭。没有新观点和文章抄袭别人文章是有很大区别的。 “这套系统的定位应该是学术成果的验收辅助工具。”孙雄勇表示,他们最近曾经帮助科技部做过一次重点科研项目的论文检测,“结果就很好,只有个别文章有部分雷同,相关专家只需要比对这些部分就可以了。” 检测不可能永远免费 反抄袭系统无论多优越,可以反剽窃,但是反不了代写。在这两家反抄袭系统推出之后,网上代写论文的标价应声而涨,而且都声称可以通过反抄袭软件的测试。 “不能相信他们说的。”在一个代写论文的广告帖中,一网友留言说,“收到论文之后,最好到淘宝找个检测论文店铺看看能不能通过。”而在这个帖子之前,有两个跟贴询问,是否真能通过反抄袭检测。 截至目前,上述系统已经累计检测了20万篇次。由于每天检测数量比较多,服务器的运算压力很大。以后是不是还要免费提供检测,孙雄勇说,虽然公司目前没有具体的收费计划,但也不可能永远免费下去。 而更广泛的检测抄袭,跨越“学术不端”到非学术领域,孙雄勇表示,只要扩大比对库就可以实现,在技术上没障碍,“但是否把这个需要当作市场来开发,公司目前还没计划。” 据悉,目前国外也有类似的检测系统,早已广泛应用于多所高校及科研机构。最受欢迎的是反抄袭服务公司Turnitin.com,能够将学生的论文与网上所有内容以及该公司的论文数据库进行比较,从而发现问题。目前Turnitin.com的客户遍及世界51个国家和地区。包括剑桥和牛津等世界名校在内的英国700所公立大学,几乎都已同反抄袭服务公司签约要求提供这项服务。据数据显示,Turnitin到目前已阻止了世界范围内将近600万的学生和教育者的剽窃行为。而在这个网站上进行检测并不免费,他们是向用户收费的,使用的学校要交数千到数万美元不等的服务费。 而以此前估算,国内提供同类服务的系统也有相应的赢利空间,而且国内还有大量非学术和科研用户等待着他们能使用的反抄袭软件。 |