(聲明:刊用《中國新聞周刊》稿件務(wù)經(jīng)書面授權(quán))
本刊特約撰稿/凌冰 李渝
國內(nèi)對學術(shù)論文“造假”的監(jiān)督并非始自今日。2000年3月,上海師范大學法商學院的何云峰教授單槍匹馬地建了一個“好漢網(wǎng)”,豪氣十足地叫板校園里勢頭漸旺的剽竊抄襲等不良學風。
同年,著名“打假斗士”方舟子也創(chuàng)辦了中文學術(shù)打假網(wǎng)站“新語絲立此存照”,陸續(xù)揭露了500多起學術(shù)涉假案例,其中包括“核糖核酸”、清華大學醫(yī)學院“劉輝造假事件”等引起廣泛關(guān)注的學術(shù)造假和腐敗事件。方舟子們的學術(shù)打假多通過網(wǎng)友檢舉,并沒有專業(yè)的儀器進行技術(shù)支撐。
2003年,武漢大學信息管理學院副教授沈陽在國家自然科學基金的資助下,研發(fā)了一套與“學位論文學術(shù)不端檢測系統(tǒng)”功能相似的系統(tǒng)——ROST反剽竊系統(tǒng),也稱為“學術(shù)不端行為檢測系統(tǒng)”,并于2008年4月研制成功,目前已在全國20多所高校院系推廣和100多家期刊社使用,但沒有大規(guī)模推廣。用沈陽的話說,“就像原子彈一樣,它是大規(guī)模殺傷性武器,這需要核軍控的”。
在2009年“兩會”前夕,爆出兩起院士涉嫌學術(shù)不端行為的事件。6名教授聯(lián)名投訴中國工程院院士劉興土涉嫌“抄襲剽竊”。此前不久,浙江大學原副教授賀海波盜用他人研究結(jié)果發(fā)表多篇論文。賀海波的博士后合作導師、中國工程院院士、浙江大學藥學院院長李連達的名字也出現(xiàn)在這些“問題論文”上。隨后,教育部部長周濟就“賀海波論文造假”事件及處理結(jié)果表示,對學術(shù)不端行為要像體育界反興奮劑一樣“零容忍”。
2009年3月19日,教育部發(fā)出了《關(guān)于嚴肅處理高等學校學術(shù)不端行為的通知》,這是我國教育部門首次就處理學術(shù)不端行為發(fā)出通知。通知明確高校對本校有關(guān)機構(gòu)或者個人的學術(shù)不端行為的查處負有直接責任,應建立健全處理學術(shù)不端行為的工作機構(gòu)。整個學術(shù)界頗有山雨欲來的感覺。
正是在這樣的背景下,由中國學術(shù)期刊(光盤版)電子雜志社與清華同方知網(wǎng)共同研制的“學位論文學術(shù)不端檢測系統(tǒng)”(簡稱“TMLC”)開始在高校推廣。
檢測的方法涉及一個專業(yè)術(shù)語——“自適應多階指紋”。什么是信息指紋?沈陽副教授打了個比方,就是每個人說話都有口頭禪,這個口頭禪就是你的一個特征,這個特征就叫信息指紋。具體到一篇文章來說,比如研究金庸小說,金庸喜歡用什么字,用字的規(guī)律是多少,每個字在整個文章出現(xiàn)的概率是多少,這就是一個指紋。CNKI科研誠信管理系統(tǒng)研究中心主任孫雄勇向《中國新聞周刊》記者介紹,如果說得通俗一點,就是兩篇文章,如果有一個句子相同,哪怕有一些改寫,都能檢測出來。
“測謊”工具的檢測工作需要強大的后臺數(shù)據(jù)庫支持,TMLC的后臺是覆蓋了超過5000萬的學術(shù)文獻數(shù)據(jù)庫。
“測謊”技術(shù)在目前來說,已經(jīng)是一個成熟技術(shù)了,國外早已廣泛應用于多所高校及科研機構(gòu)。
在一系列反剽竊網(wǎng)站中,最為出色、應用最廣泛的莫過于“Turnitin”,中文意思是“交上來”,它也是全球第一個檢測剽竊行為的網(wǎng)站。該網(wǎng)站目前已阻止了世界范圍內(nèi)將近600萬的學生和教育者的剽竊行為,在使用高峰期,每天可收到2萬篇論文。
“Turnitin”通過三個數(shù)據(jù)庫的內(nèi)容來檢測交上來的作品:公眾可以查到互聯(lián)網(wǎng)上所有存檔的文件(超過45億頁,每天更新4000萬頁);成百萬的已經(jīng)出版的作品,包括商業(yè)數(shù)據(jù)庫、期刊摘要等,還有上萬本電子書籍,包括古登堡經(jīng)典文獻收藏;成百萬篇學生交到網(wǎng)站的論文。
在中國,數(shù)據(jù)庫也在不斷完善之中。不過,“反剽竊”系統(tǒng)要面對的,似乎遠遠不是技術(shù)難題。 ★
Copyright ©1999-2024 chinanews.com. All Rights Reserved