摘要:知網(wǎng)查重系統(tǒng)(AMLC)的成功開(kāi)發(fā)和免費(fèi)推廣,為學(xué)術(shù)期刊抵制學(xué)術(shù)期刊中的學(xué)術(shù)不端行為提供了銳利的武器;但在多種學(xué)術(shù)不端行為中,AMLC僅能檢測(cè)一稿多投(或多發(fā))、重復(fù)或抄襲、不正當(dāng)署名等。本文檢測(cè)了178篇來(lái)稿和2期共55篇已發(fā)表論文,發(fā)現(xiàn)約有40%的醫(yī)學(xué)論文存在或多或少的文字重復(fù)現(xiàn)象,其中重復(fù)文字比>30%者達(dá)16.7%。分析發(fā)現(xiàn),醫(yī)學(xué)論文方法”和討論”部分重復(fù)文字較多、AMLC對(duì)數(shù)字和符號(hào)不敏感等,也發(fā)現(xiàn)了一些較易重復(fù)的論文或項(xiàng)目。提出了AMLC的一些改良建議和期刊編輯部在使用過(guò)程中的一些對(duì)策。
關(guān)鍵詞:學(xué)術(shù)不端行為;知網(wǎng)查重系統(tǒng);醫(yī)學(xué)論文;AMLC
學(xué)術(shù)不端行為由來(lái)已久,國(guó)內(nèi)外皆有之;但國(guó)內(nèi)這些年來(lái),這種行為有愈演愈烈之勢(shì),甚至有學(xué)術(shù)不端行為者反告揭露其行為者竟而勝訴的事件。這種趨勢(shì)促使學(xué)術(shù)界、學(xué)術(shù)管理界和高等教育界皆呼吁——要堅(jiān)決反對(duì)和打擊學(xué)術(shù)不端行為。2008年10月,武漢第7屆全國(guó)綜合類人文社會(huì)科學(xué)期刊高層論壇一致通過(guò)了由50家期刊共同簽署的《關(guān)于堅(jiān)決抵制學(xué)術(shù)不端行為的聯(lián)合聲明》。2009年3月,教育部發(fā)出《關(guān)于嚴(yán)肅處理高等學(xué)校學(xué)術(shù)不端行為的通知》,并聲明年底前教育部會(huì)對(duì)該通知的執(zhí)行情況進(jìn)行專項(xiàng)檢查。2008年底,中國(guó)學(xué)術(shù)期刊光盤(pán)版電子雜志社與同方知網(wǎng)(北京)技術(shù)有限公司合作成立的CNKI科研誠(chéng)信管理系統(tǒng)研究中心成功開(kāi)發(fā)出旨在檢測(cè)學(xué)術(shù)文獻(xiàn)當(dāng)中不端行為的AMLC系統(tǒng),包括科技期刊知網(wǎng)查重系統(tǒng)(AMLC)、社科期刊知網(wǎng)查重系統(tǒng)(SMLC)和學(xué)位論文知網(wǎng)查重系統(tǒng)(TMLC),這無(wú)疑是學(xué)術(shù)期刊界反對(duì)學(xué)術(shù)不端行為的銳利武器。我們自2009年初開(kāi)始使用該系統(tǒng),對(duì)來(lái)稿和已發(fā)表文獻(xiàn)進(jìn)行了檢測(cè),發(fā)現(xiàn)該系統(tǒng)對(duì)醫(yī)學(xué)論文學(xué)術(shù)不端行為的檢測(cè)有一定幫助,本文對(duì)醫(yī)學(xué)期刊編輯部使用該系統(tǒng)提出了一些建議,也對(duì)該系統(tǒng)提出了一些改進(jìn)建議。
1、AMLC對(duì)學(xué)術(shù)不端醫(yī)學(xué)文獻(xiàn)的劃分
學(xué)術(shù)不端行為的種類很多,概念的界定也不盡一致,其共同特點(diǎn)是涉及學(xué)術(shù)領(lǐng)域的、違反基本學(xué)術(shù)規(guī)范、違反學(xué)術(shù)道德的行為。教育部關(guān)于嚴(yán)肅處理高等學(xué)校學(xué)術(shù)不端行為的通知沖列舉了6種外加其他學(xué)術(shù)不端行為,而在綜合類人文社科期刊高層論壇簽署的〈關(guān)于堅(jiān)決抵制學(xué)術(shù)不端行為的聯(lián)合聲明》 則列舉了學(xué)術(shù)期刊中的5種學(xué)術(shù)不端行為。馬勇進(jìn)等認(rèn)為學(xué)術(shù)成果低水平重復(fù)也是一種學(xué)術(shù)不端行為。潘淑君等更進(jìn)一步認(rèn)為學(xué)術(shù)期刊的編委頭銜及增刊和加大頁(yè)碼也屬于學(xué)術(shù)不端行為??梢?jiàn),學(xué)術(shù)不端行為在學(xué)術(shù)期刊中的表現(xiàn)多樣,不局限于期刊論文本身。AMLC在用戶說(shuō)明中明確提出,用戶稿件的檢測(cè)主要檢測(cè)是否存在抄襲、一稿多投和已發(fā)表文獻(xiàn)的不正當(dāng)署名等學(xué)術(shù)不端行為,并依嚴(yán)重程度給出一個(gè)權(quán)值進(jìn)行度量??梢?jiàn),AMLC難以檢測(cè)和防止其他類型的學(xué)術(shù)不端行為。該系統(tǒng)按照重復(fù)文字的相似比例,以10%、30%、50%為界劃分為輕度句子抄襲(< 10%且各連續(xù)重合文字均<200)、句子抄襲(>10% 且各連續(xù)重合文字均<200)、輕度段落抄襲(>10% ~<30%且存在連續(xù)重合文字>200)、段落抄襲(> 30%~<50%且存在連續(xù)重合文字>200)和整體抄襲 (>50%,重復(fù)文字大于總字符數(shù)的1 /2),并有相應(yīng)的綠、黃、橙、紅等顏色醒目提示。該系統(tǒng)按是否有部分作者相同判斷是否自我抄襲,如有且文字重合度> 75%則認(rèn)為是一稿多投,若<75%且>50%則認(rèn)為是 自抄,若<50%且>30%則認(rèn)為是輕度自抄。系統(tǒng)比 對(duì)參考文獻(xiàn)部分,從而確定被檢測(cè)文獻(xiàn)是否引用了被重復(fù)的文獻(xiàn)。系統(tǒng)還對(duì)被重復(fù)文獻(xiàn)是來(lái)自于某1篇或多篇而將重復(fù)的性質(zhì)劃分為單源和多源。
2、AMLC檢測(cè)醫(yī)學(xué)論文的總體情況
我們檢測(cè)了2009年前幾個(gè)月來(lái)稿的178篇文獻(xiàn),發(fā)現(xiàn)73篇文獻(xiàn)存在一定的問(wèn)題,同時(shí)檢測(cè)了已發(fā)表文獻(xiàn)2期共55篇論文,發(fā)現(xiàn)有21篇存在一定的問(wèn)題??梢?jiàn)來(lái)稿中約有40%的文獻(xiàn)存在或多或少的文字重復(fù)現(xiàn)象,有個(gè)別文獻(xiàn)的重復(fù)文字比甚至達(dá)到81%,與單篇文獻(xiàn)的重復(fù)文字比達(dá)77%,被判斷為“整體抄襲來(lái)源”檢測(cè)文獻(xiàn)與重復(fù)文獻(xiàn)間沒(méi)有引證關(guān)系。也有不少文獻(xiàn)重復(fù)文字比<10%:在我們檢測(cè)出的73篇可能有問(wèn)題的來(lái)稿中,重復(fù)文字比>10%的文獻(xiàn)占48篇,另25篇為重復(fù)文字比<10%。在所有來(lái)稿和已發(fā)表的2期的233篇文獻(xiàn)中,總重復(fù)文字比>30%的文獻(xiàn)有39篇,占16.7%,其中重復(fù)文字比>50%的文獻(xiàn)18篇,占7.7%。然而,該系統(tǒng)并不能對(duì)所有文獻(xiàn)都給出明確的診斷。在我們的檢測(cè)結(jié)果中,只有后4種診斷才有顯示,即句子抄襲、輕度段落抄襲、段落抄襲和整體抄襲,分別為13(5.6%)、5(2.1%)、8(3.4%)和3(1.2%)篇,另有11篇(4.7%)輕度自抄和2篇(0.9%) 自抄??梢?jiàn),有重復(fù)文字的醫(yī)學(xué)論文中,句子抄襲現(xiàn)象和輕度自抄現(xiàn)象比較多,整體抄襲則少見(jiàn),而段落抄襲反而多于輕度段落抄襲的結(jié)果可能與抽樣有關(guān)。
3、AMLC檢測(cè)醫(yī)學(xué)論文的一些特點(diǎn)
為了解知網(wǎng)查重系統(tǒng)AMLC檢測(cè)醫(yī)學(xué)論文的特點(diǎn),以便醫(yī)學(xué)期刊編輯部有針對(duì)性地使用,我們對(duì)每一篇總重復(fù)文字比>20%且與單篇文獻(xiàn)重復(fù)文字比>10%的文獻(xiàn)進(jìn)行了全文比對(duì),發(fā)現(xiàn)AMLC檢測(cè)醫(yī)學(xué)論文有以下特點(diǎn)。
1)總體上,醫(yī)學(xué)論文的重復(fù)文字在“方法”和“討論”部分較多,而在“摘要”“引言”“結(jié)果”部分較少, 說(shuō)明多數(shù)有重復(fù)文字的論文是參照了其他論文方法的寫(xiě)法,而有自己的結(jié)果,但討論的大部分內(nèi)容卻沒(méi)有新意。這與醫(yī)學(xué)科研的現(xiàn)狀是吻合的方法沒(méi)有創(chuàng)新,僅用他人方法重復(fù)自己的實(shí)驗(yàn);因此結(jié)果的數(shù)據(jù)略有不同,但討論和結(jié)論卻是類似的。
2)AMLC不僅比對(duì)公開(kāi)發(fā)行的科技期刊,還比對(duì)學(xué)位論文、內(nèi)部刊物、重要會(huì)議論文、報(bào)紙、年鑒、工具書(shū)等,因?yàn)锳MLC以CNKI收錄的9000余種國(guó)內(nèi)刊物和其他資料為基礎(chǔ)進(jìn)行文字重復(fù)的檢測(cè)。
3)AMLC對(duì)數(shù)字和符號(hào)不敏感,因此,同一句話即使其中的數(shù)據(jù)或符號(hào)不同,也會(huì)被認(rèn)為文字重復(fù)。如一個(gè)課題的系列研究中需要研究多個(gè)因子的狀況時(shí),則容易被認(rèn)為文字重復(fù),甚至被認(rèn)為句子抄襲或段落抄襲。
4)AMLC對(duì)重復(fù)段落的劃分與自然段沒(méi)有關(guān)系, 有可能發(fā)生不同自然段甚至不同層次被劃分為同一重復(fù)文字段的現(xiàn)象。如醫(yī)學(xué)論文的第1層次通常為“材料與方法”臨床研究的論文在該層的上面通常以“現(xiàn)報(bào)告如下”結(jié)尾,而該層下則常以‘研究病例選自XX 院自X X年一 X X年的患某病的住院病例”由于AMLC對(duì)數(shù)字不敏感,因此,這個(gè)地方的文字較易被認(rèn)為文字重復(fù),且在全文比對(duì)的重復(fù)文字標(biāo)記時(shí)被認(rèn)為是同一個(gè)重復(fù)段落。
5)AMLC的檢測(cè)結(jié)果有幾種不一致的情況。
①方法與討論部分的重復(fù)段落通常較長(zhǎng),而在引言與結(jié)果部分則重復(fù)段落較短;因此,出現(xiàn)方法部分與討論部分標(biāo)記的重復(fù)文字段落數(shù)還可能不如結(jié)果部分的標(biāo)記段落數(shù)多。
②與上一條相關(guān),總體文字復(fù)制比可能與標(biāo)記的重復(fù)段落數(shù)不成正比。
③中英文摘要的重復(fù)文字可以不一致,有些論文中文摘要與某論文重復(fù),而英文摘要卻可能沒(méi)有重復(fù)。
④單篇文獻(xiàn)比對(duì)時(shí)發(fā)現(xiàn),重復(fù)句子或段落的順序可與被重復(fù)的論文出現(xiàn)的順序不一致。
⑤僅與單篇文獻(xiàn)重復(fù)時(shí),總體的文字復(fù)制比與列出的該單篇文獻(xiàn)的重復(fù)文字比常常不同,多數(shù)為稍大于單篇文獻(xiàn)的重復(fù)文字比,可能是因?yàn)榕c未列出的文獻(xiàn)仍有小部分重復(fù)。
6)AMLC不僅僅比對(duì)題名、摘要和正文,還比對(duì)作者單位及參考文獻(xiàn)。我們?cè)跈z測(cè)的過(guò)程中發(fā)現(xiàn)作者單位相同也可被認(rèn)為是文字重復(fù)。引用相同參考文獻(xiàn)也可被認(rèn)為是文字重復(fù)。
7)幾種較易出現(xiàn)重復(fù)文字的論文。
①不同作者研究同一批資料的不同方面時(shí),較易發(fā)生抄襲資料描述,如同一批病例,醫(yī)生撰寫(xiě)了有關(guān)資料的臨床效果的論文,則護(hù)士可能抄襲有關(guān)資料描述。
②同一課題組的系列研究時(shí),后續(xù)論文可能抄襲已發(fā)論文的引言、方法和討論等內(nèi)容。曾有一篇論文重復(fù)文字比為34%,經(jīng)仔細(xì)比對(duì),發(fā)現(xiàn)大部分都是在方法部分重復(fù)了課題已發(fā)表的論文。
③研究性論文在討論部分容易抄襲綜述性文章。
④博士畢業(yè)后發(fā)表的論文容易抄襲博士生答辯的畢業(yè)論文。
⑤論文在內(nèi)部刊物上發(fā)表后,相同主題正式發(fā)表時(shí),會(huì)有較多重復(fù)內(nèi)部刊物論文的現(xiàn)象。
⑥由于AMLC對(duì)數(shù)字和符號(hào)不敏感,因此,會(huì)把類似的圖題表題和注釋認(rèn)為是文字重復(fù)_這也是結(jié)果部分較多見(jiàn)的重復(fù)文字標(biāo)記。
⑦統(tǒng)計(jì)方法部分,多有重復(fù)統(tǒng)計(jì)軟件和一般統(tǒng)計(jì)方法的描述。
⑧較長(zhǎng)的并列名稱較易被發(fā)現(xiàn)重復(fù),如我們?cè)鴻z測(cè)出眼科學(xué)“全周RNFL厚度、上方RNFL厚度和下方RNFL厚度……”在同一文章的討論中被標(biāo)記重復(fù)10次之多,實(shí)際不應(yīng)算是重復(fù)。
8)醫(yī)學(xué)論文的遣詞造句比較簡(jiǎn)單和通用,因此, 在各個(gè)部分都容易出現(xiàn)文字重復(fù)的現(xiàn)象;但大多數(shù)被 認(rèn)為有較大重復(fù)文字比例的文章都是“多源”重復(fù),即 與多篇文獻(xiàn)有類似的文句,而不是抄襲某一篇的句段。我們?cè)鴻z測(cè)到一篇文獻(xiàn)總體復(fù)制比大于50%,但經(jīng)仔細(xì)比對(duì),發(fā)現(xiàn)與單篇文獻(xiàn)的重復(fù)文字比最大也僅為17%,其他多數(shù)為10%以下。這篇論文未被判斷為‘整體抄襲”可能是由于沒(méi)有某段連續(xù)的重復(fù)文字>200字。
9)大多數(shù)論文不引用被抄襲的論文,僅少數(shù)抄襲較輕者有引用。我們檢測(cè)的73篇有抄襲嫌疑的文獻(xiàn)中,僅有2篇引用了被重復(fù)文字的論文,一篇被判為句子抄襲”另一篇為作者自己的論文,因重復(fù)文字較少,系統(tǒng)尚未判斷為學(xué)術(shù)不端行為類型。
10)短文章容易導(dǎo)致重復(fù)文字比例偏大,如僅輸入某發(fā)表文獻(xiàn)的摘要時(shí),常被判斷為“一稿多投”。
4、關(guān)于AMLC檢測(cè)醫(yī)學(xué)論文的一些建議
馬勇進(jìn)認(rèn)為,學(xué)術(shù)不端行為在學(xué)術(shù)期刊中大量存在,主要有社會(huì)與個(gè)人的原因,缺乏有效懲戒措施,以及學(xué)術(shù)期刊自身的問(wèn)題(如把關(guān)不嚴(yán)、自律缺失),因此,抵制學(xué)術(shù)不端行為是學(xué)術(shù)期刊的神圣職責(zé)。曹亞軍等也認(rèn)為,出版與編輯環(huán)節(jié)存在的漏洞及某些新聞媒體的推波助瀾為科研不端行為揺旗吶喊,助長(zhǎng)了學(xué)術(shù)造假之風(fēng)。在AMLC開(kāi)發(fā)以前,要鑒別來(lái)稿是否重復(fù)或抄襲他人文章,多采用文獻(xiàn)檢索的方法,但是,檢索出來(lái)的相關(guān)文章較多,編輯難以逐句逐段地對(duì)照每一篇文章。AMLC的開(kāi)發(fā)成功,對(duì)學(xué)術(shù)期刊編輯鑒別這些學(xué)術(shù)不端文獻(xiàn)提供了強(qiáng)有力的武器。我們建議,所有具備條件的編輯部都應(yīng)在收到稿件之時(shí)就利用AMLC進(jìn)行知網(wǎng)查重系統(tǒng)的檢測(cè);但是,在使用過(guò)程中,我們發(fā)現(xiàn)AMLC自身還難以完全替代編輯的鑒別,并且其自身也還存在一定的問(wèn)題,某些問(wèn)題不僅是對(duì)醫(yī)學(xué)論文,而且對(duì)所有學(xué)術(shù)期刊的論文都可能存在。鑒于上述的AMLC檢測(cè)醫(yī)學(xué)論文的一些特點(diǎn),我們對(duì)AMLC系統(tǒng)和醫(yī)學(xué)期刊編輯部使用該系統(tǒng)時(shí)提出如下建議。
1)對(duì)于AMLC系統(tǒng),我們建議:
①由于醫(yī)學(xué)研究性論文(綜述與講座除外)都是按照‘引言”材料與方法”結(jié)果”討論”的章節(jié)層次撰寫(xiě)的,因此,AMLC系統(tǒng)應(yīng)提供入口使得醫(yī)學(xué)論文可以分層次進(jìn)行重復(fù)文字比例的計(jì)算,關(guān)鍵的“結(jié)果”部分是編輯必須特別注意的,而“方法”與‘討論”部分的少許重復(fù)并不要緊。
②標(biāo)記重復(fù)文字段落時(shí)同時(shí)考慮論文自然段的劃分,不要將不同自然段甚至不同層次的內(nèi)容混合在一起統(tǒng)計(jì)和標(biāo)記,層次標(biāo)題不計(jì)入重復(fù)文字比例。
③AMLC系統(tǒng)不要將作者單位和參考文獻(xiàn)列入重復(fù)文字的檢測(cè)范圍,因?yàn)椴煌撐氖强梢砸孟嗤墨I(xiàn)的 。
④系統(tǒng)增加對(duì)圖表與數(shù)字和符號(hào)的識(shí)別功能。
⑤在給出總結(jié)性數(shù)據(jù)時(shí),同時(shí)給出與某單篇文獻(xiàn)重復(fù)文字比的最大比例,以方便期刊編輯考察可疑論文與某單篇文獻(xiàn)的最大重復(fù)比例。
2)對(duì)于醫(yī)學(xué)期刊編輯部,我們建議:
①對(duì)所有來(lái)稿,在登記前就應(yīng)進(jìn)行學(xué)術(shù)不端文獻(xiàn)的檢測(cè),而將檢測(cè)出的學(xué)術(shù)不端文獻(xiàn)即行退稿,以避免人力物力浪費(fèi)。
②在每一期發(fā)稿之前再行一遍學(xué)術(shù)不端文獻(xiàn)的檢查;因?yàn)閺膩?lái)稿到發(fā)稿,國(guó)內(nèi)大部分期刊都要經(jīng)過(guò)約半年的時(shí)間,檢測(cè)過(guò)的文獻(xiàn)有可能半年后發(fā)現(xiàn)有重復(fù)或抄襲行為。這一次檢測(cè)可采用將所有發(fā)稿論文壓縮后打包而進(jìn)行批處理的方法檢測(cè)。
③編輯在檢測(cè)文獻(xiàn)時(shí),不要單純按照AMLC給出的總體復(fù)制比對(duì)來(lái)稿進(jìn)行學(xué)術(shù)不端行為的判斷,而應(yīng)深入分析其與某幾篇單篇文獻(xiàn)的重復(fù)文字情況,如僅是方法上的重復(fù),可以建議作者大力精簡(jiǎn)方法部分,僅引用文獻(xiàn)即可。
④編輯部應(yīng)制訂統(tǒng)一標(biāo)準(zhǔn),以便各編輯按照相同的標(biāo)準(zhǔn)處理來(lái)稿。
⑤使用了遠(yuǎn)程采編系統(tǒng)的編輯部可與采編系統(tǒng)設(shè) 計(jì)部門(mén)協(xié)商,看是否可以將來(lái)稿在AMLC的比對(duì)設(shè)計(jì)成自動(dòng)化程序。
⑥編輯在處理重復(fù)文字的稿件時(shí),應(yīng)慎重對(duì)待,如退稿,則退稿理由不可過(guò)于武斷地認(rèn)為作者是抄襲;因?yàn)獒t(yī)學(xué)論文的遣詞造句確實(shí)比較通用,容易發(fā)生重復(fù)現(xiàn)象。
⑦學(xué)術(shù)不端行為的檢測(cè)不可替代文獻(xiàn)查新,經(jīng)AMLC檢測(cè)出來(lái)沒(méi)有多少重復(fù)文字比例,并不說(shuō)明論文具有新穎性或創(chuàng)造性。
⑧編輯部還應(yīng)注意對(duì)其他類型學(xué)術(shù)不端行為的防范,如人情審稿、低水平成果、掛著編委頭銜不愿承擔(dān)編委的責(zé)任等。
5、結(jié)束語(yǔ)
AMLC的成功開(kāi)發(fā)為學(xué)術(shù)期刊抵制一稿多投(或多發(fā))、重復(fù)抄襲、不正當(dāng)署名等學(xué)術(shù)不端行為提供了有力的武器;但是,我們也應(yīng)當(dāng)看到,AMLC并不能防止學(xué)術(shù)期刊中所有類型的學(xué)術(shù)不端行為,因此,AMLC之外的功夫仍不可忽視。即使是在AMLC檢測(cè)文獻(xiàn)過(guò)程中,編輯的鑒別作用也是不可替代的。建議編輯部及時(shí)修改相應(yīng)規(guī)程,統(tǒng)一編輯行為,與學(xué)術(shù)界和學(xué)術(shù)管理界一起共同維護(hù)學(xué)術(shù)界的誠(chéng)信和純潔。