摘要:本文介紹了在職稱評(píng)審學(xué)術(shù)檢索中CNKI、萬方以及維普學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng)的應(yīng)用,對(duì)各自比對(duì)范圍、系統(tǒng)檢測(cè)等功能進(jìn)行了分析與比較,歸納了學(xué)術(shù)不端檢測(cè)系統(tǒng)在實(shí)際職稱評(píng)審工作中出現(xiàn)的不足,并對(duì)今后的工作提出了建議。目前,國(guó)內(nèi)數(shù)據(jù)庫商推出的學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng)主要有三種:中國(guó)知網(wǎng)推出的學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng)4.0、萬方數(shù)據(jù)推出的論文相似性檢測(cè)系統(tǒng)、維普推出的維普通達(dá)論文檢測(cè)系統(tǒng)。利用三大檢測(cè)系統(tǒng)可以檢測(cè)已發(fā)表學(xué)術(shù)期刊論文、未發(fā)表學(xué)術(shù)期刊論文以及學(xué)位論文的重合率。本文僅闡述用于職稱評(píng)審的已發(fā)表學(xué)術(shù)期刊論文在三種學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng)的應(yīng)用,從而進(jìn)行比較與分析。
- 1 比對(duì)范圍分析
三種文獻(xiàn)檢測(cè)系統(tǒng)建有web檢測(cè)平臺(tái),各自比對(duì)范圍歸納如下表:
比對(duì)范圍 | CNKI學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng) | 萬方論文相似性檢測(cè)系統(tǒng) | 維普通達(dá)論文檢測(cè)系統(tǒng) |
學(xué)術(shù)期刊 | √ | √ | √ |
碩博論文 | √ | √ | |
會(huì)議論文 | √ | √ | |
報(bào)紙全文 | √ | ||
專利全文 | √ | ||
互聯(lián)網(wǎng)資源 | √ | √ | √ |
整合的其他資源 | √ | √ |
1.1 學(xué)術(shù)論文
知網(wǎng)收錄的文獻(xiàn)類型多樣,學(xué)科覆蓋范圍廣,獨(dú)家收錄期刊種類越來越多,有成為中文數(shù)據(jù)庫龍頭之勢(shì);然萬方獨(dú)家收錄中華醫(yī)學(xué)會(huì)下屬的“中華系列”、“中國(guó)系列”、“國(guó)際系列”高質(zhì)量期刊,這一優(yōu)勢(shì)使得萬方在醫(yī)學(xué)學(xué)科類出類拔萃;維普期刊種類不如前兩者,但是內(nèi)刊和地方性期刊的收錄也為它增色不少。
1.2 學(xué)位論文
知網(wǎng)和萬方是收錄學(xué)位論文的兩大中文數(shù)據(jù)庫,學(xué)位類型涵蓋碩士、博士,萬方更是收錄了博士后論文。從收錄內(nèi)容分析,知網(wǎng)只收錄學(xué)位論文全文,萬方則收錄全文和文摘。時(shí)間限定為1999年至今,知網(wǎng)全文收錄總量大于萬方,但是兩者對(duì)于某些高校的學(xué)位論文是零收錄。學(xué)位論文并不是維普的收錄范圍,但是維普通達(dá)檢測(cè)系統(tǒng)整合了豆丁網(wǎng)、道客巴巴等網(wǎng)絡(luò)資源,這些資源里亦含有大量網(wǎng)友分享的碩博論文。筆者在檢測(cè)過程中就遇到過這種情況,同一篇職稱待檢論文,維普檢測(cè)結(jié)果比CNKI高很多,究其原由,是有一篇重合文獻(xiàn)為某高校碩士論文,這篇文獻(xiàn)在CNKI數(shù)據(jù)庫當(dāng)中并未收錄,但是被網(wǎng)友上傳到了豆丁網(wǎng)上。
- 2 系統(tǒng)檢測(cè)分析
2.1 支持的待檢文獻(xiàn)格式
CNKI和維普檢測(cè)系統(tǒng)支持上傳壓縮包文件,針對(duì)單篇文獻(xiàn)三個(gè)檢測(cè)系統(tǒng)支持doc、docx、txt格式,此外CNKI檢測(cè)系統(tǒng)還支持caj、pdf、kdh、nh格式;萬方檢測(cè)系統(tǒng)支持pdf、rtf格式。
2.2 職稱論文(即已發(fā)表文獻(xiàn))檢測(cè)模塊分析
CNKI和萬方檢測(cè)系統(tǒng)是區(qū)分已發(fā)表論文和未發(fā)表論文的。對(duì)于職稱論文,工作人員均是從CNKI和萬方檢測(cè)系統(tǒng)的“檢測(cè)已發(fā)表論文”渠道檢測(cè)的。
2.3 操作流程分析
在職稱評(píng)審學(xué)術(shù)檢索過程中,被檢索者提供的論文,不管是紙本原件還是電子版文獻(xiàn),僅作為核對(duì)論文是否真實(shí)的參考依據(jù),并不能作為檢索的直接數(shù)據(jù)。被檢索文獻(xiàn)以三大學(xué)術(shù)期刊數(shù)據(jù)庫(知網(wǎng)、萬方、維普)下載的全文為準(zhǔn)。萬方和維普檢測(cè)系統(tǒng)操作流程是:首先在三大學(xué)術(shù)期刊數(shù)據(jù)庫當(dāng)中查找出被檢測(cè)文獻(xiàn),下載全文,然后將全文以萬方和維普檢測(cè)系統(tǒng)所允許的格式(一般數(shù)據(jù)庫當(dāng)中下載的全文格式均是pdf,無需再轉(zhuǎn)換格式)上傳至檢測(cè)系統(tǒng),待后臺(tái)運(yùn)算后,彈出檢測(cè)報(bào)告。
CNKI檢測(cè)系統(tǒng)操作流程:第一種情況,被檢測(cè)論文為CNKI收錄文獻(xiàn):選擇“已發(fā)表論文”模塊,檢索系統(tǒng)設(shè)計(jì)了檢索條件(包括題名、作者、單位)和檢索時(shí)間的搜索平臺(tái)。職稱評(píng)審要求一位作者提交不超過三篇文章,通過單位和作者姓名的邏輯“與”組配,直接可以查詢出特定學(xué)校特定作者的已發(fā)表論文,在相應(yīng)的界面可以實(shí)現(xiàn)學(xué)術(shù)不端檢測(cè)以及下載全文文獻(xiàn)兩步。第二種情況,被檢測(cè)論文非CNKI收錄:需要通過“上傳論文”模塊檢測(cè),其它操作流程和萬方維普一樣??傮w來說,在職稱評(píng)審中CNKI檢測(cè)系統(tǒng)設(shè)計(jì)更加人性化,操作簡(jiǎn)單,節(jié)約時(shí)間。
2.4 檢測(cè)報(bào)告分析
三種檢測(cè)系統(tǒng)報(bào)告單簡(jiǎn)要?dú)w納如下表:
報(bào)告單 | 重合率在各自系統(tǒng)中稱謂 | 報(bào)告顯示方式(pdf/mht) | 全文比對(duì)報(bào)告 | 片段比對(duì)報(bào)告 |
CNKI檢測(cè)系統(tǒng) | 總文字復(fù)制比 | mht | √ | √ |
萬方檢測(cè)系統(tǒng) | 總相似比 | pdf、mht | √ | √ |
維普檢測(cè)系統(tǒng) | 總體結(jié)論 | pdf、mht | √ |
檢測(cè)報(bào)告內(nèi)容大致有四部分:一是被檢測(cè)論文的基本信息,包括論文標(biāo)題、數(shù)據(jù)庫比對(duì)范圍、檢測(cè)日期。二是檢測(cè)指標(biāo),包括了重合率、引用率等指標(biāo)。CNKI檢測(cè)系統(tǒng)還羅列了去除本人、重合字?jǐn)?shù)、文獻(xiàn)總字?jǐn)?shù)等指標(biāo)。三是重復(fù)內(nèi)容列表,包括重合文字來源、文獻(xiàn)來源、重合文獻(xiàn)的作者、文字復(fù)制比、是否引用、發(fā)表日期等項(xiàng)目。四是檢測(cè)報(bào)告詳細(xì)信息。在職稱評(píng)審過程中,山東省教育廳規(guī)定檢測(cè)日期截止時(shí)間為收稿日期,若無收稿日期則截止到被檢論文出版日期。萬方檢測(cè)日期信息需要人工錄入;維普檢測(cè)日期即為上傳論文日期;CNKI檢測(cè)系統(tǒng)考慮更為細(xì)致,凡是知網(wǎng)收錄的論文,系統(tǒng)會(huì)自動(dòng)默認(rèn)為檢測(cè)日期截止到出版時(shí)間。另外,CNKI檢測(cè)系統(tǒng)對(duì)重合文獻(xiàn)發(fā)表日期錄入精確至x年x月x日,并進(jìn)行二次加工,提供了將重合文獻(xiàn)按時(shí)間排序的功能,若被檢論文有收稿日期,CNKI檢測(cè)系統(tǒng)支持將收稿日期之后的重合文獻(xiàn)刪除,并重新計(jì)算重合率。萬方并無此項(xiàng)設(shè)置;維普可提供刪除功能,但因系統(tǒng)中并無“檢測(cè)日期”這一項(xiàng),無法直觀確定可刪論文,所以兩者與CNKI檢測(cè)系統(tǒng)有一定差距。CNKI檢測(cè)報(bào)告全文標(biāo)明引文版與萬方檢測(cè)報(bào)告全文版設(shè)置大致相同,均是在被檢論文的原文中用紅色字體表示重合文字,其他顏色字體表示引用文字。在CNKI檢測(cè)系統(tǒng)中雙擊紅色字體可查看重合文字來源以及重合文字復(fù)制比,而萬方檢測(cè)系統(tǒng)是以左右兩欄相互對(duì)照的方式,左邊紅色字體顯示重合文字,相對(duì)應(yīng)后邊顯示重合文字來源以及重合文字復(fù)制比。CNKI檢測(cè)報(bào)告優(yōu)勢(shì)之處在于提供了文獻(xiàn)總字?jǐn)?shù)以及重合字?jǐn)?shù),更加直觀明了。CNKI檢測(cè)系統(tǒng)全文對(duì)照?qǐng)?bào)告、萬方片段式檢測(cè)報(bào)告以及維普檢測(cè)報(bào)告設(shè)置基本相同,報(bào)告中以左右相互對(duì)應(yīng)的方式描述被檢論文重合文字片段以及相似論文片段。總體來說,CNKI檢測(cè)系統(tǒng)設(shè)置以及功能上比萬方以及維普檢測(cè)系統(tǒng)更加細(xì)致,便于操作,易于理解。通常情況下,因?yàn)橹W(wǎng)收錄的文獻(xiàn)比萬方、維普收錄更全面,CNKI檢測(cè)的重復(fù)率可能會(huì)比萬方以及維普重復(fù)率高,所以比較之下,很多被檢測(cè)作者會(huì)認(rèn)為CNKI檢測(cè)更為嚴(yán)格。
- 3 不足之處
第一,山東省教育廳規(guī)定除與本人的碩博學(xué)位論文、學(xué)術(shù)會(huì)議論文相重合可進(jìn)行刪除操作之外,其它與本人已發(fā)表論文重合概不屬于可刪范疇。筆者在實(shí)際檢測(cè)中發(fā)現(xiàn),有的自然科學(xué)類作者往往是專注于研究某一領(lǐng)域,研究成果是有連續(xù)性的;有的社科類作者習(xí)慣于用同一種模型研究不同的對(duì)象,故而他們發(fā)表的學(xué)術(shù)論文是相關(guān)的,檢測(cè)系統(tǒng)卻只機(jī)械地根據(jù)字?jǐn)?shù)計(jì)算重合率,大于30%,即失去評(píng)審資格,對(duì)于這樣的結(jié)果武斷地全盤否定,筆者認(rèn)為確實(shí)有待商榷。
第二,山東省教育廳規(guī)定重合率為總重合率,即包含引用文獻(xiàn)復(fù)制比。對(duì)于引用文獻(xiàn)的標(biāo)識(shí),檢測(cè)系統(tǒng)都或多或少的存在缺陷。有的作者在原文當(dāng)中已經(jīng)清楚地注明引用,在檢測(cè)報(bào)告卻錯(cuò)誤地以紅色字體標(biāo)識(shí)抄襲。
第三,有的從數(shù)據(jù)庫下載的被檢論文通過檢測(cè)系統(tǒng)提交時(shí),顯示圖像處理不充分,無法識(shí)別。究其原因,應(yīng)當(dāng)是數(shù)據(jù)庫加工失誤。而且同一篇文獻(xiàn)用不同的格式提交,檢測(cè)的結(jié)果也不同。在職稱評(píng)審工作中,筆者發(fā)現(xiàn)對(duì)于同一篇文獻(xiàn),word版提交的論文重復(fù)率往往大于用pdf版本,可能是word版識(shí)別率高于pdf版,這也是檢測(cè)系統(tǒng)不應(yīng)當(dāng)出現(xiàn)的問題。
第四,同一篇論文排版標(biāo)識(shí)為下轉(zhuǎn)某一頁時(shí),檢測(cè)結(jié)果會(huì)出現(xiàn)錯(cuò)誤。一般下轉(zhuǎn)至那一頁文章會(huì)是兩篇不同作者論文的集合,檢測(cè)結(jié)果是兩篇不同論文重復(fù)率之和,檢測(cè)結(jié)果有失公允。筆者發(fā)現(xiàn),凡是知網(wǎng)收錄的上述論文,CNKI檢測(cè)系統(tǒng)不會(huì)將另一篇文獻(xiàn)計(jì)算其中,但是若是該篇文獻(xiàn)非知網(wǎng)收錄,為萬方收錄,通過萬方下載并提交至CNKI檢測(cè)系統(tǒng),則會(huì)出現(xiàn)兩篇論文一同計(jì)算重復(fù)率的情形。
第五,檢測(cè)報(bào)告顯示被檢論文抄襲了發(fā)表日期早于它的文獻(xiàn),但實(shí)際情況是,無法判斷是誰抄襲誰。比如,甲作者在2006年發(fā)表博士學(xué)位論文,乙作者在2007年發(fā)表學(xué)術(shù)論文并在其中參考了甲作者的學(xué)位論文,甲作者2008年根據(jù)自己的博士論文公開發(fā)表了一篇學(xué)術(shù)論文。按照省教育廳的規(guī)定,在檢測(cè)甲作者這篇學(xué)術(shù)論文重合率時(shí),2006年作者本人的博士學(xué)位論文是不計(jì)算重復(fù)率的,但是與乙作者2007年發(fā)表的學(xué)術(shù)論文重合部分是計(jì)算到重復(fù)率當(dāng)中的。這種檢測(cè)結(jié)果有多大價(jià)值有待考證。
第六,知網(wǎng)、萬方、維普三大中文數(shù)據(jù)庫最大的硬傷在于收錄文獻(xiàn)不全面,在圖書和外文文獻(xiàn)等文獻(xiàn)方面更是稀缺。作者抄襲期刊、學(xué)術(shù)會(huì)議、學(xué)術(shù)論文的可以檢測(cè),但倘若作者抄襲圖書和外文文獻(xiàn),CNKI、維普、萬方三個(gè)檢測(cè)系統(tǒng)均是無能為力的。
- 4 結(jié)語
對(duì)于論文檢測(cè)系統(tǒng)而言,如何多方面多渠道的收錄更多的文獻(xiàn),充實(shí)它們的比對(duì)范圍,如何改進(jìn)系統(tǒng)中存在的缺陷,如何對(duì)被檢論文作出合理、客觀、公正的評(píng)價(jià),是他們亟需解決的問題。對(duì)于圖書館而言,圖書館是教育廳委派的學(xué)術(shù)檢索機(jī)構(gòu),但圖書館的角色是服務(wù)部門,僅僅是檢索系統(tǒng)的使用者和解釋者。圖書館應(yīng)當(dāng)熟悉相關(guān)的檢測(cè)規(guī)范,并在實(shí)際評(píng)審工作中,以一個(gè)中立者的身份,公平、公正地出具檢測(cè)報(bào)告,并總結(jié)經(jīng)驗(yàn),反饋意見,力促學(xué)術(shù)不端檢測(cè)之路趨于成熟。對(duì)于學(xué)術(shù)評(píng)審職能部門而言,評(píng)審者也要認(rèn)識(shí)到用重合率高低判斷是否抄襲,并以此作為評(píng)價(jià)作者能否取得評(píng)審資格的依據(jù),是有局限性的。山東省教育廳規(guī)定重合率大于30%者即自動(dòng)放棄評(píng)審資格,如何界定合理引用、重合率指標(biāo)以及最終確立規(guī)范的評(píng)價(jià)體系,并得到被檢測(cè)者的遵守和認(rèn)可,不僅關(guān)系到被檢測(cè)者的職稱命運(yùn),而且更關(guān)系到被檢測(cè)者的學(xué)術(shù)聲望,責(zé)任重大,不容小覷。