近年來,學(xué)術(shù)造假、論文剽竊嚴(yán)重,學(xué)術(shù)不端事件頻發(fā)生讓越來越多的人對(duì)中國(guó)科技事業(yè)的未來開始擔(dān)憂。因此,論文查重也變成了必須的步驟,各種論文查重系統(tǒng)應(yīng)運(yùn)而生。每到畢業(yè)的季節(jié)很多學(xué)生都會(huì)問哪個(gè)檢測(cè)系統(tǒng)準(zhǔn)確權(quán)威?甚至不同的檢測(cè)系統(tǒng)結(jié)果差多少?這里我們來比較兩個(gè)最具代表和最常用的檢測(cè)系統(tǒng)—PaperPass和知網(wǎng)查重進(jìn)行對(duì)比:
一、系統(tǒng)功能對(duì)比
①PaperPass檢測(cè)系統(tǒng)是北京智齒數(shù)匯科技有限公司旗下產(chǎn)品,網(wǎng)站誕生于2007年,是全球首個(gè)中文文獻(xiàn)相似度比對(duì)系統(tǒng),運(yùn)營(yíng)多年來,已經(jīng)發(fā)展成為最權(quán)威、最可信賴的中文原創(chuàng)性檢查和預(yù)防剽竊的在線網(wǎng)站。系統(tǒng)自主研發(fā)的動(dòng)態(tài)指紋越級(jí)掃描檢測(cè)技術(shù),已經(jīng)領(lǐng)先于國(guó)內(nèi)外其它檢測(cè)系統(tǒng)所用技術(shù),成為了論文抄襲檢測(cè)技術(shù)的領(lǐng)導(dǎo)者。
②“中國(guó)知網(wǎng)”學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng)以《中國(guó)學(xué)術(shù)文獻(xiàn)網(wǎng)絡(luò)出版總庫》為全文比對(duì)數(shù)據(jù)庫,可檢測(cè)抄襲與剽竊、偽造、篡改等學(xué)術(shù)不端文獻(xiàn),可供高校檢測(cè) 學(xué)位論文和已發(fā)表的論文。
二、使用范圍對(duì)比
①PaperPass機(jī)構(gòu)和個(gè)人都可以使用PaperPass系統(tǒng),機(jī)構(gòu)包括學(xué)校、期刊社、出版社、企業(yè)等,個(gè)人包括在校學(xué)生、職稱評(píng)定者、作者等。
②中國(guó)知網(wǎng)僅限單位內(nèi)部使用。
三、檢測(cè)范圍對(duì)比
①PaperPass由超過9000萬的學(xué)術(shù)期刊和學(xué)位論文以及一個(gè)超過10億數(shù)量的互聯(lián)網(wǎng)網(wǎng)頁數(shù)據(jù)庫組成
②中國(guó)知網(wǎng)(知網(wǎng)Pmlc還能檢測(cè)到大學(xué)生聯(lián)合對(duì)比庫)中國(guó)學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫、中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫/中國(guó)優(yōu)秀碩士學(xué)位論文全文數(shù)據(jù)庫、中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫、中國(guó)重要報(bào)紙全文數(shù)據(jù)庫、中國(guó)專利全文數(shù)據(jù)庫、互聯(lián)網(wǎng)資源、英文數(shù)據(jù)庫(涵蓋期刊、博碩、會(huì)議的英文數(shù)據(jù)以及德國(guó)Springer、英國(guó)Taylor&Francis期刊數(shù)據(jù)庫等)、港澳臺(tái)學(xué)術(shù)文獻(xiàn)庫、優(yōu)先出版文獻(xiàn)庫、互聯(lián)網(wǎng)文檔資源、圖書資源、個(gè)人比對(duì)庫
四、檢測(cè)原理對(duì)比
①PaperPass優(yōu)秀的算法系統(tǒng)采用自主研發(fā)的動(dòng)態(tài)指紋越級(jí)掃描技術(shù),檢測(cè)主要步驟有:文本預(yù)處理、語義挖掘、深度識(shí)別、全局掃描等,檢測(cè)速度快并且檢測(cè)準(zhǔn)確率達(dá)到了99%以上!
②中國(guó)知網(wǎng)采用CNKI自主研發(fā)的自適應(yīng)多階指紋(AMLFP)特征檢測(cè)技術(shù),具有檢測(cè)速度快,準(zhǔn)確率,召回率較高,抗干擾性強(qiáng)等特征。支持篇章、段落、句子各層級(jí)檢測(cè);支持文獻(xiàn)改寫,多篇文獻(xiàn)組合等各種文獻(xiàn)變形檢測(cè);支持研究生論文、圖書專著等超長(zhǎng)文獻(xiàn)的學(xué)術(shù)不端檢測(cè)。
總結(jié):對(duì)任意一篇需要檢測(cè)的論文,系統(tǒng)首先對(duì)其進(jìn)行分層處理,按照篇章、段落、句子等層級(jí)分別創(chuàng)建指紋來比對(duì)資源庫中的比對(duì)文獻(xiàn),也采取同樣技術(shù)創(chuàng)建指紋索引。這樣的分層多階指紋結(jié)構(gòu),不僅可以滿足我們對(duì)超長(zhǎng)文獻(xiàn)的快速檢測(cè),而且,因?yàn)槲覀兊淖钚≈讣y粒度為句子,因此,也滿足了系統(tǒng)對(duì)檢準(zhǔn)率和檢全率的高要求。原則上,只要檢測(cè)文獻(xiàn)與比對(duì)文獻(xiàn)存在一個(gè)相同的句子,就能被檢測(cè)系統(tǒng)發(fā)現(xiàn)。雖然PaperPass檢測(cè)比較嚴(yán)格,但是其主要是網(wǎng)絡(luò)資源對(duì)比,知網(wǎng)才是真正的學(xué)位論文和期刊庫。對(duì)于論文抄襲檢測(cè)系統(tǒng)數(shù)據(jù)庫起到主導(dǎo)位置。PaperPass檢測(cè)速度快并且檢測(cè)準(zhǔn)確率達(dá)到了99%以上但是99%的高校以知網(wǎng)為準(zhǔn);知網(wǎng)是99%的學(xué)校采用的查重系統(tǒng),最權(quán)威,查重也比較嚴(yán)格,但是不對(duì)個(gè)人用戶開放并且檢測(cè)費(fèi)用也比較昂貴。