學(xué)術(shù)期刊擴散因子改進路徑
時間:2022-08-03 03:15:37
導(dǎo)語:學(xué)術(shù)期刊擴散因子改進路徑一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
學(xué)術(shù)傳播不僅要看數(shù)量,也要看學(xué)術(shù)傳播的廣度,擴散因子就是在這樣的背景下產(chǎn)生的。Rowlands[1]認為期刊是知識擴散的單元,最早提出期刊擴散因子(JournalDiffusionFactors,JDF)的概念,即期刊論文每被引100次所涉及到的期刊數(shù)量。中國科學(xué)技術(shù)信息研究所同年在中國科技期刊引證報告中首次公布擴散因子,以后每年均公布該指標,擴大了該指標的影響。擴散因子的產(chǎn)生源于對期刊知識擴散和知識流動的評價要求。Singh[2]認為知識擴散(knowledgedif鄄fuse)應(yīng)該等同于知識交流(knowledgeexchange)或知識流動(knowledgeflow)。Chenetal.[3]認為對于學(xué)術(shù)期刊而言,知識擴散是知識在科學(xué)文獻間的傳承,具體通過文獻之間的引用來反映,也可以稱為基于引文的知識擴散。Bonnevie[4]認為期刊被引是一種引證分析,反映施引期刊的范圍,高比率表示期刊的影響范圍較大,期刊有較高的影響力。關(guān)于擴散因子存在的問題,沈志超、龔漢忠等[5]研究發(fā)現(xiàn)擴散因子與總被引頻次和影響因子在部分期刊中并不平行一致,并且擴散因子與部分期刊實際學(xué)術(shù)影響力也不一致,甚至呈現(xiàn)反向變化趨勢,建議暫停使用該指標。鐘陽春、庾家良等[6]認為擴散因子計算公式中,分子是有限量,分母是無限量,現(xiàn)有的計算公式不能正確反映期刊的影響力,特別是不能正確揭示影響力正比于他引率和被引用刊數(shù)的本質(zhì)。劉雪立[7]討論了擴散因子的人為操縱問題,認為如果某刊擴散因子明顯低于同學(xué)科其他期刊,則可高度懷疑該刊有人為操作的可能。擴散因子自從提出后,一些學(xué)者對其進行了進一步的拓展。Frandsen[8]認為擴散因子并不適用于評價期刊,提出修正指標新擴散因子(NewJournalDiffu鄄sionFactors,NJDF),即用期刊被引刊數(shù)除以載文量。葉艷、張李義[9]對擴散因子進行修正,采用他引影響因子來進行計算,即期刊被他引100次所涉及的期刊數(shù)。綜上所述,關(guān)于擴散因子及其應(yīng)用的相關(guān)研究,總體上文獻不多。對于擴散因子的修正和改進,尚需要進行進一步的研究??傮w上,在以下方面有待進一步深入研究:第一,期刊影響力與期刊擴散能力是兩個不同的概念,前者可以通過被引頻次、影響因子等指標反映,而后者可以通過被引刊數(shù)、擴散因子等來進行反映。關(guān)于影響力與擴散能力的關(guān)系,尚缺乏足夠的基礎(chǔ)研究和理論上的總結(jié)。第二,期刊載文量越大,選題和欄目更加豐富,內(nèi)容跨度也大大增加,客觀上會拉大期刊的擴散因子,而關(guān)于這方面的研究總體不多。第三,自引無疑對擴散因子會產(chǎn)生影響,但是將自引剔除,完全采用他引次數(shù)來計算擴散因子值得商榷,因為適當(dāng)?shù)淖砸钦5?。本文在分析期刊載文量與自引等問題對擴散因子影響的基礎(chǔ)上,提出一個新的文獻計量指標———擴散指數(shù),基于中國知網(wǎng)CNKI的引文數(shù)據(jù),并以圖書館情報與文獻學(xué)CSSCI期刊為例,并對擴散指數(shù)的統(tǒng)計特征及與其他文獻計量指標關(guān)系特點進行分析,以期優(yōu)化擴散因子,豐富文獻計量指標。
1擴散指數(shù)的原理
1.1期刊影響力與期刊擴散能力。期刊的影響力主要是通過期刊被引相關(guān)指標來反映的,期刊影響力的評價指標眾多,基于被引次數(shù)計算的指標大多數(shù)都是,如總被引頻次、影響因子、5年影響因子、他引影響因子、即年指標、h指數(shù)、特征因子、論文影響分值等等。期刊影響力指標又可以進一步分為數(shù)量指標與質(zhì)量指標,數(shù)量指標就是反映被引總量的絕對指標,如總被引頻次、載文量、地區(qū)分布數(shù)等;質(zhì)量指標是相對指標,影響因子、他引影響因子、h指數(shù)等。期刊的擴散能力是指期刊對學(xué)科內(nèi)和學(xué)科外期刊的影響,由于學(xué)科特點不同,不同學(xué)科期刊的擴散能力是不一樣的,對于一些相對封閉的學(xué)科,與學(xué)科外其他期刊的關(guān)系相對較小,甚至與學(xué)科內(nèi)的其他期刊關(guān)系也是如此;而對于一些基礎(chǔ)類、方法類學(xué)科,可能對其他學(xué)科也有較大影響,擁有較大的學(xué)科擴散能力。期刊論文在學(xué)科內(nèi)外的擴散對于人類的知識進步具有重要意義,尤其對于交叉學(xué)科、跨學(xué)科的研究更有較大影響。由于學(xué)科擴散一般難以計量,所以人們還是通過論文被引刊數(shù)與被引數(shù)量來間接進行反映,擴散因子就是在這樣的背景下產(chǎn)生的。1.2期刊影響力與期刊擴散能力不存在必然的聯(lián)系。期刊影響力與期刊擴散能力是兩個完全不同的維度。由于期刊定位不同,即使對于同一學(xué)科的期刊,有的期刊更加強調(diào)專一性,論文側(cè)重在學(xué)科內(nèi)某個相對較窄的研究領(lǐng)域,可能擁有較高的影響力。有的期刊則強調(diào)一定的寬度,論文涉及的范圍較廣,可能擁有較好的學(xué)科擴散能力。這兩類期刊不存在好壞之分,更沒有必要求全責(zé)備。盡管可能更多的雜志均同時追求影響力與擴散能力,但也不能因為擴散因子與影響因子的相關(guān)性問題來否定擴散因子。由于不同學(xué)科特點不同,有的學(xué)科可能追求專業(yè)性的期刊更多一些,有的學(xué)科可能追求寬度的期刊更多一些,所以不同學(xué)科期刊影響力與擴散能力的關(guān)系也會表現(xiàn)出不同的特點,可能正相關(guān)、負相關(guān)或不相關(guān),這些都是正常的。擴散因子的提出者Rowlands[1]研究了圖書情報領(lǐng)域的42種期刊,發(fā)現(xiàn)期刊擴散因子與影響因子無正相關(guān)性。一些研究發(fā)現(xiàn)擴散因子與期刊影響力指標不相關(guān),甚至負相關(guān),就認為是擴散因子指標的問題,其實并非如此。關(guān)于擴散因子與影響因子的關(guān)系,其實還有一個隱含的問題,就是評價對象的時間軸并不統(tǒng)一。擴散因子是根據(jù)總被引頻次與被引刊數(shù)計算而來的,而這兩個指標的時間范圍是期刊創(chuàng)刊以來到統(tǒng)計當(dāng)年;影響因子是根據(jù)期刊過去兩年發(fā)表的論文在統(tǒng)計當(dāng)年的平均被引次數(shù),時間范圍是3年。擴散因子更具有存量指標的特點,影響因子更具有流量指標的特點,兩者進行相關(guān)分析本質(zhì)上存在邏輯錯誤,無論相關(guān)還是不相關(guān)均具有較大的偶然性。1.3擴散因子沒有考慮載文量的影響。載文量對期刊擴散因子的影響問題比較復(fù)雜。第一,載文量越大,可以刊載更多的論文,這些論文所涉及到的知識寬度會越來越大,擴散因子越大。如果期刊為了提高擴散因子而人為增加載文量,相對而言是比較容易的,所以在對擴散因子進行優(yōu)化時,必須充分考慮到這個因素。Frandsen[8]提出新擴散因子,用期刊被引刊數(shù)除以載文量,倒是解決了這個問題,但是沒有考慮期刊的被引次數(shù)的影響。第二,載文量與期刊欄目設(shè)置和辦刊風(fēng)格也有較大關(guān)系,如果期刊涉及的選題范圍較廣,這會增強載文量對擴散因子的影響,如果期刊選題相對較窄,也會弱化載文量對擴散因子的影響。載文量對擴散因子的影響同時具有正向機制與反向機制,最終結(jié)果取決于哪種機制更加強大。需要說明的是影響因子與載文量也有一定的關(guān)系,但研究結(jié)論并不一致。Bordonsetetal.[10]研究發(fā)現(xiàn),隨著期刊載文量上升,期刊的影響因子逐年下降,這與影響因子的算法有關(guān)系。俞立平、張再杰等[11]此處同期載文量與影響因子不存在互動機制,載文量只對未來影響因子產(chǎn)生影響,影響因子也只對未來載文量產(chǎn)生影響。俞立平、張再杰[12]還發(fā)現(xiàn),改革開放以,學(xué)術(shù)期刊發(fā)展分為起步期、成長期和調(diào)整期,載文量與影響因子的關(guān)系由正相關(guān)演變?yōu)樨撓嚓P(guān)。1.4自引對擴散因子的影響。自引對擴散因子的影響包括兩個部分,第一是對分子被引刊數(shù)的影響,在正常引用的情況下,期刊一般也會出現(xiàn)自引,所以自引對分子是沒有太大影響的。第二是對分母被引次數(shù)的影響,過度自引無疑會增加被引次數(shù),也就是說增加分母,從而降低擴散因子。也就是說,擴散因子天生就具有防止期刊過度自引的功能。在這種情況下,如果采用他引影響因子計算擴散因子,反而會提高擴散因子。1.5擴散因子的時效性較差。擴散因子計算的時間跨度問題是個隱含問題,這一點被忽略了。根據(jù)擴散因子的定義,分子為期刊創(chuàng)刊以來發(fā)表的所有論文在統(tǒng)計當(dāng)年的被引期刊數(shù),分母為期刊創(chuàng)刊以來所有論文在統(tǒng)計當(dāng)年的總被引頻次。由于這個界定,導(dǎo)致擴散因子在評價時時效性比較差,雖然擴散因子每年公布,但本質(zhì)上它具有存量指標的特點。俞立平[13]發(fā)現(xiàn)總被引頻次具有流量指標與存量指標的特點,認為對于時效性較強的評價,采用總被引頻次要慎重。擴散因子本質(zhì)上具有類似特點,側(cè)重長期評價,對于時效性要求較強的評價,不宜采用擴散z因子,或者要對其進行優(yōu)化。1.6擴散指數(shù)。綜合以上分析,可以得出如下結(jié)論:第一,采用擴散因子進行評價,完全可以不考慮其與期刊影響力指標的關(guān)系;第二,不需要考慮自引對期刊擴散因子的影響,自引一般難以提高擴散因子;第三,必須考慮載文量對期刊擴散因子的影響;第四,必須考慮增強擴散因子的評價時效性??紤]載文量對期刊影響因子的影響,需要在擴散因子的基礎(chǔ)上再除以載文量,為了和擴散因子加以區(qū)別,本文將其命名為擴散指數(shù)(JournalDiffusionIndex,JDI),即期刊每100篇論文100次被引涉及的期刊數(shù)量,即:JDI=JDF2P2伊100=U2C2伊P2伊10000(1)公式(1)中,JDF2為兩年擴散因子,即根據(jù)期刊過去兩年的被引刊數(shù)和被引頻次計算的擴散因子;P2為期刊過去兩年的載文量,U2為過去兩年期刊發(fā)表的論文在統(tǒng)計當(dāng)年的被引刊數(shù),C2為期刊過去兩年發(fā)表的論文在統(tǒng)計當(dāng)年的被引次數(shù)。比如某期刊2015年載文量為100篇,2016年載文量為100篇,這兩年的載文量合計200篇,在2017年被引400次,被引刊數(shù)為60種,則該期刊的擴散指數(shù)為7.5(60/200/40010000)。與擴散因子相比,擴散指數(shù)具有以下特征:第一,擴散指數(shù)充分考慮到載文量對擴散因子的影響,一定程度上可以防止期刊為了提高擴散因子而人為增加載文量。第二,擴散指數(shù)充分考慮到期刊評價的時效性要求。一般而言,辦刊歷史越長,期刊被引刊數(shù)越多,擴散因子越大,因此對于辦刊歷史較短的期刊而言是不公平的,但采用較短的計算時間窗口,可以適當(dāng)減少這個問題。至于擴散指數(shù)的其他特征,有待進行進一步分析。
2研究數(shù)據(jù)
本文基于中國知網(wǎng)的引文數(shù)據(jù),采用圖書館情報與文獻學(xué)CSSCI期刊來進行相關(guān)分析。中國知網(wǎng)的引文數(shù)據(jù)庫收錄的期刊較多,包括7000多種自然科學(xué)與社會科學(xué)的學(xué)術(shù)期刊,與CSSCI引文數(shù)據(jù)庫相比各有特色,CSSCI引文數(shù)據(jù)庫所包含的期刊主要為人文社科領(lǐng)域的學(xué)術(shù)期刊,并且只包含CSSCI核心版與擴展版的期刊。從學(xué)科跨度角度,中國知網(wǎng)的引文數(shù)據(jù)庫更具有代表性,涉及的期刊更多,而且打破了自然科學(xué)與人文社科的界限。CSSCI圖書館情報與文獻學(xué)期刊共有20種,《情報學(xué)報》、《圖書館》引文數(shù)據(jù)尚不全,所以最終采取18種期刊的數(shù)據(jù)進行研究。擴散指數(shù)計算的時間為2017年,涉及到的被引刊數(shù)、被引次數(shù)也為2017年,而時間為2015-2016年。擴散指數(shù)的計算結(jié)果如表1所示。擴散指數(shù)的計算結(jié)果中,《中國圖書館學(xué)報》、《圖書情報知識》、《國家圖書館學(xué)刊》排在前3位,也就是說,這些期刊近兩年具有更好的擴散能力,尤其是在有限版面有限載文的情況下。擴散指數(shù)排在后幾位的期刊主要是《圖書情報工作》、《情報雜志》、《圖書館學(xué)研究》等,主要原因是這些期刊載文量較大,對擴散指數(shù)具有較大影響,換句話說,擴散指數(shù)能夠抑制載文量擴大對其的影響,這和擴散指數(shù)設(shè)計時的初衷是一致的。
3實證結(jié)果
3.1擴散指數(shù)的統(tǒng)計學(xué)特征分析。表2位擴散指數(shù)、影響因子、h指數(shù)的統(tǒng)計學(xué)特征比較。為了保證數(shù)據(jù)的可比性,h指數(shù)的計算也是2015~2016年發(fā)表的論文在2017年的結(jié)果,這樣可以保證擴散指數(shù)、影響因子、h指數(shù)的評價對象一致,時間跨度相同,具有完全的可比性。從數(shù)據(jù)分布看,擴散指數(shù)、影響因子的Jarque-Be鄄ra檢驗值分別為7.241、54.688,p值分別為0.027、0.000,拒絕正態(tài)分布的原假設(shè),說明這兩個指標均不服從正態(tài)分布。而h指數(shù)的Jarque-Bera檢驗值為0.631,p值為0.729,不能拒絕正態(tài)分布原假設(shè)。從離散系數(shù)看,擴散指數(shù)的離散系數(shù)為0.710,影響因子和h指數(shù)的離散系數(shù)分別為0.487、0.236,擴散指數(shù)擁有最大的離散系數(shù),用來評價時區(qū)分度良好,非常適合期刊數(shù)量較大的學(xué)科。3.2擴散指數(shù)與期刊影響力關(guān)系的回歸分析。擴散指數(shù)屬于期刊擴散能力指標,而影響因子與h指數(shù)屬于期刊影響力指標,根據(jù)前文分析,這是兩類不同性質(zhì)的指標。為了進一步分析影響力對擴散能力的影響,采用回歸分析的結(jié)果如下:log(JDI)=8.977+2.051log(IF)-3.161log(h)(8.714)(8.135)(-8.097)R2=0.845n=18(2)回歸結(jié)果中,影響因子和h指數(shù)均在1%的水平下通過了統(tǒng)計檢驗,擬合優(yōu)度R2較高,為0.845,說明期刊影響力與期刊擴散能力的相關(guān)度較高。影響因子的回歸系數(shù)為2.051,h指數(shù)的回歸系數(shù)為-3.161。h指數(shù)的回歸系數(shù)為負數(shù),原因有兩個,第一是可能存在多重共線性,導(dǎo)致回歸系數(shù)為負;第二是,在降低多重共線性影響的情況下,h指數(shù)的回歸系數(shù)仍然為負數(shù),在說明h指數(shù)更多代表了期刊的質(zhì)量,高質(zhì)量的期刊可能更加追求專業(yè)性,所以擁有較高的影響力,但不太具有較好的擴散能力,因此有必要進行進一步分析。下面進行多重共線性檢驗,影響因子的特征值為0.088,VIF為5.758,小于10,說明影響因子不存在多重共線性;h指數(shù)的特征值為0.002,接近0,VIF為37.043,大于10,說明h指數(shù)存在多重共線性。在這種情況下,就不能采用傳統(tǒng)的最小二乘法進行估計,而需要采用嶺回歸進行估計。嶺回歸是Hoerletal.[14]提出的一種改良的最小二乘法,專門用于共線性數(shù)據(jù)的回歸分析,其基本思想是當(dāng)自變量間存在共線性時,解釋變量的相關(guān)矩陣行列式近似為零,X'X是奇異的,也就是說它的行列式的值也接近于零此時傳統(tǒng)的最小二乘法估計會失效,必須采用嶺回歸進行估計。嶺回歸嶺跡圖如圖1所示,當(dāng)k=0.3時,回歸系數(shù)比較穩(wěn)定,而當(dāng)k>0.6時,回歸系數(shù)又開始發(fā)散,因此取k=0.3時的估計結(jié)果:log(JDI)=0.452+0.121log(IF)-0.756log(h)R2=0.923(3)嶺回歸的結(jié)果顯示,即使在大幅降低多重共線性的情況下,h指數(shù)與擴散指數(shù)的相關(guān)系數(shù)仍然為負,說明其結(jié)果是穩(wěn)定的,也就是說,期刊的h指數(shù)與擴散能力具有負相關(guān)性。4研究結(jié)論(1)擴散指數(shù)是衡量學(xué)術(shù)期刊橫向擴散能力的優(yōu)秀指標學(xué)術(shù)期刊的擴散能力與影響力是學(xué)術(shù)期刊的兩個重要標志,雖然任何期刊都在追求這兩種能力,但各有側(cè)重,兩者并無本質(zhì)的必然聯(lián)系。擴散因子存在的主要問題是評價對象是創(chuàng)刊以來的期刊所有論文,所以時效性差,另外沒有排除載文量增加對擴散因子的影響。本文提出擴散指數(shù)JDI,即期刊過去兩年發(fā)表的論文在統(tǒng)計當(dāng)年每100篇論文100次被引用涉及的期刊數(shù)量,用來對擴散因子進行優(yōu)化,使得擴散因子難以通過提高載文量進行認為操縱,另外提高了評價的時效性。(2)擴散指數(shù)與影響因子正相關(guān),與h指數(shù)負相關(guān)本文研究發(fā)現(xiàn),擴散指數(shù)與影響因子正相關(guān),與h指數(shù)負相關(guān),這些結(jié)論是在降低多重共線性后采用嶺回歸分析的結(jié)果,因此具有更好的穩(wěn)定性。擴散指數(shù)與h指數(shù)負相關(guān)的機制是,h指數(shù)更強調(diào)質(zhì)量,而學(xué)術(shù)質(zhì)量越高的期刊更加追求專業(yè)性,創(chuàng)新性較強,被引次數(shù)很高,但擴散能力反而不高。當(dāng)然這是本文有限數(shù)據(jù)下的研究結(jié)論,至于其他學(xué)科擴散指數(shù)與影響力的關(guān)系有待進一步研究。需要說明的是,不能用期刊的擴散能力來判斷影響力,或者用影響力來判斷期刊的擴散能力,所以無論擴散指數(shù)與影響力指標的關(guān)系如何,并不影響擴散指數(shù)的使用。(3)擴散指數(shù)區(qū)分度較好,不服從正態(tài)分布本文研究發(fā)現(xiàn),擴散指數(shù)的離散系數(shù)大于影響因子,影響因子的離散系數(shù)大于h指數(shù),因此擴散指數(shù)擁有較高的區(qū)分度的概率較大,比較適合評價期刊數(shù)量較多的學(xué)科。此外,擴散指數(shù)和影響因子一樣,并不服從正態(tài)分布,根本原因是擴散指數(shù)較高的期刊數(shù)量較少,大部分期刊處于中低水平。(4)保證評價對象的時間軸一致才能進行比較所有的學(xué)術(shù)期刊評價指標均對評價對象的時間跨度有具體的限定,但這一點非常容易被忽視。比如將擴散因子與影響因子相比,擴散因子評價的是期刊創(chuàng)刊以來的所有論文,而影響因子評價的是期刊過去兩年發(fā)表的論文,時間軸并不統(tǒng)一。本文擴散指數(shù)的評價對象是期刊過去兩年發(fā)表的論文,因此與影響因子才能直接比較,如果與h指數(shù)比較,那么h指數(shù)也必須是期刊過去兩年發(fā)表的論文進行統(tǒng)計。
本文僅僅是圖情學(xué)期刊進行實證研究,由于不同的學(xué)科,作者引用行為之間差異很大。本文的研究結(jié)論普適性有待進一步探索。此外,文史哲一些學(xué)科領(lǐng)域可能引用圖書等文獻較多,這對擴散指數(shù)的應(yīng)用也有一定的影響。擴散指數(shù)的進一步研究可從學(xué)科擴散的角度進行,由于篇幅所限,將在后續(xù)研究中進行討論。
作者:俞立平 周娟美 單位:1.浙江工商大學(xué)統(tǒng)計與數(shù)學(xué)學(xué)院 2.中北大學(xué)