每日最新頭條.有趣資訊

被引用400次的文獻壓根不存在?!揭開"幽靈文獻"的真面目

:本文來源於Harzing.com上的一篇文章,原作者為Anne-Wil Harzing原文標題"The mystery of the phantom reference"。文章略有刪改。下文中的「我」是作者Anne-Wil Harzing的朋友Pieter Kroonenberg,一名荷蘭的退休統計學教授。

在準備給一本Elsevier期刊投稿的時候,這本雜誌的作者指南中的一篇參考文獻引起了我的興趣:

Van der Geer, J., Hanraads, J.A.J., Lupton, R.A., 2000. The art of writing a scientific article. J Sci. Commun. 163 (2) 51-59. [The journal name can also be found with its full title Journal of Science Communications]

這篇文章的一作是我之前的同事,我們統計學院裡專註於實驗心理學和多元分析的Van de Geer教授。「原來他還有這樣的一面呀」,我心裡想,「他竟然會對科學寫作指導規範有所研究」。

然而,再仔細一看:同事的名字是Van de Geer,而這篇文章的作者是Van der Geer。拚錯了麽?還是認錯人了?不管怎樣, 我google了一下這篇文章,卻怎麼也找不到

有一本義大利期刊的名字很相近,但名字是Journal of Science 「Communication」 而不是 「Communications」,而且這個雜誌2002才創刊,不會在2000年就發表了文章。再仔細看看文章所在的卷數:163卷。

在學術規範這個學科領域,通常需要很久才能積累如此數目的卷數。還有一點奇怪的就是,文章的二作似乎就隻發表過這麼一篇文章,這對於一個研究寫作規範的學者來說很不尋常。

長話短說,我最後發現:這篇文章根本就不存在!它僅僅是一篇為了展示Elsevier這本雜誌的引用格式而存在的「幽靈文獻」。

儘管如此,我發現在Web of Science上這篇文章有近400次引用,而在Google Scholar上引用次數甚至更多。我知道很多科研人員並不把參考文獻當成一件嚴肅的事情來對待。但是,論文裡引用不存在的文獻,又是怎樣的一種體驗呢?我決定來一探究竟。

第一步

來源以及Web of Science的引用記錄

咱們一起來從這篇有疑問的參考文獻本身看起。我剛才提到了,這篇「幽靈文獻」最初是用來展示Elsevier這本雜誌的規範引用格式(下圖;請注意:最近Elsevier已經把這篇文獻的發表年份從2000年改成了2010年)。

用下面的關鍵詞搜索Web of Science資料庫,我們可以搜索到398次引用了2000年版本文獻的記錄 (搜索日期:2017年10月24日)。

第二步

引用「幽靈文獻」的文章有何特徵?

我猜可能有某一種特定類型的文章特別喜歡引用這樣一篇不存在的文獻。事實證明我的想法是對的:90%引用了這篇文獻的文章都是Proceedings paper (下圖)。

而在這些Proceedings paper中,2/3的文章都發表在Procedia conference volumes中 (下圖),這是Elsevier發表的一個涵蓋25個學科領域的會議論文集。

儘管Elsevier發表了這些文章,但是論文的選擇、以及同行評審歸根到底還是會議組織者的責任。

在很多大學中,只有被一些特定資料庫收錄的文章才能夠用作職稱評選,因此發表在Procedia是一件相當吸引人的事情——Procedia上的文章能夠被Scopus和Web of Science等資料庫收錄,而同時又不像Nature,Science那樣的頂級期刊一樣遙不可及。

Web of Science收錄了Procedia系列從2009年開始發表的將近85,000篇文章,其中2/3都發表在Procedia Social and Behavioral Sciences 或者 Procedia Engineering 系列中,而這兩個系列是收錄這篇「幽靈文獻」的主力軍 (上圖可見)。

從2017年2月起,Elsevier停止接收一些學科領域的proposals (包括剛剛提到的這兩個領域)。這或許也是為什麼有74篇文章在2016年引用了這篇「幽靈文獻」,而在2017年只有19篇 (下圖)。

為了看看這些文章的品質如何,我挑選了一系列Social science領域的文章(我的老本行),發現不是所有文章都符合這個領域會議的要求。甚至有些文章僅僅不到3頁,由一堆不連貫的句子拚湊而成,並且每句話都另起一段。

這些文章的英語水準也相當差,或許是因為大多數作者來自於中國、馬來西亞、土耳其、俄羅斯、羅馬尼亞以及伊朗,在這些國家英語並不是官方語言或是常用的語言(尤其在Social Science領域)。

同時,這些文章的參考文獻格式也不完整、不規範。或許以上是Elsevier停止接收這些領域Proceedings paper的原因。

第三步

「幽靈文獻」被文章中哪句話引用了?

無論作者來自於哪個國家、說什麼語言、做什麼研究、發表在什麼地方,他總是需要在文章中的某一句話中引用這篇文獻的。於是,我的下一步便是看看這篇「幽靈文獻」究竟被文章中的哪句話引用了。

我找到了20篇引文數量最多的文獻 (他們都有10篇以上的參考文獻,而且都引用了這篇不存在的文章) ,來確保他們至少在發表前有品質控制。

在這20篇文章中,17篇發表於Elsevier,15篇為期刊論文 (遠高於所有398篇文章中11%的期刊論文比例了) 。

我能夠獲取這20篇文章中12篇的全文。在這12篇文章中,6篇「幽靈文獻」作為參考文獻列表中的第一篇,3篇作為最後一篇,2篇位居中間的某個位置,1篇根本沒出現在參考文獻列表中......

在8篇文章中(#1, 2, 4, 5, 8, 12, 16, 19),這篇不存在的文獻被引用來支持與學術寫作根本不相關的論證 (#4和#5根本就是同一篇文章在不同地方發表了兩次,並不是我們把截圖搞錯了)。

在另3篇文章中(#14, 15, 20),這篇參考文獻沒有在文章中出現,而僅僅被列在了參考文獻列表中。在#18中,這篇文獻既沒有出現在文章中,也沒有出現在參考文獻列表中,我們也不得而知為什麼Web of Science會報告這篇文章引用了這篇「幽靈文獻」了。

  • 文章1: Separation & Purification Technology雜誌文章

  • 文章2:Journal of Electroanalytical Chemistry雜誌文章

  • 文章4:Spectrochimica Acta Part A雜誌文章

  • 文章5:Journal of Molecular Structure雜誌文章

  • 文章8:Materials Letters雜誌文章

  • 文章12:Nano Energy雜誌文章

  • 文章14:Procedia Food Science會議文章

(文章正文中沒有出現參考文獻16)

  • 文章15:Procedia Social and Behavioral Sciences 會議文章

(正文中沒有出現Van der Geer的這篇文獻)

  • 文章16:Central European Journal of Chemistry期刊文章

  • 文章18:Procedia Social and Behavioral Sciences會議文章

Van der Geer文章既沒有出現在文章中,也沒有出現在參考文獻列表中

  • 文章19:Procedia Computer Science會議文章

  • 文章20:Procedia Social and Behavioral Sciences會議文章

第四步: 追根溯源

大家究竟為什麼引用它?

這篇「幽靈文獻」出現在參考文獻列表第一個、或最後一個的概率之高,讓我不禁覺得,可能是作者忘記把這篇引用從列表中刪掉了。然而,為什麼他們最開始要加上這樣的一篇文獻呢?

這時,我發現了一個和Renewable Energy有關的會議依然在其官網上列出了投稿的模板。我恍然大悟:他們一開始根本沒有主動加上這篇「幽靈文獻」!而是……

我們一起來看看這個模板:模板首先列出了整篇文章的格式,包括標題、作者、所屬機構等。

模板的最後是致謝、附錄以及引用。在引用的部分,模板中加上了這篇Van der Geer的文章,作為引用格式的範例。

顯然,作者應該替換掉模板中的文字並換上自己的內容。然而,一些母語不是英語、而發表文章經驗又較少的作者可能並沒有弄懂這點。也可能他們填上了自己的引用後,忘記了刪掉這篇引用,證據就是#15和#20中的作者把模板中其他範例(Strunk Jr W et al.的書、Mettam GR et al.的章節)也留在了參考文獻中。

收尾

情有可原?還是嚴懲不貸?

在85,000篇Procedia的會議文章中,只有幾百篇包括了這篇「幽靈文獻」。總的來說,只有不到0.5%的Procedia的會議文章犯了這個錯誤,可以算是一個很小的誤差了。

同時,他們犯錯的原因也僅僅沒有理解模板的含義、或是忘了刪除部分模板內容,總的來說是無可厚非的。

然而同時,我們也看到會議文章通常沒有、或者僅僅有很少的品質控制。他們的主要目的可能也不是發表一篇高品質的研究進展。

我看了看最近的一些會議文章,發現大部分都是一些初入科研領域、沒有什麼經驗的研究人員寫的。在Procedia conference proceedings發表這樣一篇文章要交很多版面費,然而能發表出來並被Web of Science收錄也算很值得了。

比較讓人困惑的是,大概40篇左右的文章發表在了非常著名的期刊上。他們大部分都是Elsevier期刊,或許有著類似的模板。然而,我不清楚的是,這篇「幽靈文獻」如何能被引用,而且還是作為半導體、電凝術、血壓、癌症耐葯的論據?

我猜可能是它夾雜在數十篇引用文獻中,讓作者和編者很難發現,也可能是參考文獻格式軟體或校讀文獻軟體的一個bug。畢竟和Elsevier 2006年以來發表的數千篇文章比,40篇並不多。

總結

歸根結底,論文裡引用不存在的文獻是因為不走心的寫作和品質控制。犯錯的概率很小,然而很多人為了評職稱等原因發表了大量這種比較「水」的文章,終於讓我們發現了這個小概率錯誤。

我們應該慶幸,這篇「幽靈文獻」畢竟是不存在的。如果這篇文章本身存在的話,那也許問題就更大了。對於學術研究這片汪洋大海來說,400次不準確的引用僅僅是微不足道的一個小水滴。然而對於正在看這篇文章的你來說,對於正在給Elsevier期刊投稿的我來說,對於成千上萬的學者、研究人員來說,400次的引用或許足以區分優秀或平庸。

總之,這篇文章的目的是提醒大家:對於看起來奇怪的參考文獻一定要足夠重視。付出一些應盡的努力,寫的時候更走心一些,或者讓有文獻統計學功底的人來幫你審核一下。

If something looks fishy, it probably IS fishy! (如果它看起來可疑,那它可能就是很可疑!)

原文地址

參考文獻

1. Van der Geer, J., Hanraads, J.A.J., Lupton, R.A., 2000. The art of writing a scientific article. J Sci. Commun. 163 (2) 51-59.

2. Adler, N.; Harzing, A.W. (2009) When Knowledge Wins: Transcending the sense and nonsense of academic rankings, The Academy of Management Learning & Education, vol. 8, no. 1, pp. 72-95.

3. Harzing, A.W. (2002) Are our referencing errors undermining our scholarship and credibility? The case of expatriate failure rates, Journal of Organizational Behavior, vol. 23, no. 1, pp. 127-148.

讀完這篇文章,你有仔細看參考文獻麽?

有沒發現什麼fishy的東西?

如果沒有,小咖強烈建議你重新讀一遍這篇文章……

-ykh

關注醫咖會,學習臨床研究方法

),拉你進統計討論群和眾多熱愛研究的小夥伴們一起交流學習。


TAG: |
獲得更多的PTT最新消息
按讚加入粉絲團