《武汉工程大学学报》  2015年05期 74-78   出版日期:2015-05-31   ISSN:1674-2869   CN:42-1779/TQ
大数据下中文期刊论文被引分析


0 引 言在期刊论文文献体系中,论文之间并不是孤立存在的,而是通过研究者之间相互交流、借鉴、参照、继承、质疑产生联系,形成引文,产生被引率.美国学者Markusov[1]和Smart 等[2]先后在1973年和1981年提出“被引率”这一概念. Van Campenhout[3]提出论文被引率与同行公认的其它指标高度相关.由此,被引率渐渐成为论文质量高低的参照点,并成为人们关注的重要参考标志.一般来说,被引率是指该期刊前5年发表论文在统计当年被引论文篇数/该期刊前5年发表论文篇数.被引率反映了期刊论文被利用的情况,被引率越大,反映期刊论文的被利用率越高.同时反映着科技期刊所载论文的学术价值、资料价值和适用价值.随着大数据时代的到来,在数据处理的理念上发生了三大转变:一是统计全部数据而不是抽样数据,二是数据要及时有效而不是绝对精准,三是更注重揭示相关关系而不是探究因果关系[4].大数据的核心是预测,即根据全面的数据预估未来事情的发展趋势[5].基于此,笔者以武汉工程大学发表的中文期刊论文被引数据为例,探讨武汉工程大学中文期刊论文被引变化态势,找寻提升被引率的对策.1 统计说明及方法自2006年2月更名为武汉工程大学后,其论文发文量稳步增长,论文整体呈现出化工特色、多学科特色、时代特色和地域特色[6].笔者对武汉工程大学2006~2014年所发表的中文期刊论文被引情况进行统计,并分析被引年度分布、被引频次比较及《武汉工程大学学报》被引数据. 1.1 统计范围本文的主要统计范围为2006~2014年发表于正式公开期刊上的以武汉工程大学为作者单位的所有中文期刊论文,且会议论文和论文集不在统计范围之内.1.2 数据来源笔者以中国知网(China National Knowledge Infrastructure,简称:CNKI)的中国学术期刊网络出版总库(China Academic Journal Network Publishing Database,简称:CAJD)所收录的2006~2014年中文期刊论文为统计数据源.1.3 统计方法进入中国知网http://www.cnki.net/,选择资源总库下的中国学术期刊网络出版总库,使用高级检索,在时间限定中输入2006~2014年,并在作者单位中输入“武汉工程大学”,将检索结果依据“被引”进行排序统计.1.4 统计时间本文各种数据统计时间以2015年3月12日前的“中国知网”中国学术期刊网络出版总库的数据为例.1.5 相关定义通常被引率是按学科来区分,如果按单位区分可靠度就会降低.但本文是在大数据背景下统计,只作预测和趋势.因此本文在分析中用到的被引篇数、被引率和篇均被引频次等多个文献计量指标均指某时期数据,即被引率是指武汉工程大学某时期论文的被引篇数÷某时期论文总篇数×100%;篇均被引频次是指武汉工程大学某时期论文被引频次÷某时期论文总篇数.2 统计结果分析2.1 论文被引的年度分布在2006~2014年间,武汉工程大学共发表中文期刊论文9 321篇,被引篇数5 864篇,被引率为62.91%,被引频次为25 752次,篇均被引频次2.76次,如表1所示.由表1可知,论文总量在逐年稳步缓慢上升;被引篇数在2010年达到最高点的870篇后,从2012年开始加大了下降的幅度;被引频次也出现同样现象.表1 武汉工程大学论文被引年度分布表Table 1 Annual citation distribution of papers published by Wuhan Institute of Technology2.2 论文被引随时间变化情况武汉工程大学中文期刊论文被引率为62.91%,其中,2007年论文被引率最高,2014年论文被引率最低.随着论文发表后时间的推延,被引机会或被引频率均会增加,因此论文发表后时间长短不同,其论文被引率也不同,但这并不是绝对的.总体上是发表时间越久,被引率越高. 发表时间越近的期刊论文被引用的机会越大,如表2所示.从表2中可以看出,在两个多月时间里,各年度论文被引篇数和被引频次均有变化.2007年论文被引篇数增加了5篇,论文被引频次增加145次,而2012年论文被引篇数增加44篇,论文被引频次增加232次.从时间分布来看,并不是随着论文篇数的增加,其被引篇数也增长,2011年论文总篇数达到1 131篇,但其被引篇数却只有794篇.对个体论文来说,其被引大多集中在发表后5年内,如果5年内没有被引用,则今后被引用的概率也不大[7].一般来说,中文期刊自然科学基金论文发表后的前4年,是论文由零被引转向非零被引的关键时段[8].另外,从《武汉工程大学学报》在2007~2014年间论文被引情况中也可以看出论文被引用多集中在发表后的5年内,如表3所示.表2 武汉工程大学论文被引短时变化表Table 2 Citation changes in short term of papers published by Wuhan Institute of Technology表3 《武汉工程大学学报》被引年度分布表Table 3 Annual citation distribution of papers published by Jorunal of Wuhan Institute of Technology2.3 论文被引频次高低比较不同的文献类型、引文窗口、期刊论文主题等都会对期刊论文的被引周期发生影响[9].笔者统计了2006~2014年间武汉工程大学中文期刊论文最高被引频次和最低被引频次,并统计了2006~2014年间《武汉工程大学学报》被引频次最高的前10篇论文,分别列于表4和表5中.在2006~2014年度中,武汉工程大学中文期刊论文最高被引频次为150次,最低被引频次为1次.共有5 864篇论文被引用,其中有1 738篇论文仅被引用1次.2006年最高被引频次为150次的论文为“国外主流写作理论对我国外语写作教学的启示”;2014年最高被引频次为8次的论文是“MOOC课程模式及其对高校的影响”.从年度最高被引频次的这9篇论文内容特征看,多数是综述性论文,涉及外语教学、材料、煤矿安监、网络安全、循环农业、房地产预警、管理科学及教学改革等,其中MOOC网络学习模式尤其体现了当前的研究热点,也与我国乃至世界当前的技术发展有关.从表4中还可以看到,自2009年后,最低被引篇数均在200篇以上,零被引篇数也呈逐年上长趋势,但随着时间推移,这个动态数据会逐渐缩小的.从《武汉工程大学学报》最高被引频次前10篇论文看,论文的发文时间也多集中在2008、2009和2011年间,其内容特点也多倾向于综述性或与教学、就业相关.表4 2006~2014年度最高和最低被引频次对比列表Table 4 Contrast between the highest and the lowest citation frequencies from 2006 to 2014表5 《武汉工程大学学报》被引频次最高的前10篇论文Table 5 The top 10 papers of citation frequencies from Journal of Wuhan Institute of Technology3 结 语a.统计结果表明,在2006~2014年,武汉工程大学发表的中文期刊论文被引率为62.91%.从年度被引率看,2007年最高,2014最低,2006~2011年被引率均高于平均被引率62.91%.2012年以后,被引率降为60%以下,而且每年递减较大,虽然发表时间越久,越有可能被引,被引率也就越高,但这并不是绝对的,比如2007年的被引率既高于2006年被引率,也高于2008年被引率.当然,不同学科,其被引率也不同.譬如,我国高被引科学家主要集中在化学、工程、材料科学领域[10].文中的论文被引数据是年度平均值,只是代表了一种论文被引趋势,并不能明示具体学科的论文被引情况.b.从期刊论文被引频次高低比较看,在2006~2014年共发文9 321篇,其中被引用的5 864篇,零被引用的3 457篇.零被引用论文篇数占全部论文篇数37.09%.2004年英国学者Weale等[11]提出零被引率(non-cited rate)概念,作为一种期刊质量反向评价指标.杨利军等研究发现,零被引率与我国学者在写作时,参考文献偏向于引用非中文期刊类型的文献,而对中文期刊论文的引用不足有关[12],这在某种程度上反映了国内目前缺乏科研自信的学术氛围,以为外文文献就是好文献,引用外文文献就能提高文章质量的盲从思维[13],当然也与发文的时间周期、内容质量和研究热点有关.1次引用频次的论文为1 738篇,占被引篇数29.64%(近三分之一),占全部论文篇数18.65%.由此说明论文内容质量还需要进一步提高.c.从年度最高被引频次看,最高被引频次的9篇论文既有共性又各有特色,其共性多呈现在论文的综述性质,其个性多与专业的普及性、发展性和时代的需求性有关,如外语教学、电极材料、煤矿安全、网络安全、循环农业、房地产预警、企业管理等均体现了这些特性,尤其近来随着互联网发展而出现在MOOC网络学习模式,更是引起人们的广泛关注.因此,要想提高论文被引频次,在论文选题上应该首选紧跟时代热点,结合现实问题的综述性文章.d. 从《武汉工程大学学报》被引频次前10的论文来看,其多体现地域、单位特色及重点专业研究特色,被引论文发文的时间多在5年内,被引率保持逐年上升趋势.e. 虽然论文被引用客观地反映了其他作者对该文的认同,但不同类型的文章、不同学科领域,引用的情况也不一样.武汉工程大学被引用高的论文一方面反映出本校在相关领域研究中的影响力不断提升的事实,另一方面也反映本校近几年科研投入、人才引进、团队组建等方面所收到的实效.f.不同学科领域、不同类型的文章,其引用的情况也不一样.在大规模数据背景下,对各个学科引用情况归一化处理后,平均来看引用得越多,说明关注度越高,在一定程度上也可以表明科研成果的水平越高.比如综述类文章引用率就比较高,人文科学引用往往比较少,且人文社科领域往往通过专著而非论文来体现学术水平[10].从武汉工程大学年度最高被引频次论文和《武汉工程大学学报》最高被引频次前10篇论文来看,提高论文被引率的对策就是论文的内容要具有新颖性和时代性,研究要具备突破性,结论要具有数据证明性和区域行业通用性特点等,且类型多是“研究综述”、“发展趋势”等综述性的论文.另外,还需制定相应的被引率奖励政策,鼓励作者写出高质量的期刊论文.致 谢感谢武汉工程大学图书馆对本文的数据支持!