大学排名引爆媒体,背后的数据科学多少人懂?
本文回顾了SCI和大学排名的诞生,比较了目前“四大”世界大学排名的指标体系(上海交通大学的ARWU、QS、《泰晤士报高等教育副刊》和《美国新闻与世界报道》),分析了最近这十几年出现的新趋势(全球化、分赛道与微调整),同时介绍了各种大学排名背后的数据科学家与数据公司,以及他们在工作中面临的挑战。
历史回溯:SCI 和大学排名
60年前,尤金?加菲尔德开创了文献计量学,首创了科研“影响因子”计算方法。二战后,美国加大对科研的投入。加菲尔德先是给军方建了医学图书馆的索引,接着帮两家制药公司建了一个5000多项化学专利的数据库,然后给国家健康署建了遗传学的论文库。利用从这三个课题里摸索出的方法,加菲尔德在费城创办了科学信息所,把影响因子的计算从医学、化学、生物领域扩展到更多的学科领域,并在1963年第一次发布科学引用指数,就是后来引无数学者竞折腰的SCI。这种算法原理简洁优美,跟谷歌的网页排名有相似之处:一个网页的信息量如何?要看它被其他网页链接的次数;一篇文章的水平如何?要看它被同行引用的次数。
伴随着SCI(以及之后的SSCI等)的诞生与普及,以及顶尖学术期刊如《自然》《科学》的影响力提高,教授的聘任与晋升取决于论文发表(俗称“要么发表要么完蛋”),大学与学科排名也离不开用论文引用率来衡量科研产出。加菲尔德的科学信息所在90年代被汤森路透公司收购。这家公司由英国的路透社与加拿大的汤森集团两家合并而成,每年都会为《美国新闻与世界报道》《泰晤士报高等教育副刊》等发布世界大学排名的机构提供数据支持,还会长期跟踪最前沿、影响深远的论文及其作者,来预测每年的诺贝尔科学奖得主。
40年前,鲍勃?摩斯从美国财政部转行去了《美国新闻与世界报道》杂志社,带领团队在1985年首次推出了《美国大学排名》。从此每年一度的排名发布日,都牵动了无数美国高校管理者、教师、学生、家长的心。在2014年排名发布的当天,该页面就有260万次独立访问量。摩斯在接受《华盛顿邮报》采访时说:“我意识到责任重大……我们就像高等教育里一只800吨的大猩猩。”摩斯称自己为首席数据战略师,他喜欢跟数据打交道,说“分析数据与给大学排名就是我的DNA”。
学经济出身的摩斯把计算CPI(消费者价格指数)的方法用在了大学排行榜上:调查市场物价水平,要跟踪消费者的“菜篮子”,设定柴米油盐这些日用品所占比重,乘以各项物品的价格,再汇总为整体变化情况;给大学排名,要跟踪学校的教学与科研,设定师生比、录取分数、教师科研产出等指标所占权重,乘以各项指标的数值,再汇总为整体水平。这种大学排名方法沿用至今,原则上没有大的变动,只是各种机构采用的具体指标及其权重有所调整,就像调查消费者的日常通信费用,从传统的座机费、传呼机费、手机费、短信费再到现在的网络流量费,发生了一系列变化。
新趋势:全球化、分赛道与微调整
过去十几年里,大学排名的新趋势,从宏观来看,体现在地域范围,即从美国扩展到全球,先后出现了2003年上海交通大学首次发布的世界大学学术排名ARWU,2004年总部在英国的QS与《泰晤士报高等教育副刊》联合发布世界大学排名(这两家已经停止合作,从2009年开始独立发布排名),2006年美国《新闻周刊》发布全球前100所大学排名,2010年澳大利亚发布世界500所高影响力大学排名,2012年总部位于沙特阿拉伯的世界大学排名中心CWUR发布了1000所大学排名,2014年《美国新闻与世界报道》也开始发布全球750所大学排名。可见中国的高校既可以在“家门口”参加上海交大的ARWU排名,也可以“远征”海外去一较高下。目前最有影响力的是上海交大、QS和《泰晤士报高等教育副刊》三家的排名,但《美国新闻与世界报道》也不容小觑。接下来的比较就集中在这四种大学排名。
从中观看,大学排名出现了“分赛道”的发展方向,主要是按区域与按学科两种划分方式。按区域划分,QS在2009年推出亚洲大学排名,2011年推出拉美大学排名,2013年还推出了金砖四国(BRIC,即巴西、俄罗斯、印度和中国)的大学排名。《泰晤士报高等教育副刊》也有亚洲大学排名、金砖四国与新兴经济排名(即增加了南非)。值得注意的是,这两个总部在英国的机构对金砖四国的排名都不包括香港的大学,这种划分方式是否合理,还存在争议。《美国新闻与世界报道》的区域划分更为全面,分别对亚洲、中东、非洲、拉美、欧洲、澳洲进行了排名,还分别对加拿大、中国等12个国家的大学进行了排名。
按学科划分,上海交大按学科将全球大学的排名分成了学科领域(field)和学科(subject)两种,五大领域包括理科、工科、医科、生命科学与社科,五大学科包括数学、物理、化学、计算机和经济学。《泰晤士报高等教育副刊》的学科排名分为六大领域,与上海交大相比,增加了人文学科领域。QS的学科领域为五类,分别是人文、社科、生命科学与医学、自然科学与工程技术。每个领域里还具体分出多个学科,总数为37,包括在其他世界大学排名里没有出现的教育学、心理学等。《美国新闻与世界报道》没有划分学科领域,直接分为农业、人文、化学、临床医学等22个学科。因此,中国的高校除了参加在区域里被划分出来的亚洲大学排名或金砖四国排名,还可以根据自身学科优势,选择不同的“赛道”。
从微观来看,每一种世界大学排名都构建了自己的指标体系(见表2至表5),并在设计具体指标以及调整指标权重的过程中煞费苦心。但整体而言,最近十几年是一个“微调整”阶段,并没有出现本质变化。比较前面提到的四种大学排名,它们的指标体系相对稳定,可分为论文、声望、教学及国际化这四个主要维度(见表1)。论文发表及引用所占的权重为20%到60%,在指标设计上体现出来的三大新趋势是:强调人均产出(例如QS和《泰晤士报高等教育副刊》的排名都看教师人均论文发表数量或引用率),突出高影响力(例如上海交大的排名看在《自然》和《科学》上发表的论文数量,还看论文被引用数量最高的学者人数),考虑学科差异(例如《泰晤士报高等教育副刊》也把论文引用率在人文学科排名的权重从30%调整为15%),并体现全球化(例如QS和《泰晤士报高等教育副刊》都使用Elsevier的Scopus库,因其统计的15000多种期刊里,60%来自美国以外,《中华医学杂志》《计算机学报》《力学学报》《中国物理快报》等重要的中文期刊都被收录在内,对用非英文发表的学者来说,Scopus库是一个更适合的平台)。
大学排名指标体系里,学术声望的权重为25%到40%,主要采用同行评议,向全球范围内的学者发放调查问卷来对大学或学科进行排名。既有排名机构(如QS)自己发放问卷,也有排名机构委托第三方(如前面提到的汤森路透公司)来实施调查。注意只有上海交大的排名没有采用类似的调查结果,而是直接用获得诺贝尔奖和菲尔兹奖的教师数及校友数来衡量学术声望,好处是结果准确,没有争议,不受被调查者的主观意愿影响,不足在于大多数高校以及大部分学科都无人获得诺贝尔奖和菲尔兹奖,因此这项指标适用范围较窄。
与教学相关的指标在大学排名里所占权重为10%到20%,主要涉及博士生培养数量与师生比。与国际化相关的指标所占权重为7.5%到10%,主要涉及外国学生占比、外国老师占比以及国际合作的论文发表情况。其中最后这项国际化指标是一个新趋势,在《泰晤士报高等教育副刊》和《美国新闻与世界报道》的排名指标体系里都有采用,就是看教师与国外同行联合发表论文的情况。这个新动向值得中国高校关注。
除了论文发表及引用、学术声望、教学与国际化这四个必选项,每一种大学排名还有自己的特色指标,都被纳入“其他”,所占权重在5%到10.75%。例如《美国新闻与世界报道》的排名看学术会议与专著的发表情况,QS的排名看用人单位对毕业生的评价,《泰晤士报高等教育副刊》的排名看教师人均获得的研究经费等。
结语:成也数据,败也数据
前面我们回顾了SCI与大学排名的起源,也展望了各排名机构在最近十几年的新动向。不管是最初的论文影响因子计算,还是近期各种大学排名指标体系的调整,背后都离不开像加菲尔德、摩斯这样的数据科学家,离不开长期在全球跟踪科研数据并开展调查的第三方机构。没有数据的采集与分析,就没有今天的大学排名。
每次大学排名的发布,都牵动人心。《美国新闻与世界报道》的做法是提前一天把排名结果告诉高校,这样校方可以在当天召开自己的新闻发布会。但2015年的世界大学排名就让纽约州立大学的布法罗分校震惊了。由于汤森路透公司对该校授予博士学位数量的统计有误,导致该校排名从第181名跌到了并列第344名。后来《美国新闻与世界报道》在官方网站上更正了这一排名结果。汤森路透也重新检查了所有原始数据以确保准确。这一事件再次说明,做与数据相关的工作要时刻心怀敬畏,避免出现“失之毫厘,谬以千里”的情况。
即使原始数据准确无误,各种大学排名的指标体系也存在争议,主要是针对一些具体的指标及其权重,例如上海交大的排名里获诺贝尔奖和菲尔兹奖的教师数与校友数,两项指标相加共占30%的权重,又如QS用来衡量教学的指标仅有师生比一项,所占权重为20%。相比之下,《泰晤士报高等教育副刊》和《美国新闻与世界报道》的指标设计更多维,权重也更分散。指标设计是数据科学家的本职工作,是数据公司的核心技术,超出了这篇文章的讨论范围。上述举例仅是指出一些争议最大之处,同时也是限制这些大学排名继续发展的“瓶颈”,例如上海交大的排名难以覆盖到诺贝尔奖和菲尔兹奖之外的学科。对这些指标的进一步完善,是大学排名机构的当务之急,长远来看也会影响高校在科研、教学、国际化等维度上的资源配置。 (如需更多战略规划相关资料,请联系010-58819662。)
专注高等教育,请微信搜索“麦可思究”或“MyCOS_Research”。