刚刚,斯坦福全球AI报告正式发布。

  从去年开始,斯坦福大学主导、来自MIT、OpenAI、哈佛、麦肯锡等机构的多位专家教授,组建了一个小组,每年发布AI index年度报告,全面追踪人工智能的发展现状和趋势。

  “我们用硬数据说话。”报告的负责人、斯坦福大学教授、前任谷歌首席科学家Yoav Shoham谈到这份最新的报告时表示。

  今年的报告,从学术、工业、开源、政府等方面详细介绍了人工智能发展的现状,并且记录了计算机视觉、自然语言理解等领域的技术进展。

  报告要点:

  一、美国AI综合实力最强

  1.美国的AI论文发布数量虽然不是第一,但美国学者论文被引用的次数却是全球第一,比全球平均水平高出83%。

  2.2018年美国AI创业公司的数量,比2015年增长2.1倍。而从2013年到2017年,美国AI初创企业获得的融资额增长了4.5倍。均高于平均水平一倍以上。

  二、中国AI追赶速度惊人

  1.清华2017年学AI和机器学习的学生数量,是2010年16倍。

  2.70%的AAAI论文来自美国或中国,两国获接收的论文数量相近,但中国提交的论文总量比美国多30%。

  3.基于经同行评议论文数据库Scopus的数据,2018年发布AI论文最多的地区是欧洲(28%)、中国(25%)和美国(17%)。

  4.与2000相比,2016年中国AI学者论文被引用的次数,提高了44%。

  5.中国一年的机器人部署安装量,从2012到现在增长了500%。ROS.org来自中国的访问量,2017年比2012年增加了18倍。

  三、全球AI发展提速但仍不均衡

  1.2017年,全球ML人才需求已经是2015年的35倍。

  2.整体来说,自2016年以来,美国、加拿大、英国政府在国会/议会会议中对人工智能和机器学习的提及激增。

  3.80%的AI教授是男性,统计数据来自UC伯克利、斯坦福、UIUC、CMU、UC London、牛津和苏黎世联邦理工学院。

  4.美国AI工作岗位的应聘者中71%为男性。

  看过这份报告之后,人工智能大牛吴恩达总结了两点:1、AI正在快速发展,不管是学术界还是工业界都是如此。2、AI的发展仍不均衡,在多样性、包容性方面仍需努力。

  以下是这份报告的主要内容:

  AI论文情况分析

  发表总量增长迅猛

  从1996年到2017年,CS领域的年发表论文增长了约五倍 (6x) ,AI领域的年发表论文增长了约七倍 (8x) 。对比一下,所有学科的年发表论文总量增长了不到两倍 (<3x) 。

  划重点,AI论文的年发表量,比CS论文增长要快。

  各地区AI论文发表情况

  2017年,Scopus上面的AI论文,有83%来自美国以外的地方。具体数据是,28%来自欧洲,25%来自中国,17%来自美国。

  从2007年到2017年,中国的年发表AI论文数增长了150%。

  细分领域论文发表情况

  2017年发表的AI论文中,有56%来自机器学习与概率推理这一研究方向。

  对比一下,2010年发表的AI论文,只有28%来自这个方向。

  另外,图表里显示的大部分研究方向,在2014-2017年间,复合年均增长率 (CAGR) 比2010-2014年要高。

  比如,神经网络这一方向的论文发表数量,2014-2017年之间,复合年均增长率达到37% (如图中红色曲线) ,最为突出。

  做个对比,在2010-2014年之间,神经网络论文发表数,复合年均增长率仅有3%。

  arXiv论文

  自2010年以来,arXiv论文总体呈现迅速增长,从2010年发布的1,073篇,到2017年发布的13,325篇,增长超过11倍 (12x) 。许多细分领域也呈现增长。

  这表示,论文作者们倾向于把自己的研究成果传播出去,不论是经过同行评审还是在AI会议上发表的论文。这也体现了,AI这个领域竞争激烈的特质。

  在细分领域中,计算机视觉 (CV) 是自2014年起增长最快的一个 (上图蓝色曲线) ,从1,099篇增长到2017年的4,895篇,涨幅近400%。

  AI论文引用量

  FWCI是领域权重引用影响系数,可以用来衡量论文的影响力。

  报告重新定义了一种“改装版” (Re-based) 的FWCI,不按地区,而按世界平均值,来计算影响力。

  在这个标准之下,虽然欧洲发表的AI论文数高于中国和美国,不过论文影响力曲线比较平缓;相比之下,中国发表的论文影响力增长剧烈:与2000年相比,2016年平均每位中国AI论文作者的引用率增长了44%。

  不过在这方面,美国依然全球领先,美国AI论文作者的平均引用率,比世界平均值高出83%。

  AAAI论文

  AAAI 2018,提交论文,中美占70%,中选论文,中美占67%。

  中国的论文提交数高出美国约1/3,但二者中选论文数相差无几,中国入选265篇,美国入选268篇。

  高校AI课程注册情况

  AI和ML进军高校的速度提升了不少。

  报告显示,截止到2017年底,AI课程注册人数是2012年的3.4倍,ML课程注册人数是2012年的5倍。

  其中,UC伯克利的ML课程的注册人数增长最快,是2012年的6.8倍,但此数值较2016年增长速度有明显下降。

  报告进一步统计了非美国地区院校AI+ML课程注册人数的变化。结果显示,清华是非美国院校外增长率最高的高校,几乎是第二名多伦多大学的2倍。

  纵向对比来看,清华2017年AI+ML课程注册人数是2010年的16倍。

  学术会议热度

  在大型会议中,NeurIPS (曾用名NIPS) 、CVPR和ICML,是参与人数最多的三大AI会议。自2012年以来,论参与人数的增长率,这三者也领先于其他会议。

  NeurIPS和ICML参与人数增长最快:将2018年与2012年相比,NeuRIPS增长3.8倍 (4.8x) ,ICML增长5.8倍 (6.8x) 。

  上面讨论的是大型会议,但小型会议的参与人数同样有明显的增长,甚至可以比大型会议的增长更加明显。

  这里最突出的是,ICLR 2018的参会人数达到了2012年的20倍。

  原因很可能是近年来,AI领域越来越关注深度学习和强化学习了。

  AI创业投资情况

  从2015年1月到2018年1月,人工智能创业公司的数量增长到了原来的2.1倍,而所有活跃的创业公司增长到了原来的1.3倍。

  大多数情况下,创业公司的增长都保持相对稳定,而人工智能创业公司呈指数级增长。

  在风投资金方面,从2013年到2017年,人工智能领域的风投资金增长到了原来的4.5倍,而所有的风投资金只增长到了原来的2.08倍。这些数据都是年度数据,不是逐年累积的。

  图表中有两个高峰期,1997-2000年风投资金的激增,对应的是网络泡沫时期。2014-2015年出现了一个较小的增长,因为当时正处于一个相对较大的经济增长时期。

  人才需求

  报告显示,近几年,社会需要的AI相关人才大幅度增加,目前对有ML技能的人才需求最大,其次是深度学习。

  可以看出,ML人才需求也是这两年增长速度最快的。

  报告统计,2017年,全球ML人才需求是2015年的35倍,从2016年到2017年的增幅尤为明显。全球对AI人才的需求在2016年骤增。

  专利

  2014年,大约30%的人工智能专利发明人来自美国,其次是韩国和日本,各拥有16%。

  在韩国和中国台湾地区,专利的增长速度较快。2014年人工智能专利的数量几乎是2004年的5倍。

  财报电话会议中提及AI和ML的次数

  2015年,科技公司在财报电话会议中提及AI和ML的次数开始有所增加。

  2016年,其他行业提及AI次数才开始增长。

  相比之下,科技行业的公司提及AI和ML的次数远比其他行业多。

  在财报电话会议中,除了科技行业之外,提及AI次数最多的公司,基本上分布在消费、金融和医疗保健行业。

  机器人安装量

  2012年到2017年,中国机器人年安装量增长了500%,其他地区,比如韩国和欧洲,分别增长了105%和122%。

  在安装量较小的地区中,中国台湾比较突出,在2012-2017年增长最快。

  开源框架GitHub标星数

  各框架的标星数反映着他们在开发者群体中的流行程度。不过,因为开发者们日常不会“取关”GitHub项目,所以这些星星都是多年来积攒下的。

  我们可以明显发现,TensorFlow的受欢迎程度在开发者中遥遥领先、稳步增长。

  排除了第一热门,第二名和第三名分别是scikit-learn和BVLC/caffe。

  TensorFlow官方力推的keras排到了第四,但近一年来几无增长势头。

  另外两大热门PyTorch和MXNet分别排到了第七和第六,尤其是PyTorch,作为一个年轻的框架,自2017年初发布以来至今,GitHub标星数至少增长了4倍。获取新用户的势头很猛,不知道其中有多少被TensorFlow逼疯的人类。

  各类任务最新成绩

  这个部分分为CV和NLP两块,分别列举了各主流任务从发展之初到现在的成绩进步情况。

  ImageNet图像识别准确率

  2017年是ImageNet比赛的最后一届,2018年这项比赛就不再进行了。不过,验证集依然有人在用。

  图中,蓝色的线条为ImageNet挑战赛历年的成绩变化,由于每年比赛所用的数据不同,旁边多了一条黄色线条,是以ImageNet 2012验证集为评价标准绘制的。

  可以看出,到2015年,机器在图像分类任务上的能力已经明显超越了人眼,而即使比赛不再继续,学术研究者依然在认真推进该任务的表现。

  这也侧面说明,如果一项工作有了明确的评价标准和固定的挑战内容,研究者们围绕此竞争,更容易让技术在该领域取得突破。

  ImageNet训练速度

  这张图是训练ImageNet图像分类神经网络所需时间的历年变化(当然,是买得起足够计算资源的人和机构所用的时长)。

  从2017年6月的1小时,到2018年11月的4分钟,ImageNet图像分类神经网络的训练速度提升了16倍,除了硬件方面的贡献,算法上的提升也不容小觑。

  图像分割COCO

  ImageNet挑战赛“退休”之后,CV领域的朋友们就把重点放在了微软的COCO,挑战语义分割和实例分割。

  四年来,COCO数据集上图像分割挑战的精确度已经提升了0.2,2018年的成绩比2015提升了72%。不过,目前还没有超过0.5,这一项还有充足的进步空间。

  另外值得一提的是,COCO比赛近年来占据冠军位置的多是来自中国的公司,包括旷视、商汤等计算机视觉独角兽日常包揽数个项目的冠军。

  语法分析(Parsing)

  在确定句子结构这种语法分析的任务上,2003年到2018年的15年间,AI的表现(F1 Score得分)提升了将近10%。

  机器翻译

  在机器翻译任务上,报告拿英语-德语互相翻译举例,评估了AI模型在经典机器翻译评估算法BLEU标准中的表现。

  报告显示,2018年英语转德语的BLEU评分是2008年的3.5倍,德语转英语成绩是2008年的2.5倍。

  机器问答:AI2 Reasoning Challenge(ARC)

  在问答领域,AI表现进步更明显,可以按月计数了。

  报告统计了2018年从四月到11月间,AI在ARC推理挑战赛上成绩的变化:简单组得分从63%提升到69%,挑战组得分从27%提升到42%。

  这些,都仅是半年间的进步。

  机器问答:GLUE

  同样用于机器问答的GLUE基准(General Language Understanding Evaluation)推出至今只有7个月的时间,但目前的表现已经比半年前提升了90%。

  GLUE的推出者、纽约大学助理教授Sam Bowman说,虽然围绕GLUE的大型社区还没有出现,不过已经有了像谷歌BERT这样的代表性技术用了GLUE基准,面世一个月内已经被引用8次。在EMNLP会议中,GLUE时常被讨论,可能会成为语言理解领域中的一个基准线。

  政府提及

  整体来说,自2016年以来,美国、加拿大、英国政府在国会/议会会议中提及人工智能和机器学习的次数激增。

  2016年之前,机器学习很少被提及,与人工智能相比,机器学习在总提及量中只占很小的一部分。