重磅 | 高盛百页人工智能生态报告:美国仍是主导力量,中国正高速成长
时间:2016-12-14 09:48:44 来源: 机器人e资讯
● 概要
● 什么是人工智能?(略)
● 价值创造的主要驱动力(略)
● 加强未来的生产率(略)
● 人工智能和生产率悖论:采访 Jan Hatzius(略)
● 生态系统:云服务,开源在未来的 AI 投资周期中的关键受益人
● 使用案例(略)
● 农业(略)
● 金融(略)
● 医疗(略)
● 零售(略)
● 能源(略)
● 驱动者
● 附录(业内公司列表)
● 披露附录

● 什么是人工智能?
人工智能是做出能够以人类智能的方式学习并解决问题的智能机器和计算机程序的理工科。传统而言,该领域包括自然语言处理与翻译、视觉感知与模式识别,以及决策制定。但该领域以及应用的复杂度都在急剧扩展。
在此报告中,我们的大部分分析集中在机器学习(人工智能的一个分支)与深度学习(机器学习的分支)上。我们强调两点:
简言之,机器学习是从样本和经验(即数据集)中进行学习的算法,而不是依靠硬编码和预先定义的规则。换言之,也就是开发者不再告诉程序如何区分苹果和橘子,而是向算法输入数据(训练),然后自己学习如何区分苹果和橘子。
深度学习的重大发展是人工智能拐点背后的主要驱动。深度学习是机器学习的一个子集。在大部分传统的机器学习方法中,特征(即有预测性的输入或属性)由人来设计。特征工程是一大瓶颈,需要大量的专业知识。在无监督学习中,重要特征并非由人预定义,而是由算法学习并创造。
为了更加明了,我们不注重真人工智能、强人工智能或通用人工智能这样的概念,它们意味着复制人类智能,也经常出现在流行文化中。虽然已经有了一些有潜力的突破,比如谷歌 DeepMind 的 AlphaGo 系统,我们还是更注重立即有实在经济的人工智能发展。
● 为何人工智能发展加速?
深度学习能力的极大发展是如今人工智能拐点背后的催化剂之一。深度学习的底层技术框架——神经网络,已经存在了数十年,但过去 5 到 10 年的 3 种东西改变了深度学习:

图 1:年度数据生成预期到 2020 年达到 44zettabytes

图 2:全球超级计算机的原计算性能,以 GFLOPs 测试

图 3:每单位计算的价格有了极大下降
3. 更好、更普遍可用的算法。更好的输入(计算和数据)使得更多的研发是面向算法,从而支持深度学习的使用。例如伯克利的 Caffe、谷歌的 TensorFlow 和 Torch 这样的开源框架。比如,刚开源一周年的 TensorFlow,成为了 GitHub 上有最多 forked repositories 的框架。虽然不是所有的人工智能发生于普遍可用的开源框架中,但开源确实在加速发展,而且也有更多先进的工具正在开源。
● 方向
虽然本报告的重点是人工智能的发展方向以及公司如何把握这个方向,但是了解人工智能对我们生活的影响程度也是很重要的。
在线搜索。就在一年多以前,谷歌透露,它们已经开始将大量的搜索工作移植到了 RankBrain(一个人工智能系统),使其和链接(links)以及内容(content)成为了谷歌搜索算法的三个最重要的标志。
推荐引擎。Netflix,亚马逊 和 Pandora 都在使用人工智能来确定推荐什么样的电影和歌曲,突出哪些产品。5 月,亚马逊开源了它们的深度可扩展稀疏传感网络引擎(the Deep Scalable Sparse Tensor Network Engine(DSSTNE),简称「Destiny」),它被用于产品推荐,同时可以被扩展以实现超越语言和语言理解以及异议识别的目的。
人脸识别。Google(FaceNet)和 Facebook(DeepFace)都投入了大量的技术来确定您的照片中的人脸和真实的人脸是不是几乎完全吻合。1 月,苹果采取了进一步措施,购买了 Emotient(一个致力于通过读取人的面部表情来确定其情绪状态的 AI 创业公司)显然,这些技术远远不止于对照片进行标记。
虽然个人助理应用产品有无数的用户,比如苹果的 Siri,信用贷,保险风险评估,甚至天气预测。在接下来的篇幅中,我们探讨企业该如何使用这些技术来加速增长,降低成本和控制风险。从这些技术及其使用这些技术的应用的发展速度来看,它们充其量不过可以为公司和投资者提供一些方向,以保持他们的竞争力。
美国的劳动生产率在 90 年代中期的快速增长和过去十年的缓慢增长和之后,近年来已经停止增长了。我们认为,就像 20 世纪 90 年代互联网技术被广泛采用那样,消费类机器学习和人工智能的扩散有可能大幅度地改变全球产业的生产范式。

图 9:生产力分析;单位百万美元,假设 2019 年之后 GDP 线性增长
我们相信,在未来的几年中,一个公司利用人工智能技术的能力将成为体现公司在所有主要行业竞争力的一个属性。虽然战略会因公司规模和行业而有所不同,但如果管理团队不会把重心放在领导人工智能和在此基础上的利益上,那么未来产品创新、劳动效率和资本杠杆都会存在落后的风险。因此,我们认为公司需要投资这些新技术以保持竞争力,同时这将导致对人工智能所以依赖的人才、服务和硬件的空前的需求。




图 15:人工智能的发展可以与历史上的系统架构和编程语言的采用的技术革命相比,尽管我们认为我们目前仍然处在人工智能发展和应用的早期阶段
● stack 的演变过程以及和 AI 之间的对应关系

图 17:生产中的机器学习:如何在机器学习管道中利用各种开源和云技术



图表 21:水平 AI-aaS 产品和定价:来自云平台的 AI-aaS 产品示例
iResearch 预测,2020 年,中国人工智能市场将从 2015 年的 12 亿人民币增长至 91 亿人民币。2015 年,约 14 亿资本(年增长率 76%)流入了中国的人工智能市场。
在政府政策方面,中国的国家发展改革委员会(发改委)和其他相关政府机构于 2016 年 5 月 18 日发布了《「互联网+」人工智能三年行动实施方案》。《方案》指出了人工智能领域发展的六大保障措施,包括资金支持、标准体系、知识产权保护、人才培养、国际合作和组织实施。《方案》提出,到 2018 年,中国的人工智能基础资源与创新平台、产业体系、创新服务体系、标准化体系应基本建立。发改委期望中国人工智能产业整体与国际同步,系统级别(system-level)的人工智能技术和应用要位于市场领先位置。


Exhibit 24:至少被引用一次的、并提到「深度学习」或者「深度神经网络」的期刊文章
中国的互联网巨头百度、阿里巴巴和腾讯(BAT)正在领导中国的人工智能市场,同时数以百计的初创公司也正渗透到这一产业中,并在各种人工智能细分市场及应用领域建立服务模型。目前,中国的人工智能领域包括:
基本服务,如数据资源和计算平台;
硬件产品,如工业机器人和服务机器人;
智能服务,如智能客户服务和商业智能;以及
技术能力,如视觉识别和机器学习。
根据 iResearch,目前,语音和视觉识别技术分别占中国人工智能市场的 60% 和 12.5%。在中国,所有和人工智能相关的公司中,71% 专注于开发应用。其余的公司专注算法,其中,55% 的公司研究计算机视觉,13% 研究自然语言处理,9% 致力于基础机器学习。

百度:
● 2015 年 9 月,百度「度秘」:声控人工智能个人助理(整合进百度移动搜索应用)
● 2015 年 11 月,百度 DeepSpeech 2:包含一个大型神经网络的语音技术,通过样本学会将声音与语词联系起来
● 2015 年 12 月,百度无人车:百度无人车在北京道路上完成测试,并在硅谷设立自动驾驶部门(ADU)
● 2016 年 8 月,百度「DuSee」:为移动设备打造的 AR 平台(整合进百度搜索和地图移动应用),在搜索广告方面有着广泛应用
● 2016 年 9 月,百度大脑:官方介绍,百度的人工智能平台
● 2016 年 9 月,Paddle Paddle:百度近期开源的深度学习工具包
● 2016 年 10 月,百度移动应用 8.0:新升级的移动搜索应用,内含一个整合了智能搜索和个性化新闻推荐的系统,其背后采用了人工智能、自然语言处理和深度学习技术
阿里巴巴:
● 2015 年 7 月,阿里小蜜「阿里小秘书」:虚拟人工智能客服,据公司 2016 年 10 月报告,问题解决率已达到 80%
● 2015 年 8 月,DT PAI:基于阿里云的服务,用来处理机器学习过程,被该公司称为是中国的第一个人工智能平台
● 2016 年 6 月,阿里妈妈光学字符识别:该技术获得文档分析与识别国际会议(ICDAR)Robust Reading 比赛第一名
● 2016 年 8 月,阿里云 ET:一套综合的人工智能解决方案套件,包括视频、图像和语音识别技术
腾讯:
● 2015 年 6 月,优图:腾讯为开发者开放了其面部识别技术,以及优图科技的其他核心技术
● 2015 年 8 月,腾讯 TICS 实验室:2015 年腾讯设立的智能计算和搜索实验室,专注于四个方面:搜索、自然语言处理、数据挖掘和人工智能
● 2015 年 9 月,Dreamwriter:腾讯上线中国第一个新闻报道机器人
● 2015 年 11 月,WHAT 实验室:微信-香港科技大学人工智能联合实验室,于 2015 年 11 月 26 日成立

人工智能生态:使用案例与潜在机会
● 谷歌在做些什么?
谷歌的搜索算法在过去二十年里进展迅速。从 1998 年的 PageRank 到 2015 年的 RankBrain,基于链接的网络排名已经进化成人工智能驱动下的查询匹配系统,后者能够不断适应那些独特的搜索(占谷歌所有搜索的 15%)。在云技术方面,公司五月份公布了针对平台的定制化硬件加速器方面取得的进展,一种定制化的 ASIC,亦即 TPU,这一进展对 2015 年开源的机器学习软件库 TensorFlow 进行了补充。过去三年中,在与人工智能相关的收购战中,公司也当仁不让。被收购的公司中,最知名的当属 DeepMind,它提升了 Alphabet 的神经网络功能并已经将其应用于各种人工智能驱动的项目中。
为何重要?
在搜索中使用算法,谷歌可谓先行者。将自然语言处理应用到配备用户搜索意图和可欲结果方面,公司一直处于领先地位,这也不断加强了公司在该领域的竞争优势。在进一步推进人工智能领域的融合。在促进人工智能一体化(AI integration)方面,公司的开源应用 TensorFlow 已经为其他云平台以及研究社区利用公司资源提供了先例。同时,谷歌正通过自身优势,比如 TPU,充分利用开源世界为公司提供竞争优势,尽管其机器学习库是开源的。因为 DeepMind, 公司提升了端到端的强化能力;2015 年末击败职业围棋选手的 AlphaGo。将人工智能带到更为广泛的研究社区,同时也通过软硬件方面的自身优势进行创新,谷歌是最好例子。
● 亚马逊在做什么?
亚马逊正在公司内部和云端使用机器学习技术。2015 年 4 月,公司发布 Amazon ML,这款机器学习服务能够为对云数据的使用提供机器学习功能(无需之前的客户经验)。公司紧随谷歌的开源步伐,今年 5 月开源了 DSSTNE,一个针对推荐深度学习模型的的库。通过改善搜索、定制化产品推荐以及语音识别、增加有质量的产品评价,公司内部也在使用机器学习改善端到端的用户体验。
为什么重要?
借助 AWS,亚马逊成为全球最大的云服务商,可能也是最成熟的人工智能平台。借助 Amazon ML,公司成为作为服务的人工智能(AI-as-a-service)生态系统的领先者,将复杂的推理能力带到之前几乎没有机器学习经验的公司办公室当中。无需基于定制的复杂应用,AWS 用户就能使用机器学习训练模型,评估以及优化潜力。亚马逊推荐引擎使用了机器学习,在匹配用户意图以及可欲结果方面,具有竞争优势,也为公司创造了商机。公司正更加高效地利用收集到的数据合理化用户购物体验,也让电子商务体验更具互动性。随着 DSSTNE 的开源,亚马逊也与其他科技巨头一起,推动科技社区的人工智能进步。
● 苹果在做什么?
去年,苹果已经成为最活跃的人工智能公司收购商,比如 Vocal IQ, Perceptio, Emotient, Turi, 以及 Tuplejump。几乎同时收购了 Vocal IQ 和 Perceptio,公司请来了 Johnathan Cohen,当时还是英伟达 CUDA 库以及 GPU 加速软件项目的负责人。近期,据报道,公司请来 Ruslan Salakhutdinov 担任人工智能研究总监,这也标志着公司人工智能战略的转型。在此之前,公司最初人工智能成果之一是 Siri , 第一款嵌入移动技术的虚拟助手,2014 年,其语音识别技术被移入神经网络系统。
为什么重要?
直到去年,苹果已经取得相对专有的机器学习成就;2015 年 10 月,Bloomberg Businessweek 报道,在大众消费方面,苹果研究人员还没发过一篇与人工智能有关的论文。不过,这一策略转型多少与新的、与人工智能相关的雇佣与收购有关,科技记者 Steven Levy 在 Backchannel 的一篇报道强调公司已经在人工智能领域活跃一段时间了。特别是,公司收购 Turi 突出了公司要按规模推进非结构数据和推论,以及开放给更为广泛的人工智能研究社区。这次收购,配以基于收购公司技术的较小应用,反映出苹果致力于用这些新技术创新公司产品。
● 微软在做什么?
CEO Satya Nadella 表示,微软正在大众化人工智能(democratizing AI)。公司的人工智能和研究团队(总人数大约 5 千多),关注改变人类体验和与机器的互动。微软已经积极地将新的、融合人工智能的功能嵌入公司核心服务中,并在对话计算(比如 Cortana)、自然语言处理(SwfitKey)等方面取得进展。公司正进一步打造基于 GPU 和 FPGA 的云(Azure),在公司所谓的更高水平的人工智能服务,比如语音识别、图片识别以及自然语言处理当中,为机器学习提供动力和速度。
为什么重要?
两个单词:人工智能大众化(democratizing AI)。由于这个行业中的公司将研究计划甚至库开放给人工智能研究社区,微软发明了这一表述,用来解释许多领先的人工智能创新者的举动。去年,微软在人工智能领域颇为活跃,正式发布了产品以及研究计划,并宣布了一个新的人工智能和研究小组(2016 年 9 月下旬)。微软的 FPGA 表现突出了人工智能可以为普通商业或个人带来什么;不到十分之一秒,它就翻译完了整个维基百科(30 亿个单词和 500 万条条款)。而且伴随着虚拟助理 Cortana, Siri, Alexa 以及其他助理之间的竞争,进一步将人工智能研发融入广泛使用的产品中去,通过产品进步吸引客户似乎是必须的。
● Facebook 在做什么?
Facebook 人工智能研究部门(FAIR,2013 年)的策略是在更广泛的研究社区背景下研发技术。这个团队以推进无监督表征学习(比如,观察世界、而不是借助人类算法干预,借助对抗网络进行学习)的进步而为众人所知。应用机器学习部门(AML)在 FAIR 之后成立,聚焦将研究应用到公司产品中,时间限制为月或季度(而不是年)。公司正将机器学习功能应用到各种垂直领域中,比如面部识别,机器翻译以及深度文本(DeepText)语言或文本学习。
公司已经发布了多个无监督学习方面的研究成果,随着机器学习超越从「正确答案」中学习,开始聚焦独立的模式识别,无监督学习已经成为一个重要的焦点领域。无监督学习有望去除更多的、与大数据有关的人类成分,公司在 Yann Lecun 的带领下,正引领该领域的研究。今年五月,公司发布的 FBLearner FLow 合理化了端到端 UI(从研究到工作流程、实验管理以及视觉化和比较输出)。公司的人工智能项目和工作流程应用不限于 AML 成员,公司各部门领域都可以使用借鉴。这样一来,公司就可以利用研究部门之外所取得的人工智能进步。
● Salesforce 在做什么?
在 2014 年和 2015 年,Salesforce 开始解释自己的 Apex 开发平台如何可被用在 Salesforce1 云上完成机器学习任务。从此,该公司开始在人工智能上投入更多的资源,收购了多家人工智能公司,包括 Minhash、PredictionIO 和 MetaMind。在 9 月份,Salesforce 推出了 Einstein——一个面向多平台的基于人工智能的云计划。该计划专注于将人工智能融入销售云、市场云、服务云、社区云、IoT 云和 app 云。
为什么重要?
Salesforce Einstein 有潜力促进商业使用数据的方式。在销售云中,该公司希望让各个组织通过预测销售线索得分、洞见机会以及自动捕捉活动来优化销售机遇。市场和服务云将提供预测参与度得分,来分析消费者使用情况。还能提供预测客户,从而帮助定位市场,并基于趋势和用户历史通过自动案例分类更快解决消费者服务事件。Salesforce 用微妙的使用案例将机器学习带到云中,强调它对公司核心竞争力的影响。
● 英伟达在做什么?
英伟达已经从之前电子游戏 GPU 生产商转型为机器学习应用硬件厂商。2015 年年底,公司表示,较之使用传统 CPU,使用了 GPU 神经网络的训练速度提升了 10 到 20 倍。尽管英特尔重金投入的 FPGA(作为 GPU 的替代产品)加入硬件市场角逐,但是,GP