时间:2018-10-10编辑:浮泊凉
2018年上半年,由外媒 The Information 传言,在华为高层之间称为“D 计划”,代号为“达芬奇计划”(Project Da Vinci)的 AI 计划正在华为内部如火如荼地进行。终于在 10 月 10 号的华为全连接大会上,华为真正的 AI 战略揭开面纱。
相较于其他同样具有国际级巨头份量的中国科技企业,例如阿里巴巴、百度、腾讯等等,华为应该是最晚公开宣示全面拥抱 AI、宣示全面 AI 发展战略的公司,而值得注意的是,相较于其他公司从概念拼凑开始,逐步演化成一套自有 AI 发展战略,一向是不蹭风口热点的华为,则是谋定而后动,要的不是抢先卡位,而是后发制人。
以 10 日的发布会内容来看,华为一出手推出的两颗“全球最强”AI 芯片,以及具有目前全球最大算力的分布式计算系统,华为的动作不但够大,也够震撼。
华为轮值董事长徐直军
值得注意的是,华为是一家保守谨慎的公司,因为他们的产品技术战略不是只为了快速汰换的消费性产品,而会直接牵动全球超过数百个强调高度可扩充、可永续、可兼容的网络基础建设。但在 10 日华为正式对外宣示将全面拥抱 AI 之后,这代表的是华为战略引擎全速转向正式启动。
作为华为端与云 AI 计算大计划的第二步骤,华为想要把 AI 在全部的产品和服务散开来,成为共通的服务基础,华为轮值董事长徐直军在开场演说中,也表达了不只要万物互联,更要把智能带入整个互联的大环境,在这场连接大会中,带领听者、业界,看见华为所规划的未来景象。
在早上的演讲中,徐直军提到 AI 未来将发生的十大变化,分别是训练时间的缩短、算力的可获得性更高、AI 无处不在并能够在任何场景中尊重和保护用户隐私、数据和能耗更加高效、更高度的自动化/半自动化、AI 真正达到工业级水平、具备实时闭环系统、与其他技术集成程度更高、具备一站式平台的基本技能、数据科学家和其他专业人士协同合作。
而华为的 AI 战略也在会议上得到全面曝光,即支持 AI 基础研究、打造面向边缘和端的全栈解决方案、投资开放生态和人才培养、把 AI 的思维和技术引入华为所有产品和服务、应用 AI 优化内部管理。
其中,徐直军重点提到针对打造面向边缘和端的全栈全场景解决方案,该方案于去年就已预告,直到这次的全连接大会终于得以曝光。
据介绍,所谓的全场景是指包括公有云、私有云、边缘计算、物联网的行业终端以及消费类终端的部署产品,即“让 AI 无处不在,无所不及”,而全栈即包括芯片、芯片服务,还有硬件,以及训练和推理的框架和应用在内的全堆栈解决方案。
华为的全栈方案具体包括:
Ascend: 基于统一、可扩展架构的系列化 AI IP 和 芯片,包括 Max,Mini,Lite,Tiny 和 Nano 等五个系列。包括我们今天发布的华为昇腾 910(Ascend 910),是目前全球已发布的单芯片计算密度最大的 AI 芯片,还有 Ascend 310,是目前面向计算场景最强算力的 AI SoC。CANN: 芯片算子库和高度自动化算子开发工具MindSpore,支持端、边、云独立的和协同的统一训练和推理框架应用使能:提供全流程服务(ModelArts), 分层 API 和预集成方案
2018 年 4 月,华为发布了面向智能终端的人工智能引擎 HiAI;2017 年 9 月,华为发布了面向企业、政府的人工智能服务平台华为云 EI。而华为今天发布的全栈全场景解决方案,则是对华为云 EI 和 HiAI 的强有力支撑。“基于这个解决方案, 华为云 EI 能为企业、政府提供全栈人工智能解决方案;HiAI 能为智能终端提供全栈解决方案,且 HiAI service 是基于华为云 EI 部署的”,徐直军说。
外界一直在传华为在开发人工智能芯片,而在发布会上,徐直军告诉大家,这是事实,并宣布两颗 AI 芯片。
徐直军发布的第一颗 AI 芯片是昇腾 910,其算力可以达到 256TFOPS,是目前全球已发布的单芯片计算密度最大的 AI 芯片。据徐直军介绍,910 的计算力是最接近的 NV 的 V100 还要高出一倍。这颗芯片将在 2019 年二季度正式上市。
同时,华为基于 910 们还在构建一个昇腾 plus,它是迄今为止全球最大的分布式训练系统。徐直军介绍,通过把 1024 个 910 连接起来,构建一个 AI 计算机群,可提供高大 256 个 P 超高 AI 计算能力,实现人们过去从未想过的速度训练你的模型,不管多复杂的模型。
“这也是在十大改变里面,我们期望在几分钟甚至几秒钟能够实现训练的第一步。这个系统会在华为云上推出。上市时间也是明年二季度”,徐直军说。而华为发布的第二部芯片,就是昇腾 310。这个 AI SoC 属于昇腾的迷你系列,这颗芯片的最大功耗仅 8 瓦的情况下,整数精度的算力达到 16TFLOPS,同时 310 还集成了 16 个通道的高全高清视频解码器,是目前面向边缘计算产品最强算力的 AI 芯片,也可以用于数据中心的训练和推理。
不论在计算视觉、语音、决策,华为过去几年采用大量投资研发的方式,快速补齐所需要的技术,同时打造各种涵盖全场景的解决方案,提供业界更简单易用,且高效率的 AI 平台,并且与业界、学界合作,不仅推动开发环境与应用服务的完备,也同时要培养 AI 所需要的人才。
应用为血肉,算力则成为骨架,这些元素建构出华为未来的 AI 布局,不是针对单一面向的应用,而是要扩及所有可能与人类生活息息相关的信息、重复事物的自动化处理,为此,华为推出了全栈全场景的 AI 技术和服务。
为了达到这样的目标,华为这次把华为旗下的 HiAI 生态与去年发布的 EI 生态进行整合,并通过全新的昇腾家族芯片,打造从算力、框架到服务的完整 AI 系统。
华为可以说是最早投入终端 AI 的厂商之一,由于华为本身经营手机业务,不但已经是全中国最大的智能手机制造商,更在 2018 年挤下苹果成为全球第二大手机品牌,手中掌握了极为庞大的使用者基础,如果以智能手机的生命周期来推论,目前全中国可能至少有 3~4 亿个消费者手中有华为的智能手机产品,若以全球范围来看,仍持续被使用的华为智能手机可能上看 5 亿支。
而我们都知道,手机是与个人生活最为息息相关的终端,举凡个人消费、社交、出行、甚至运动习惯与身体状况追踪,这些数据都集中在手机之中,而手中掌握这些数据的华为,自然也有了最好的基础来推动其云端 AI 的策略布局。
当然,就算手机本身可以收集这些各种与使用者息息相关的数据,但不代表华为可以直接取用,毕竟隐私还是全球范围消费者最关心的事情,如果被发现华为擅自取用手机客户的个人信息,那么将可能对华为的手机事业产生致命影响。
那么,华为掌握这么庞大的数据,却不能擅自乱动,就好比和尚怀中躺了美女,却必须坐怀不乱,正常人可能早就受不了,但华为却不得不冷静自持。
唯一的方法,就是想办法开通更多云端服务,让消费者自愿的奉上更多宝贵的信息。
其实类似的事情在业界早有案例,比如说 Amazon,众所周知,它是全球最大的网路购物平台之一,但很吊诡的是,Amazon 在零售和网路购物业务方面一直都是亏损的状况,其利润率更是仅有悲惨的 1%,那是什么支持着 Amazon 持续投入在零售事业的持续烧钱?答案就是依靠零售事业收集的数据所建立的广告与云端服务与其带来的营收。
如果没有零售业务的烧钱,那么 Amazon 就不可能建立这么成功的广告与云端服务,而这也是其零售事业虽持续亏损,Amazon 却不像其他公司般会断然舍弃亏钱事业的根本原因。
在某种程度上,华为与 Amazon 有着相当类似的状况,其实华为的手机事业并不怎么赚钱,其获利表现还远远落后于三星,更不用说苹果,对华为这么一家大公司而言,手机并不是个好做的生意,但华为和小米其实英雄所见略同,那就是他们看的不只是手机本身的获利,而是整个生态环节所能带来的利益。不过小米和华为走上了不同的路,小米成了杂货店,手机变成中控,背后虽然也有一个贯串的云服务,但比较基础。而华为想做的,是更深层的 AI 学习,并通过现有的数据库模型建立成熟的云企业服务,就如 Amazon 的云计算服务一般。
早在 2017 年底,华为就曾公布其 EI(Enterprise Intelligence) 企业智能服务计划,华为 EI 就是要把华为创办人任正非所提到华为多年来在内部通过 AI 解决华为公司内部生产、物流、供应链、终端等领域问题,所积累的一些相关的能力、知识和方法分享给更多企业,帮助企业实现智能化。
华为投入 AI 研发的初衷与互联网巨头有很大不同。它不是纯粹的探讨技术“无人区”,而首先是解决内部实际问题,与实业紧密结合,这使得华为切入 AI 的时间线非常早,涉及 AI 业务的团队非常多,从事 AI 研发的人力也非常多,他们分头为各个业务部门服务,比如手机、芯片、媒体、操作系统等等,但应用最多的却是任正非提到的两大条线:解决华为内部运作的自动化问题和华为的业务服务问题,比如,华为供应链的智能装箱、物流和路径规划,以及报关、发票、风控、营销、网络安全等场景。
这点其实与 Amazon 也有异曲同工之妙,原本 Amazon 的 AWS 服务也是仅供内部使用,但 Amazon 觉得,如果能够很好的解决自家的问题,那么应该也能用来解决客户的问题,也因此,AWS 开放对外提供服务之后,一炮而红,成为 Amazon 的金鸡母。
华为 EI 所推出的三类企业智能云服务包括:EI 基础平台服务,比如深度学习服务、图引擎服务等;通用服务,如大数据、视觉认知、语音语义、人脸识别、图像识别和内容检测等;行业场景解决方案,比如智能税务、智能制造、智能电力、智能交通、智能金融、智能零售等 30 个企业智能服务。
从个别项目中可以看出,其实很多都是从其终端 AI 延伸出来的数据模型与应用,我们可以说,华为在终端与云端 AI 都是走同一套体系下的开发逻辑,而终端 AI 也就成为其云端 AI 的血肉,配合华为自有的企业灵魂,推动更深层、更贴合实际市场需求的服务。
华为早在推出具备硬件功能的 AI 服务之前,就已经通过既有的计算硬件提供相当丰富的 AI 功能,比如说麒麟 960 并不具备硬件 AI 单元,但已经整合相当多的智能语音与图像识别以及照相强化功能,而后来的麒麟 970,则是在既有框架之下,提供了更强大的硬件加速能力,从而能够负担更复杂的 AI 计算内涵,提供消费者更丰富、更多元的 AI 应用。
而到最新的麒麟 980,则是在之前的基础上又更上一层楼,不只是 AI 软件服务,甚至也开始设计自有的软件开放框架,意图要引进更多元的 AI 算法与应用,成为业界主流的 AI 执行平台。
相同的路径也出现在华为的云端服务上。过去华为的云端服务主要还是基于如 NVIDIA 的外来 AI 计算硬件,而原本面对的应用情境是企业内部使用的云端服务,其实因为仅针对自家单一公司,算量有限,算法模型也相对单纯,仅依靠 NVIDIA 提供的标准框架其实还足以担负日常任务。
但当华为决定要往通用 AI 计算平台发展,并对外提供服务后,华为发觉,如果想要掌控生态的话语权,那么就得连硬件都自有,这样才能更好的匹配算法、框架、服务,并提供更高的效率。
NVIDIA 的架构并不差,但以架构本身而言,其效率并不够高,毕竟其架构原本是针对绘图计算而来,而非 AI 计算,之所以能够打下 AI 计算的江山,主要还是依靠生态的掌握以及开发环境的完备,再加上 NVIDIA 与学校单位合作,推动 AI 基础教育的时间非常早,早培养出为数庞大的死忠开发者,这些都帮助 NVIDIA 把他们效率并不是那么高的架构发挥到淋漓尽致,当业界觉得这个架构、生态够好用,支持框架与应用广,导入成本低,算力也足够,其实效率部分是被认为可以稍微牺牲的。
但是对于华为这种处女座的追求完美个性而言,肯定不能忍受计算生态中有可能的缺陷存在,即便这缺陷只是单纯的效率不够高。
华为也延续其在终端 AI 的执著理念,不只是使用标准架构,而是经过大幅调整优化后,基本已经成为专属华为才有办法发挥的硬件设计,而这也是华为之所以一直强调虽然原始架构虽是外来的,但基本上已经与自研没有太大差异,性能表现也和标准架构天差地远。
达芬奇计划包含两大部分:一,将 AI 引入华为的所有产品和服务当中,包括电信基站、云数据中心、智能手机、监控摄像头等;二,为数据中心开发新的 AI 芯片,使得语音识别、图像识别等应用可以在云端使用。
达芬奇计划的第一部分内容也是很多厂商正在努力的方向。但为数据中心开发 AI 芯片,本质上是在挑战英伟达的地位。目前,无论是国外的 AWS、微软云、谷歌云还是国内的阿里云、腾讯云、华为云都需要使用英伟达的 GPU,并且包括华为云在内的云服务厂商都使用英伟达的 GPU 为其云服务添加 AI 功能。
而此次在华为连接大会中也担任主要演讲嘉宾的微软负责人工智能战略和研究的微软执行副总裁洪小文,据传其所代表的微软已经和华为在云端计算方面合作相当长的一段时间,未来微软在中国的云端服务基础建设可能将交由华为负责,华为的角色可能就会从原本的云端服务供应商、算力供应商,转而成为服务代管业者,而华为自身丰富的使用者数据模型就可能成为说服这些企业客户采用其服务的最佳诱因。
而华为在计算芯片的架构选择方面,其实可能性很多,从自研,到使用 Arm 或者是寒武纪的云端 AI 计算方案都是有可能的作法,目前来看,华为与寒武纪的合作关系最紧密,而寒武纪的 IP 也提供相当深度的自订修改弹性,这对于华为执著于极致优化的作法其实可不谋而合,毕竟在终端 AI 部分已经达成不错的效果。
虽然在 AI 云服务领域,华为只是个后来者,要如何能够在竞争激烈的 AI 领域站稳脚跟?华为可能会与其终端 AI 平台布局走类似的方向,那就是面向开发者发布全套的人工智能软件、硬件开发平台。在 AI 芯片之外,深度学习框架与开发生态的完备,将成为华为区别于其他 AI 厂商的杀手锏。
而通过终端、云端,到自研计算 AI 硬件的布局,华为也一跃成为具备完整生态优势的云计算服务厂商,且由于具备从芯片设计到框架、算法的高度匹配,其计算方面的效率表现也能达到不弱于竞争对手的表现。而这可能也是微软之所以选择与华为合作的最大原因之一。
借由过去数年在终端与云端 AI 服务的耕耘,华为在连接大会中展现出来的计算服务生态已经达到业界一流水准,当然,未来在客户拓展方面才是真正的挑战,若能获得市场认同,那么华为的企业定位又会增加云计算服务商的角色,达到真正的多元发展,而既有的云服务供应商,也就是 BAT 三家大厂,恐怕会迎来市场格局的改变,也就是如果掌握不了自有计算架构和生态,恐怕就会被踢出前三大云服务厂商的行列。