- 叫板英特尔,英伟达发布首个 CPU,集齐“三芯”!
- 来源:CSDN
作者 | 马超
出品 | CSDN(ID:CSDNnews)
昨日,在英伟达的新品发布会大会上,英伟达 CEO 黄仁勋如期拿出了首款 CPU 芯片 Grace,剑指 AI 云计算,其实笔者在前文《英特尔火线换帅、苹果搅动乾坤,国芯路在何方?》就曾指出,英伟达收购 ARM 预示着 N 厂必然进军 CPU 领域,在云计算市场有所作为。而本次发布会上除了 Grace 之外,英伟达还发布了 Transformers 框架——NVIDIA Megatron;药物研发加速库 Clara Discovery 模型等产品,也侧面印证了笔者的观点,英伟达正在软硬齐发为进军云数据中心领域铺平道路。
英伟达 CEO 黄仁勋,来源:NVIDIA GTC
无独有偶,上周英特尔也发布了 10nm 的至强三代处理器,在新任 CEO 帕特.基辛格的带领下,英特尔也要加强自身在云计算领域的优势,不过在这场英特尔对阵英伟达的“双英”大战中,双方的策略明显不同,英特尔注重于全面,除了 AI 以外还在安全、虚拟化及调度能力以及存储性能等等方面全线开花;但是英伟达则在专注于 AI 云及低功耗超级计算机几个重要领域进行定点突破。
虽然目前还无法预测“双英”大战的结局,不过 AI 云计算的发展空间还是有目共睹的,从最新的 AI 发展趋势来看,最新的人工智能模型对于算力的要求往往都是非常高,比如可以自动写代码的 GPT-3 其参数规模突破了 1000 亿,而 GPT-3 的变种,可以将文字描述转化为图像的跨模态生成模型 DALL.E,其模型参数数量更是达到了惊人的 1500 亿,不少 AI 方面的科学家指出,越大的模型往往表现更好,扩大规模可能仍然是实现更好性能的方式。用黄仁勋在发布会上的话来说“三年间大规模预训练模型的参数量增加了 3000 倍。我们估计在 2023 年会出现 100 万亿参数的模型。”目前资金实力一般的创业公司将越来越难以通过自身的算力去训练最新、最好的 AI 模型。
从另一个角度讲,AI 模型越来越大的趋势也推进了 AI 与云的结合,只有充分发挥云计算降本增效的特性,才能降低门槛,促进 AI 行业创新性发展。也只有做好 AI 云,才能让 AI 充分发挥威力,体现价值。我们看到本次英伟达围绕着 AI 云计算,在 CPU、智能驾驶及配套软件方面同都有不少的进展,接下来,本文将为大家逐一进行解读。
Grace 打破内存与显存之间的墙
由于 ARM 使用 RISC 风格的精简指令集, ARM 核心在指令预测等方面同天然比 X86 更有优势,能耗也比 X86 更低。当然这些都是 ARM 相对于 X86 的传统优势,本次 Grace 最大的创新点在于把 CPU 与 GPU 之间的通信速度提升了近 10 倍。根据黄仁勋的说法,“这是一万名工程人员历经几年的研发成果,旨在满足当前世界最先进应用程序的计算需求,其具备的计算性能和吞吐速率是以往任何架构所无法比拟的。”
CPU 和 GPU 的通信速度的重要性,可以用苹果 M1 的例子来加以说明,我们知道苹果 M1 显卡与内存加在一起只有 16 个 G,对比上一代 Mac PRO 内存128G,光是显存都有 16G,不过搭载 M1 的入门版 Mac 在进行图像处理等需要 CPU 与 GPU 进行协同的运算任务时,至少比上一代顶配的 Mac 性能高出近一倍。其中的秘决就是将内存与显卡进行统一管理,从而大大提高了 CPU 与 GPU 的通信效率。
当然苹果将内存与显存混用的做法,在云计算这种多租户共存的场景下并不太适用,但是现有 GPU 与 CPU 共享内存的做法效率确实不佳,在共享内存的方案下,CPU 和 GPU 必须轮流访问内存,这就意味着他们要争夺数据总线的使用权。因此 GPU 和 CPU 不得不轮流使用一个狭窄的通信管道来做数据交换。而英伟达的 Grace 在这方面做出了突破性的进展。
类似于 DMA 控制器在磁盘与内存之间搭建了一条快速通道一样,Grace 体系中 GPU 核心与 CPU 核心之间的通信不需要 CPU 的调度,也不需要占用数据总线的带宽,之前 CPU 必须将数据从其内存的区域复制到 GPU 使用的区域,而在 Grace 的加持下,CPU 只需要告诉GPU在内存的某位置有 30MB 的向量数据,然后就可以去做其它事了,GPU 则可以通过 Grace 复制通道迅速开始计算任务。
可以说 Grace 的快速能道基本还在笔者的射程范围之内,而英伟达马上要推出的 L5 级别自动驾驶芯片,就只能令人仰望了。
英伟达自动驾驶Orin-剑指L5的雄伟蓝图
钢铁侠马斯克上周刚刚宣布特斯拉全新的自动驾驶系统 FSD Beta9.0 已经接近完成,有消息称 FSD 的自动驾驶能力要达到 L5 级,这真是一个震惊世界的消息,因为目前特斯拉的 AutoPilot 还没有达到 L3 的程度。
在业界公认的自动驾驶 L 级分类标准中,依据驾驶任务中 AI 与人类的角色分配以及有无设计运行条件限制等因素,将驾驶自动化分成 0 至 5 级。其中0级为应急辅助级在应急情况下帮助驾驶员进行辅助操作,在 0 级至 2 级自动驾驶中,监测路况并做出反应的任务都由驾驶员和系统共同完成,并需要驾驶员接管动态驾驶任务;3 级为有条件自动驾驶,4 级高度自动驾驶仅在特定条件下需要驾驶员参与;5 级完全自动驾驶的驾驶自动化系统在其设计运行条件内,能够持续地执行全部动态驾驶任务和执行动态驾驶任务接管,驾驶员可以完全退化为乘客的角色。
L5 级别的自动驾驶看似不是从0到1的开创性工作,但从实践上看,想真正实现全天候的自动驾驶难度极大,从谷歌的公开资料中我们可以知道一台自动驾驶测试车辆每天至少会产生10T的数据量,平均每分钟都要处理几百M的数据,而且自动驾驶的决策延时必须要控制得极低,汽车以80公里/小时的速度运行时其机械制动距离就接近30米,想保证安全留给自动驾驶的反应时间通常只有0.1秒,而且作何一点决策上的失误都可能造成极其严重的后果。
简单说 L5 级别的自动驾驶是一个每秒数据处理能力 1 个 G,数据处理延时不能超过0.1s,而且可靠性还不能低于 99.999999% 的极精密系统,再考虑其 AI 模型的上百亿个参数,这个系统对于算力的要求是十分惊人的,不过更惊人的是黄仁勋表示英伟达就是要干这个。
根据计划,英伟达将于 2022 年投产支持 L5 自动驾驶的汽车计算系统级芯片NVIDIA DRIVE Orin,与此同时英伟达还在发布会上展示了搭载 3 个 Orin 核心的 Hyperion 8 自动驾驶汽车平台,据称 Hyperion 8 是业内算力最强的自动驾驶汽车模板,当然这款芯片目前还没有量产,也没有具体细节的发布,因此笔者这里只能先对英伟达表示 Respect。
AI 软件的背后:感知智能向认知智能的演进
从实现快速计算、记忆与存储的“计算智能”,到识别处理语音、图像、视频的“感知智能”,再到实现思考、理解、推理和解释的“认知智能”,人工智能发展的终极目标是赋予机器人类的智慧。近年来,语音识别、人脸识别等“感知智能”技术已相对成熟,甚至在许多领域已经达到或超出了人类的水平。但这些技术仅在工具、模型层面实现了突破,对诸如需要专家知识、逻辑推理或者领域迁移等需要去思考、规划、联想、创作的复杂任务时,表现不佳。不过随着大数据、云计算、深度学习等技术的蓬勃发展,探索在如何保持大数据智能优势的同时,赋予机器常识和因果逻辑推理能力,实现“认知智能”,成为当下人工智能研究的核心。
从人机协作的角度上看,人类在处理抽象化、情绪化、非逻辑性的问题上有着不可逾越的优势,而大量重复、海量计算和海量记忆则是人工智能的强项。而AI目前一个重要的发展方向就是让人机两者的强项联合,取长补短,比如金融行业的呼叫中心需要分析客户的语气,在必要时引入人工服务;出行类 APP 遇到客户说出某些关键词时,则需要立刻与 110 人工报警台联动报警。这样的大趋势下也就更需要 AI 由单纯的感知世界向认知世界去进行升级。我们看到阿里、腾讯的论文,近年来在 KDD 及 CVPR 这样的 AI 顶会上获得不俗的成绩,多半也是源于对于认知智能的突破性贡献,而英伟达本次推出的与 AI 系统对应的配套软件中也顺应了这一潮流。
本次发布的 Transformers 训练框架 NVIDIA Megatron、Morpheus 数据中心安全平台、新一代人工智能对话机器人 NVIDIA Jarvis、推荐系统是 NVIDIA Merlin、隐私保护加强的 AI 辅助套件 NVIDIA TAO,从本质上讲都是认知智能的一种体现。
纵观整场发布会,英伟达真可谓是 AI 与智能驾驶齐飞,CPU 与 GPU 跨界。新时代的计算机需要新的芯片、新的系统架构、新的网络、新的软件和工具。英伟达全新的数据中心路线图已包括 CPU、GPU 和 DPU 三类芯片,将英伟达也将被重新定义为三芯片公司。
CSDN 问答上线《冲榜分奖金》活动!每周采纳榜前五名的答主可获得现金和会员卡,剩余用户会随机抽取送出幸运礼物!后台回复关键词“冲榜”可获取当前排名和活动规则
☞从科大讯飞跳槽到腾讯被判赔 1200 万;华为多款机型将取消充电器;苹果春季发布会定档4月21日|极客头条
☞“小米都造车了,为什么华为不造?”华为轮值董事长亲自回应
☞力排众议,自由软件之父 RMS 正式回归 FSF!
科技
-
- FBI开展行动,从美国计算机中删除恶意软件
- E安全4月12日讯 德克萨斯州的一家法院已授权FBI修复运行某些版本的Microsoft Exchange Server软件。该软件是由美国数百台被黑客入侵的服务器中的恶意软件之一。德克萨斯州的一家法院已授权FBI修复运行某些版本...
- E安全
-
- [观察]戴尔易安信ECS:领跑企业级对象存储,背后的底蕴与底气
- 申耀的科技观察读懂科技,赢取未来!毫无疑问,今天数据正快速融入到人们的日常生活中,这让各行各业的数据都出现了“井喷式”的爆发增长。但是,随着企业对数据的理解和应用越来越深刻,会发现基于数据的创新依...
- 申耀的科技观察
-
- 这家安全公司帮助FBI“破解”了iPhone
- 2016年,苹果公司拒绝为FBI解锁圣贝纳迪诺枪击案中恐怖分子使用的iPhone,双方一度僵持不下长达数月之久,最终FBI宣布花费重金请到一家黑客公司解锁了这部iPhone,从而结束了美国政府与科技巨头苹果之间的重大对...
- 安全牛
-
- 仅需3199!戴尔官网Latitude企业级实力商务本惊喜放\"价\",不要错过
- 初创小企业不想花太多钱在设备上?又不想买到质量差售后无的笔记本、台式机?来戴尔小企业官网商城超多高能电脑正值春季优惠返修率超低稳定安全用得住!企业级客户专享福利小企业客户:百人以下公司机构1.关注公...
- iTools
-
- IDM教程:无广告、不弹窗、没有内置浏览器的下载神器
- Internet Download Manager (IDM) 是一款非常知名的 Windows 平台下载工具,曾斩获国内外多项大奖。相比其它同类工具令人眼花缭乱的界面和功能,IDM 界面无广告,不弹窗,没有内置浏览器,专注于下载可将下载速
- 同步推
-
- 人事:中国电信集团这个部门一把手调整!
- 运营商情报获悉,原黑龙江电信总经理王峰任职中国电信集团客户服务部总经理。综合:运营商情报监制:肖斌 张泉 刘立红编辑:姜涵 徐梅责编:赵爽校对:马晓蒙运营商情报
- 运营商情报
-
- 共同出资6000万,洲明科技与京东方成立合资公司
- 昨(14)日晚间,洲明科技发布公告宣布子公司与京东方全资子公司共同出资成立合资公司“深圳市京东方智慧光显科技有限公司”(暂定名),标志着双方之间的战略合作更进了一步。2020年12月初,洲明与京东方宣布达...
- 新型显示资讯
-
- 武警贵阳支队南明中队通过智慧党建VR体验、党史故事分享会等方式深入开展党史学习教
- 连日来,武警贵阳支队南明中队通过智慧党建VR体验、党史故事分享会等方式深入开展党史学习教育。通过党史学习,进一步激发广大官兵学史、知史、悟史的积极性和主动性,让大家在学思践悟中传承红色基因、强化...
- 贵阳晚报
-
- [报告]2021中国车联网行业发展趋势研究(附54页PDF文件下载)
- 车联网产业是汽车、电子、信息通信、道路交通运输等行业深度融合的新型产业形态。在经历车载信息服务发展阶段后,2021年,中国车联网产业渐入佳境,数字化商业运营一触即发,开启全面迈入了汽车智能网联化发展的...
- 汽车之地
-
- 飞桨分布式训练又推新品,4D混合并行可训千亿级AI模型
- 机器之心发布机器之心编辑部最近,飞桨提出了4D混合并行策略,以训练千亿级稠密参数模型。近几年,深度学习领域的开发者们对模型效果的追求愈演愈烈,各大榜单纪录不断刷新,而这个现象的背后都有着 “大规模训...
- 机器之心
-
- 企业争先上云时代,智能云网凭啥“受宠”?华为赵志鹏详解
- “合抱之木,生于毫末;九层之台,起于累土;千里之行,始于足下”这句出自老子《道德经》的古语,早就揭示做任何事,都须从基础开始。数字化转型已成全球各国共识,上云则是金融等各行业企业数字化转型的关键路...
- 海峰看科技
-
- 叫板英特尔,英伟达发布首个 CPU,集齐“三芯”!
- 作者 | 马超出品 | CSDN(ID:CSDNnews) 昨日,在英伟达的新品发布会大会上,英伟达 CEO 黄仁勋如期拿出了首款 CPU 芯片 Grace,剑指 AI 云计算,其实笔者在前文《英特尔火线换帅、苹果搅动乾坤,国芯路在何方...
- CSDN
-
- 2021数博会工业APP 融合创新大赛开始报名
- 本报讯 4月13日,记者从数博会工业APP融合创新大赛组委会获悉,2021数博会工业APP融合创新大赛报名通道已经正式开启,赛期将从4月初一直持续到数博会结束。 作为中国国际大数据产业博览会重要赛事之一,...
- 贵阳晚报
-
- 数字化需要授之以渔,Azure 动手实验营在等你
- (本文阅读时间:5分钟)20年前,尼古拉·尼葛洛庞帝在《数字化生存》中,对数字化时代就有了这样的预言:“我们无法否定数字化时代的存在,也无法阻止数字化时代的前进,就像我们无法对抗大自然的力量一样”。...
- 微软科技
-
- 中国联通助力乡村振兴开新局!
- ▌2021年中央一号文件将“全面推进乡村振兴、加快农业农村现代化”作为主题,这是“三农”工作重心的历史性转移。打赢脱贫攻坚战、全面建成小康社会后,要在巩固拓展脱贫攻坚成果的基础上,做好乡村振兴这篇大文...
- 中国联通微学堂