99美元：黄仁勋发布人工智能计算机，GTC十周年没有核弹

生活2019-03-19 18:00Author: 新智元

Summary编者按：本文来自微信公众号“新智元”（ID：AI_era），作者克雷格、金磊、小芹。

01.大秀英伟达显卡特效，光线追踪技术惊艳四射
黄仁勋的整场演讲分三个章节：计算机图形、AI和HPC、机器人。
在第一章之前，黄仁勋首先推出CUDA-X AI，这是加速数据科学的唯一端到端平台。
CUDA-X AI能够将机器学习和数据科学工作负载加速多达50倍，由十几个专用加速库组成。
这些库包括用于加速深度学习的cuDNN、用于加速数据科学工作流和机器学习算法的cuML、用于优化经过训练的推理模型的TensorR、用于访问数据科学API的cuDF、用于在graph上执行高性能分析的cuGraph，以及其他13个库。
此外，软件加速库集成到所有深度学习框架中，包括TensorFlow，PyTorch和MXNet。
接下来正式进入第一章计算机图形主题，黄仁勋不出所料的对英伟达的显卡特效又大秀了一番。
现在实时播放Unity上运行的部分视频，实时并不能提供足够的空间分辨率。Unity的实验包将于4月4日推出。
Unity增加了对Nvidia光线跟踪技术的预览支持，以推动游戏的真实性。
下图的车灯照片，左右两张几乎一模一样，你觉得哪张是假的呢？
答案是：右边的车灯是假的。
黄仁勋说，这种逼真效果得益于英伟达图灵RTX架构，画面是实时渲染的。
Epic Games已经宣布了Unreal Engine 4.22对英伟达RTX光线追踪的支持，Unity也只是时间问题，但现在这项技术正式进入了Unity的高清渲染管道(HDRP)预览版。
这项技术的重点在于游戏如何更逼真地呈现照明，显示光线如何与大气及其撞击物体的相互作用。这种技术已经在其他地方使用过，但所有这些都可能是资源密集型的，这使得过去几年的进步将其作为一个实时系统如此引人瞩目。

02.专注AI和HPC，收购Mellanox对抗英特尔
在演讲了一个小时之后，黄仁勋终于开讲第二章：AI和HPC。这部分主要由DGX和HGX组成。
数据科学是当今计算机科学领域不断增长的领域，所有关于从数据中学习并从中做出预测的方法形成了AI。英伟达对待AI有了新的态度和行为：重新梳理数据科学领域和所有机器学习工具，从Hadoop到Spart再到TensorFlow。
英伟达拥有实现AI所有步骤和工具的库，即黄仁勋之前强调的CUDA-X AI库，而黄仁勋也在思考，如何把当前的这么庞大的生态系统以及硬件和软件结合在一起。做法有二：
目前，谷歌云和微软云也添到RAPIDS中，TensorRT也已集成到Microsoft Onyx中。
除了集成和结合之外，英伟达还推出一款新的AI工具包，称之为Clara，其核心是一系列预先训练过的模型。
Clara是一个开放、可扩展的计算平台，包含13个最先进的分类和分割AI的工具包，以及为放射科医生构建的软件工具，能够让开发人员将医疗成像应用程序构建和部署到混合（嵌入式、内部部署或云）计算环境中，以创建智能仪器和自动化医疗保健工作流程。
有了这些工具，英伟达在数据科学领域不断突破。黄仁勋说，仅去年一年，英伟达的深度学习研究所通过各种形式培训了10万名数据科学家，基于此，英伟达决定为数据科学家提供一个定制的工作站。
这个工作站核心是GPU和CUDA-X AI库，主打高性能计算和高速I/O。
黄仁勋认为，数据科学是新的HPC，超算和超大规模集群的区别在于，超算实际上做了很少的任务，而超大规模集群都是关于容量的，但是做了很多小工作。两者需要不同的系统/集群架构。
而数据科学处于两者中间位置，数据科学的任务比超大规模集群的任务更重，但比更少；比超级计算机更广泛，这就是英伟达的DGX-2设备现在适用的地方。
在发布会现场，不久前被英伟达以69亿美元收购的Mellanox公司CEO也上台，阐述为什么Mellanox愿意卖身英伟达，以及他们如何看待网络成为数据中心计算基础设施的一部分。
英伟达的计算平台和Mellanox的互联网连接了全球250多台TOP500超级计算机，并为每个主要的云服务提供商和计算机制造商提供服务。而随着摩尔定律的结束，CPU性能的提升正在放缓，这导致大家会采用英伟达GPU和Mellanox智能网络解决方案加速计算。
满足这种需求将需要整体架构，通过智能网络结构连接大量快速计算节点，形成一个巨大的数据中心规模的计算引擎。
两个小巨人联手，英特尔在HPC领域的日子会难过吗？

03.边缘计算产品Jetson Nano：99美元的人工智能计算机
黄仁勋演讲的第三章：机器人。为什么要为机器人提供边缘算力？黄仁勋说，复杂的人工智能通常不适合自制设备，因为微型计算机很少能处理除了基本功能之外的东西。
因此，英伟达推出了入门级人工智能计算机Jetson Nano。
英伟达声称，Nano的128核基于maxwell的GPU和四核ARM A57处理器可以为神经网络、高分辨率传感器和其他机器人功能提供472GFLOPS的处理能力，同时只消耗很少的5W。
Jetson Nano关键特性：
该套件可以直接运行Linux，并支持大量的AI框架（当然包括NVIDIA自己的框架）。它配备了4GB的RAM，千兆以太网以及相机和其他附件所需的I/O。
虽然Nano的功能远不如高端的Jetson强大，但目前个人版售价仅为99美元，面向企业的“production-ready”版售价为129美元。

04.未来的测试舰队是虚拟的
黄仁勋在GTC大会上推出了NVIDIA DRIVE Constellation仿真平台。
DRIVE Constellation是一个数据中心解决方案，包括两个并排服务器：
DRIVE AGX Pegasus接收传感器数据、做出决定，然后将车辆控制命令发送回模拟器。这种闭环过程可实现位精确，定时精确的硬件在环测试。
这个验证过程是实时运行的，可以按比例执行，多个单元并行运行各种测试。
有了这样的效率水平，DRIVE Constellation可以实现大量的驾驶体验——3000个单元每年可以行驶超过10亿英里。更重要的是，DRIVE Constellation中的每一英里都包含有趣的事件——包括罕见或危险的场景。