当人工智能遇上超级计算机 - 精盈集团|精盈国际|精盈电商|精盈人才|科技成果|包装研究院|国际技术转移平台

当人工智能遇上超级计算机

由于人工智能推理或训练一般要用到单精度甚至半精度的数值计算能力、整型计算，多数超级计算机并不具备这些计算能力，因此去年便开始出现了聚焦于解决人工智能算力需求的人工智能超级计算机，它作为一种专用算力，被应用于人工智能推理或训练等领域。

　　◎记者吴纯新通讯员涂兴佩

　　打开手机，半个月内的天气状况一目了然；出门在外，地图导航给出最优路线……这些“未卜先知”从何而来？答案是计算。

　　如今，算力作为数字经济的第一引擎，正成为科技巨头们争相进军的主阵地。

　　日前，英伟达宣布与微软联手开发人工智能超级计算机，依托微软Azure云运行，通过数以万计的图形处理单元(GPU)、中央处理器(CPU)处理云中的密集人工智能计算工作。

　　人工智能遇见超级计算机，将会碰撞出怎样的火花，又将带来哪些挑战和机遇？

　　对基础软件和通信能力要求极高

　　“实际上，人工智能超级计算机去年就出现了，其核心是解决大规模密集人工智能训练和推理等的计算问题。”武汉人工智能研究院院长王金桥说。

　　传统超级计算机相对一般计算机而言，就是一种计算能力更强、通信速度更快、存储容量更大、功能更完善的计算机，它们在高精度计算能力方面更强，应用范围也更广，主要用于解决一些科学计算类问题，比如行星模拟、新材料开发、分子药物设计、基因分析和气象预测等。

　　随着人工智能逐渐在各个应用场景中落地，各行业对于算力的需求也在持续提升。

　　由于人工智能推理或训练一般要用到单精度甚至半精度的数值计算能力以及整型计算，多数智能计算机并不具备这些计算能力，因此去年便开始出现了聚焦于解决人工智能算力需求的人工智能超级计算机，它作为一种专用算力，被应用于人工智能推理或训练等领域。

　　王金桥介绍，人工智能超级计算机对基础软件要求极高，这也是英伟达与微软合作的最大原因。人工智能超级计算机集群通过虚拟化和分布式加速训练，可以有效支撑超大规模人工智能模型DALLE2(基于文本来生成模型的模型)、CLIP(用文本作为监督信号训练可迁移的视觉模型)等的训练，包括图像、文本、语音等多模态异构数据，以及最近特别火爆的人工智能自主生成内容技术。

　　不过，由多台服务器组成的人工智能超级计算机在进行模型计算时，调度的数据规模将越来越大，对通信能力的要求也越来越高。

　　因此，人工智能超级计算机需要部署在云端，这样对用户而言，就可以将之当成一个普通计算机来使用。用户可以简单便捷地完成数据的通信、访问、调度、资源管理与配置等各项工作，从而专注解决人工智能模型训练和推理问题。

　　帮助解决科学计算领域问题

　　“随着数据量的增长，未来人工智能超级计算机能够解决很多以前没办法解决的问题。”王金桥介绍。

　　人工智能超级计算机给科学计算带来了巨大变革。比如，由于大多数物理规律可以表达为偏微分方程的形式，所以偏微分方程组的求解成为了解决科学计算领域问题的关键，而人工智能超级计算机无疑能在这方面助人类一臂之力。

　　不仅如此，人工智能超级计算机还能帮助人们解决更多其他的科学问题，尤其是数学方面复杂方程求解的难题，人工智能超级计算机能变成一个趁手的工具，助力科学家发挥更大的创造力和想象力。

　　虽然专用的人工智能超级计算机去年才出现，但“人工智能+超级计算机”这种模式其实早有端倪。

　　出现于20世纪六七十年代的图计算，就是超级计算的一种方式。“图计算作为下一代人工智能关键核心技术，已被广泛应用于医疗、教育、军事、金融等多个领域，如我们熟知的金融反欺诈分析和商家刷单行为识别等，成为全球科技竞争新的战略制高点。”华中科技大学大数据技术与系统国家地方联合工程研究中心副教授张宇说。

　　这里所指的“图”并非常规理解的图像，而是人与人、物与物之间的构成图，能有效表达事物之间关联关系，是数据分析与应用的基础。万物联通，随着科技发展，人工智能等重要应用利用图数据的处理方法，可处理更复杂、更大规模的数据，且效率和精准率大幅提升。

　　去年底，一篇发表在《自然》杂志的研究成果显示，研究人员利用最新的人工智能技术发现了纯数学拓扑学和表象理论的新见解，寻找到数学不同领域间意想不到的关联，不仅改进了目前最优的4×4矩阵解法，还进一步提升了其他70余种不同大小矩阵的计算速度。

　　这些人工智能与算力“联姻”的典型案例，也预示着人工智能超级计算机未来的发展趋势。