当人工智能遇上超级计算机
来源:科技日报 | 作者:jyingguoji | 发布时间: 2022-12-05 | 193 次浏览 | 分享到:
由于人工智能推理或训练一般要用到单精度甚至半精度的数值计算能力、整型计算,多数超级计算机并不具备这些计算能力,因此去年便开始出现了聚焦于解决人工智能算力需求的人工智能超级计算机,它作为一种专用算力,被应用于人工智能推理或训练等领域。

  ◎记者 吴纯新 通 讯 员 涂兴佩

  

  由于人工智能推理或训练一般要用到单精度甚至半精度的数值计算能力、整型计算,多数超级计算机并不具备这些计算能力,因此去年便开始出现了聚焦于解决人工智能算力需求的人工智能超级计算机,它作为一种专用算力,被应用于人工智能推理或训练等领域。

  

  打开手机,半个月内的天气状况一目了然;出门在外,地图导航给出最优路线……这些“未卜先知”从何而来?答案是计算。

  

  如今,算力作为数字经济的第一引擎,正成为科技巨头们争相进军的主阵地。

  

  日前,英伟达宣布与微软联手开发人工智能超级计算机,依托微软Azure云运行,通过数以万计的图形处理单元(GPU)、中央处理器(CPU)处理云中的密集人工智能计算工作。

  

  人工智能遇见超级计算机,将会碰撞出怎样的火花,又将带来哪些挑战和机遇?

  

  对基础软件和通信能力要求极高

  

  “实际上,人工智能超级计算机去年就出现了,其核心是解决大规模密集人工智能训练和推理等的计算问题。”武汉人工智能研究院院长王金桥说。

  

  传统超级计算机相对一般计算机而言,就是一种计算能力更强、通信速度更快、存储容量更大、功能更完善的计算机,它们在高精度计算能力方面更强,应用范围也更广,主要用于解决一些科学计算类问题,比如行星模拟、新材料开发、分子药物设计、基因分析和气象预测等。

  

  随着人工智能逐渐在各个应用场景中落地,各行业对于算力的需求也在持续提升。

  

  由于人工智能推理或训练一般要用到单精度甚至半精度的数值计算能力以及整型计算,多数智能计算机并不具备这些计算能力,因此去年便开始出现了聚焦于解决人工智能算力需求的人工智能超级计算机,它作为一种专用算力,被应用于人工智能推理或训练等领域。

  

  王金桥介绍,人工智能超级计算机对基础软件要求极高,这也是英伟达与微软合作的最大原因。人工智能超级计算机集群通过虚拟化和分布式加速训练,可以有效支撑超大规模人工智能模型DALLE2(基于文本来生成模型的模型)、CLIP(用文本作为监督信号训练可迁移的视觉模型)等的训练,包括图像、文本、语音等多模态异构数据,以及最近特别火爆的人工智能自主生成内容技术。

  

  不过,由多台服务器组成的人工智能超级计算机在进行模型计算时,调度的数据规模将越来越大,对通信能力的要求也越来越高。

  

  因此,人工智能超级计算机需要部署在云端,这样对用户而言,就可以将之当成一个普通计算机来使用。用户可以简单便捷地完成数据的通信、访问、调度、资源管理与配置等各项工作,从而专注解决人工智能模型训练和推理问题。

  

  帮助解决科学计算领域问题

  

  “随着数据量的增长,未来人工智能超级计算机能够解决很多以前没办法解决的问题。”王金桥介绍。

  

  人工智能超级计算机给科学计算带来了巨大变革。比如,由于大多数物理规律可以表达为偏微分方程的形式,所以偏微分方程组的求解成为了解决科学计算领域问题的关键,而人工智能超级计算机无疑能在这方面助人类一臂之力。

  

  不仅如此,人工智能超级计算机还能帮助人们解决更多其他的科学问题,尤其是数学方面复杂方程求解的难题,人工智能超级计算机能变成一个趁手的工具,助力科学家发挥更大的创造力和想象力。

  

  虽然专用的人工智能超级计算机去年才出现,但“人工智能+超级计算机”这种模式其实早有端倪。

  

  出现于20世纪六七十年代的图计算,就是超级计算的一种方式。“图计算作为下一代人工智能关键核心技术,已被广泛应用于医疗、教育、军事、金融等多个领域,如我们熟知的金融反欺诈分析和商家刷单行为识别等,成为全球科技竞争新的战略制高点。”华中科技大学大数据技术与系统国家地方联合工程研究中心副教授张宇说。

  

  这里所指的“图”并非常规理解的图像,而是人与人、物与物之间的构成图,能有效表达事物之间关联关系,是数据分析与应用的基础。万物联通,随着科技发展,人工智能等重要应用利用图数据的处理方法,可处理更复杂、更大规模的数据,且效率和精准率大幅提升。

  

  去年底,一篇发表在《自然》杂志的研究成果显示,研究人员利用最新的人工智能技术发现了纯数学拓扑学和表象理论的新见解,寻找到数学不同领域间意想不到的关联,不仅改进了目前最优的4×4矩阵解法,还进一步提升了其他70余种不同大小矩阵的计算速度。

  

  这些人工智能与算力“联姻”的典型案例,也预示着人工智能超级计算机未来的发展趋势。

  

  相关链接

  

  武汉人工智能计算迎来好“帮手”

  

  11月23日,武汉超算中心正式投运,国家文化大数据华中区域云平台入驻。该云平台是国家文化大数据体系八大区域中心之一,上联国家文化大数据全国中心,下接行政大区内省域中心,负责华中区域内五省(湖北、湖南、河南、江西、安徽)之间的数据、信息、产品等的交易和结算。

  

  该超算中心是目前国内最大的集装箱超算中心,整体规划设计的算力为200P,首期算力达到50P。通俗讲,1P约等于每秒1000万亿次的浮点运算,50P的算力将超过10万台高性能计算机算力之和。其技术底座是由数万核鲲鹏处理器内核,以及数千张加速卡构成。

  

  “武汉超算中心在国内第一个采用了基于鲲鹏架构的超级计算机。”王金桥说,投运后,将与武汉人工智能计算中心一起形成“双中心、双引擎”发展模式,这对武汉建设人工智能创新中心有极大的促进作用。

  

  眼下,武汉超算中心已接入中国算力网,一方面作为数字中国建设的地理中心和网络中心,更好地服务“东数西算”重大战略;另一方面将利用武汉高校在分布式计算、海量存储、人工智能算力平台等方面的科研优势,助力武汉打造中部地区数据中心和算力服务枢纽。

  

  2020年9月,武汉获批建设国家新一代人工智能创新发展试验区。去年5月,武汉人工智能计算中心一期投入运行,成为科技部批复的18个国家人工智能创新发展试验区中首批投入运营的项目,也是全国首个面向产业的多样性算力公共服务平台。

  

  目前,武汉人工智能计算中心已为武汉大学、清华大学、中国科学院自动化所等高校和科研院所,以及100多家重点企业提供普惠算力服务,意向入驻企业已超200家,孵化应用案例超过50项,广泛服务于智能制造、智慧城市、智慧交通、网络直播等行业和领域。