国网中心大力拥抱云端翻新架构打造新一代高速运算主机,创建云端基础的服务环境,让用户能够通过云端平台以容器化方式存取运算资源,简化开发流程及后端计算管理。并分两阶段推动,第一阶段采用先导服务主机,以GPU服务器为主,优化服务大型语言模型开发、AI共用运算服务与大型科学运用应用,第二阶段则将导入云端AI运算主机,配备更强大的GPU服务器、数据存储和高速网络设施,提供高性能计算能力,支持更多异质环境的应用研究及开发需求。
除了国网中心的超级电脑之外,在国科会提出的「大南方计划」建置计划中,将于2029年在沙仑部建一座算力可达200 PFlops的AI超级电脑,未来激活后将提供南部学研界和业界开发使用。
不只国网中心建置超级电脑,民间企业积极布局AI算力服务市场
不只国网中心建置超级电脑,企业积极布局AI算力服务市场,许多业者纷纷投入大型AI算力建设。例如,Nvidia推出的Taipei-1,搭载512个H100 GPU,算力达22.3 PFlops,而鸿海则计划在高雄打造一座算力超过90 exaflops的超级电脑。
配合AI算力的发展,国网中心在网络与数据中心建设方面也有相关建置计划,包括将在南科建置IDC云端数据中心,预计于明年初完工,并于年中陆续进驻HPC、GPU等设备,未来IDC激活后除了可供AI研究,国网中心将拓展更多服务模式,如主机代管服务等。
在网络建设方面,在2022年激活FOX网络交换中心后,国网中心规画未来3~4年分阶段完成南北骨干网络光纤的建置,强化全国的数据传输能力。
国网AI云服务将成为新一代云端服务平台
除了扩增算力之外,国网中心聚焦的另一大重点就是云端服务。张朝亮表示,云端在AI发展中扮演着重要角色,不仅提供便利的云端入口和友善的使用界面,让所有人都能很容易介接使用,还能提供强大运算资源,处理AI开发所需的大量数据。
他坦言,过去HPC主要集中于科学和工程计算,但在过去五年中,AI已成为主流。因此,每个HPC中心都在扩展GPU算力,并思考如何提升云端服务以更好地满足客户需求。
国网中心将以国网AI云服务(NCHC AI Cloud service, NAICS)作为新一代云端服务平台。他指出,这套平台不仅具备更强大的运算服务,支持多元AI试算环境与应用场景,还集成更多资源,介接主流公云。
根据国网中心的规画,初期将建构包括IaaS和PaaS云端基础服务,到2025年将进一步提升并集成HPC与云端服务,添加更多云端功能选项,同时推出HPC高速运算与HFS高速存储集成服务,以提升性能。

国网中心还计划于2024至2027年建置一套云端数据分析平台,针对数据的机敏性创建可信环境,强化数据保护与隐私保障。
在设计上,张朝亮表示,此平台将依据数据敏感程度分为隐私工作区和公共工作区。考虑到数据机敏性,用户未来可以选择隔离的隐私工作区,强化云端服务的安全性。在这个隔离的云端环境中,外部数据交换仅限于唯读模式,所有数据将存储在国网中心的机敏商用存储系统中。他提到说,未来包括生医、国土治理、国防科技、科学计算等都能运用这个平台来进行开发、数据存取,确保数据的完整性。
此外,国网中心近期将启动新计划,将在云端环境中打造国产芯片技术PoC实验平台。张朝亮也说,未来,国内芯片设计业者在开发Edge芯片或AI ASIC芯片时,就可以用这个平台进行测试与验证,加速产品开发进程。



2024-10-18
