全栈才是未来 有认为人工智能计算中心建设需要根据算力定价格的
2021-09-24 15:12:39 | 来源:北晚 | 投稿: | 编辑:黄懒懒

原标题:全栈才是未来 有认为人工智能计算中心建设需要根据算力定价格的

除了软硬件,全栈一体化还涵盖基建设施,同样以武汉、西安人工智能计算中心为例,技术支持厂商采用预制模块化方式建设,不到半年即完成了建设交付,其建设周期是传统楼宇方式机房建设的一半,效率对比高下立现。

辅助运营: “建起来”更要“用的好”

框架是所有算法模型的开发基础,90%的AI应用开发都是基于AI框架,其重要性毋庸置疑。现阶段很多厂商采用的都是国外的AI开源框架,实际上相当于将中国人工智能发展的可控性交到了他国手中。未来国与国之间的科技竞争将愈演愈烈,一旦出现问题,我国想要重新实现安全、自主、可控的技术布局,势必要从底层将一切推倒重建,可能造成大量的人力、物力和财力损失。

与其亡羊补牢,不如防患于未然。让人工智能计算中心在建设之初就实现国产化,拥有自主可控的AI框架,目前已成为业内的基本共识。据悉,目前大多数人工智能计算中心都使用了国产自研的全场景AI计算框架MindSpore,该框架原生支持大模型训练,并支持端、边、云全场景协同,具备安全可信、高效执行、一次开发多次部署的能力。

不被杂音误导则需回归本源,人工智能计算中心是以基于AI芯片构建的AI计算机集群为基础,涵盖了包括基建设施、硬件设备和软件应用在内的完整系统。而系统的构成,硬件部分往往最先被考量,那么我们先从AI训练芯片说起。

AI芯片对于人工智能有多重要?一言以蔽之,各行业、各企业数字化转型需要构建匹配自身的AI模型,而高质量AI模型则需要通过训练持续迭代优化而来。这就要求提供算力的当地人工智能计算中心具备高性能的AI芯片,以此确保充沛、稳定的算力供应。

具体到AI芯片,又分训练芯片和推理芯片,其中训练芯片是基础中的基础,因为AI首先要解决认知训练的问题,然后才是推理,这就要求训练芯片必须具备浮点运算能力,因为在复杂模型的训练过程中,需对上千亿个浮点参数进行微调数十万步,需要精细的浮点表达能力。相比之下,无浮点运算能力的芯片如用于训练将增加约40%的额外操作,以及至少4倍的内存读写次数。

软件基础设施:框架自主可控和AI使能更关键

人工智能计算中心想要稳定运行,建设和使用之间就不能出现断层。当下的人工智能计算中心通常由地方政府牵头,技术支持厂商参与建设。但有些厂商只管建,却不管养,或者提供不了全面的辅助运营。

随着人工智能逐渐成为推动社会经济发展的新引擎,各行各业都随之步入产业智能升级的队列。在越来越旺盛的算力需求下,我国的人工智能计算中心正呈现全面开花、多点落地的态势。然而,与其他领域的发展初期类似,伴随人工智能中心的建设热潮,相关的争议及讨论也越来越多:有认为人工智能计算中心建起来不一定能用上的,有认为人工智能计算中心建设需要根据算力定价格的,还有认为越多台AI服务器就代表人工智能计算中心能力更强的等等。

辅助运营是发展人工智能产业的保障,这一点是业内专家和项目实践的共识。例如武汉、西安、深圳等地的人工智能计算中心在建成之后,技术支持厂商设立生态创新中心,组建辅助运营团队,以“扶上马、送一程”的方式辅助运营公司开展计算中心算力运营和生态运营,向当地企业提供产品、客户、渠道等支持服务,并给当地企业提供科研创新、人才培养、应用孵化、产业发展等服务。这一做法确保了人工智能计算中心建起来之后,既可以高效发挥算力价值,也可以确保AI产业生态建设。

硬件基础设施:重点关注训练芯片

当下,国内人工智能计算中心的规划与建设如火如荼,随着武汉、西安、深圳等地人工智能计算中心正式投入运营后对当地人工智能产业的口碑反馈,全栈一体化的优势将更加凸显。相信在可以预见的将来,选择全栈解决方案的人工智能计算中心会越来越多,为我国数字经济的快速发展提供更多动力。

框架之外, AI使能平台也需要关注。以武汉人工智能计算中心采用的ModelArts为例,该平台是全功能AI平台,功能丰富,具备多租户、细粒度资源管理的能力,包含一体化的集成开发环境,支持大规模训练数据管理、大模型的大规模分布式训练,并集成了自主可控的AI计算框架及第三方框架。在云管平台方面,安全、易用是关键考量:可提供公有云技术满足公共服务平台技术要求,支持多租户管理与资源隔离;源自云的服务能力,统一运维,统一计量。

tags:

上一篇  下一篇

相关:

云从科技创新故事:从中科大到创业 只有通过不断地创新和实践,我们才能研发更多领先的技术,并且形成产品,更好地赋能到各行各业,逐步实现我们超人社会的设想

——云从科技集团股份有限公司创始人、董事长周曦 未来,云从科技将坚持以“定义智慧生活,提升人类潜能”为使命,以“成为全球智能生态领军企业”为愿景,抓住国家深化实施促进新一代人工智能产业发展的良好机遇,深耕

这场特殊时刻的罕见大型军演 去年

不管谁接替菅义伟成为日本下一任首相,都应正视、深刻反省历史,与军国主义划清界限。 那么日本举行军演意欲何为?根据演习内容,此次军演由陆上自卫队主导,旨在强化大规模兵力投送能力,因而演习的用意很有可能

黑芝麻智能完成数亿美元战略轮及C轮融资 专注打造自动驾驶芯片产业投资看好资源+资本双重助力黑芝麻智能闻泰、富赛汽车等众多产业投资也力挺黑芝麻智能

本轮融资完成后,黑芝麻智能估值近20亿美元,成为自动驾驶芯片超级独角兽。秉持着“用芯赋能未来出行”的准则,黑芝麻智能将不断突破更高层次的技术与产品创新,联合生态伙伴打造面向未来的自动驾驶技术与产品,引

百度发布PLATO-XL 通过灵活的注意力机制,模型对上文进行了双向编码,充分利用和理解上文信息;对回复进行了单向解码,适应回复生成的auto-regressive特性

预训练技术大幅提升了模型对大规模无标注数据的学习能力,如何更高效、充分的利用大规模数据提升开放域对话能力,成为主流的研究方向。 PLATO-XL效果:多种类型、多种任务,对话效果全面领先 PLATO-XL:全球首个百亿参

是谁让人工智能计算中心的框架“裸奔”在外?小心埋祸根! 据媒体报道,已有武汉、西安、深圳等地的人工智能计算中心已投入运营,更多城市将人工智能计算中心的建设规划提上议程

值得一提的是,MindSpore已经向全社会开源,有利于充分发挥更新速度快、可二次开发、可扩展性强等特点,对于降低企业开发AI应用的投入具有很好的效果,更加有利于推进人工智能技术演进和产业的快速发展。 面对当前复杂

站长推荐: