营造人工智能大模型产业生态

       推动人工智能大模型产业化应用是提升国家竞争力的关键举措。要抢占人工智能大模型产业发展制高点,必须加强战略规划和深度治理,推进新型算力生态基础设施建设,打造稳定可靠的算法开源生态。

  不久前举办的中关村论坛人工智能大模型发展分论坛发布的《中国人工智能大模型地图研究报告》提出,我国自2020年进入大模型快速发展期,目前与美国保持同步增长态势。当前,我国人工智能大模型已发布79个。此前召开的中共中央政治局会议提出,要重视通用人工智能发展,营造创新生态,重视防范风险。推动人工智能大模型产业化应用,是加快实现我国人工智能领域高水平科技自立自强的应时之举,也是推动我国产业优化升级、实现经济高质量发展的重要一招,更是提升国家竞争力、维护国家安全的关键举措。

  营造良好的人工智能大模型产业生态,应着力解决目前我国人工智能大模型发展面临的高端算力技术不可控、大规模高质量数据集少、算法可靠性和可解释性弱等核心问题。目前,由GPU、FPGA、ASIC等加速芯片异构而成的人工智能高端算力芯片技术面临“卡脖子”风险。在高效低碳的算力网络基础设施方面,跨省域互联互通与动态调配的机制尚未建立,规模化的高端算力供给能力亟待提升。同时,高质量数据供给不足影响了大模型“智商”。这体现在高价值公共数据开放程度不足、行业及企业数据要素市场化流通不够充分、用于大模型训练的数据集规模较小等。此外,算法可解释性不强也影响了大模型的产业化应用。拥有千亿级参数的大模型算法,开发难度大、训练难度高、决策过程及结果的可解释性差、合规评估难,直接对行业大模型开发的进程有所影响。

  基于此,要抢占人工智能大模型产业发展制高点,必须加强源头技术创新,打赢软硬件基础设施国产化攻坚战,化解大模型关键核心技术被“卡脖子”的风险,多措并举推动人工智能大模型产业化应用。

  首先,推进新型算力生态基础设施建设。实施高端算力芯片研发重大专项扶持计划,鼓励头部企业联合高水平大学“揭榜挂帅”。建立新型研发机构,推动国产高端算力芯片实现突破。在国家“东数西算”工程背景下,推动新型算力网络基础设施建设的顶层设计,建设国家公共算力开放创新平台,搭建算力生态链,推动全国算力资源互联互通、协同共享与优化配置。

  其次,构建规模大、质量高的数据生态。完善国家公共数据开放标准和平台,推动高价值公共数据开放与多元化授权运营,引导行业、企业大数据有条件开放、融通并进场交易,形成多模态、多领域的大规模数据集。打造数据集精细化标注的众包服务平台和数据质量评估标准体系,建设高质量中文语料库。构建敏感领域数据隐私保护的监管体系和技术服务体系。

  再次,打造稳定可靠的算法开源生态。建立大模型算法及工具开源平台,完善具有稳定性、可靠性和安全性的算法监测标准和技术体系。实施行业大模型产品和服务的登记备案、安全评估及潜在风险预测的审查机制。鼓励平台企业积极开展算法创新探索与应用,赋能中小企业降本增效并创新商业模式,深化数字化转型并引领高质量发展。

  最后,加强人工智能大模型的战略规划和深度治理。制定人工智能大模型产业发展规划,对大模型技术研发和产业应用给予相应的政策、资金和人才等支持。推动算力、算法、数据、应用场景等上下游产业无缝衔接与协同联动,实现大模型产业相关要素跨语言、跨模态、跨任务、跨行业融合发展。加强人工智能大模型深度治理的国际合作,推动技术向善发展,促进大模型产业高质量发展。(何喜军 张惠娜)

【责任编辑:赵秋玥】