3月7日,根据国务院关于提请审议国务院机构改革方案的议案,组建国家数据局,负责协调推进数据基础制度建设,统筹数据资源整合共享和开发利用,统筹推进数字中国、数字经济、数字社会规划和建设等,由国家发展和改革委员会管理。
“在两会现场听取关于国务院机构改革方案的说明时,看到了组建国家数据局的计划,非常鼓舞。组建国家数据局填补了我国全国平台的空缺,将有效解决“数据孤岛”问题,加快数字经济产业生态体系完善步伐。”全国政协委员、天娱数科副总经理贺晗向记者表示,他今年的提案内容就是围绕构建开放共享协同的人工智能产业生态体系展开,第一条建议:加快推动数据要素高效流通使用,因地制宜,加快构建国家层面公共数据开放体系,深入推动公共数据跨层级、跨地域、跨部门有序共享和开发利用,释放公共数据红利。
近期出现的ChatGPT以极高的人机交互水平,给人工智能领域带来了深深的触动,也让贺晗对其背后的产业生态体系进行了深入的思考。
“我们要反思,为什么ChatGPT没有在我国诞生?从技术角度看,人工智能的核心是数据+算法+算力,ChatGPT就是用海量的数据和海量的算力对算法模型进行长期重投入的训练升级,来系统性地提升基础技术能力,看似很‘基础’,但在这背后,需要完善的人工智能产业生态体系来支撑。”贺晗认为,目前我国人工智能产业生态体系短板主要体现在三个方面:一是公共数据开放太少,产业数据共享太弱;二是开源体系建设仍处在起步阶段,基础薄弱;三是企业端智能算力成本高。
他提到,在数据方面,从覆盖范围、开放程度、共享程度几个维度来看,都有不小差距。发达国家公共数据开放起步较早,已建立起全国性的政府数据开放平台。比如,美国2009年上线data.gov网站,整合了来自各公共部门、各级政府、自愿参与的企业与大学的所有开放数据,以统一的数据标准与格式进行发布,建立了数据质量评价反馈机制,还提供了可供开发人员调用数据的应用程序编程接口,鼓励企业利用data.gov数据开发特色应用。目前data.gov提供了33.5万个数据集,涉及农业、商业、气候、教育、能源、制造业、科研等多个领域。
而我国数据开放起步较晚、进展较慢。据了解,截至2022年9月,全国有26个省级政务数据平台、257个市级政务数据平台、355个县级政务数据平台。目前北京市公共数据开放平台有1.7万个数据集,上海有5361个。数据开放程度不高导致数据量少,进而导致数据资源开发利用不足。
“此前,我们政府数据公开以地方为主,还没有全国平台,跨地区、跨部门、跨层级数据综合分析需求较难满足,“数据孤岛”问题比较突出。相信组建国家数据局可以通过高权限部门的方式,打通数据链路,实现数据整合。”贺晗表示。
除了建议加快推动数据要素高效流通使用外,贺晗还建议,通过开源体系建设以及智能算力体系建设,构建开放共享协同的人工智能产业生态体系。
加快推动开源体系建设。大力弘扬共建共创共享的开源文化,营造有利于开源发展的环境。完善开源知识产权和法律体系,为开源生态建设提供良好的制度基础。通过规划指引、揭榜挂帅、试点示范、财政补贴、税收优惠、产业基金等方式,加强企业主导的产学研深度融合,鼓励企业围绕开源社区运营、开源代码托管平台建设、开源数据集建设、开源项目孵化等关键点进行长期投入。
加快推动智能算力体系建设。鼓励相关企业围绕训练、推理等人工智能领域实际算力需求,建设专用行业云及融合赋能应用平台,鼓励推出算力共享、算力错峰等新业务模式进一步降低算力成本,实现普惠包容算力。加快智能算力集群建设,引导新建数据中心打造智能算力中心,鼓励引入国产化GPU、ASIC等异构算力。
本文来源:财经报道网