新华社上海6月9日电题:竞速大模型:一手创新策源,一手落地应用
(相关资料图)
新华社记者周琳、杨有宗、潘德鑫
百花齐放、竞相涌现,2023年至今,大模型带火的通用人工智能赛道,出现了众多玩家。科技部新一代人工智能发展研究中心等机构发布的数据显示,中国10亿参数规模以上的大模型已发布79个。这一席卷科技界的AI革命,将如何改变世界?大模型又将如何一手促进创新策源,一手服务实体经济?在从业者看来,这场竞速赛才刚刚开始。
大模型探索大应用
在位于上海临港新片区的商汤科技智算中心一楼展示大厅,可以和大模型“商量”,用中文“商量”一下。
记者在现场感受发现,作为千亿级参数的自然语言处理模型“商量”,它不仅可以进行多轮对话、人机共创童话故事,还可以自动生成简单代码、进行“文生图”等。例如,在输入了20张“港风”照片后,生成式AI就可以自动生成一张类似风格的“氛围感”图片。
“无论是让大模型写出一首质量过关的古诗,还是根据描述生成图像,都要求其对中文语言的理解足够深刻。这需要经过多轮对话的训练,包括辅助语料的投喂,才能逐渐让模型理解汉语的规律。”商汤科技首席科学家王晓刚说。
语言类大模型不是唯一形态,多种通用大模型正在持续拓展应用场景。科技部新一代人工智能发展研究中心等机构发布的《中国人工智能大模型地图研究报告》显示,中国研发的大模型数量排名全球第二,仅次于美国。
一方面大模型从办公、生活、娱乐向医疗、教育、设计等行业加速渗透;另一方面,一些垂直专业类大模型不断深化落地,生物制药、遥感、气象等大模型正在发挥纵深优势。
4月初,上海人工智能实验室联合中国科学技术大学、上海交通大学、南京信息工程大学、中国科学院大气物理研究所及上海中心气象台发布全球中期天气预报大模型“风乌”,30秒生成未来10天全球气象高精度预报结果。
在气象气候预报任务中,全球中期天气预报是重要预测任务之一,它以预测未来14天内的大气系统状态为目标。“风乌”在预报精度上降低了误差,在时效上突破了10天,而且仅需单GPU(图形处理器)便可运行。
上海人工智能实验室领军科学家欧阳万里说:“‘风乌’取名自秦汉时期的‘相风铜乌’,是世界上最早的测风设备。天气预报大模型‘风乌’承载中国古人的智慧,也寓意实验室致力于在以气象为代表的人工智能服务科学领域不懈探索。”
大算力搭建新“底座”
出台支持举措、整合创新资源、布局新兴赛道……近段时间以来,各地都在为人工智能的创新策源“铺路”。
5月30日,北京发布《北京市加快建设具有全球影响力的人工智能创新策源地实施方案(2023—2025年)》《北京市促进通用人工智能创新发展的若干措施》等方案;深圳发布关于加快推动人工智能高质量发展高水平应用行动方案;上海市经信委表示,超大规模预训练模型是人工智能从专业智能走向通用智能的关键技术,未来将加快研究打造大模型生态集聚和创新应用高地,推进算力资源统一调度。
算力是研发大模型必不可少的基础设施,已成为不少城市争相布局的焦点。“近期生成式人工智能等应用大爆发,推动了算力需求激增。很多企业在落户前都会问,算力需求能否被满足,这已是一种稀缺资源。”上海临港新片区管委会高科处处长陆瑜说,这也是临港发力构建更为完善的算力产业生态、搭建公共平台的初衷。
瞄准产业痛点,智能算力更需要一体化调度、经济化使用。专家认为,“东数西算”工程的全面实施,将一手促进东部数字经济产业链向西部延伸拓展,一手让算力资源精准配置和按需获取,有效降低能源消耗。
“我们将在贵安新区共同合作建设新的产业园区,来打造沪黔科技创新成果的转化中心。”贵阳市市长马宁宇说,贵安正在规划建设全国规模最大,存算能力一流的高安全、高可靠、高可用的数据中心集群,为大数据、大算力、大模型的技术发展和应用提供广阔空间。
“东西合作有更多想象空间。”优刻得科技股份有限公司副总裁刘杰认为,“东数西算”工程可以解决算力问题,在GPU运算中,西部成本比东部便宜一半。业内其实也在探索“东数西训”,把非实时计算的AI训练过程放在西部进行,涉及需要实时运算的推理过程则在东部直接完成,更好地调度算力、节约成本。
设规则促进“好模型”
既为创新“加油”,也为发展“立规”。专家认为,目前大模型总体人才不足,不少应用领域还未有成熟开发,数据治理也有待提升,这既需要政府部门为创新的落地搭平台、找场景,也需要为其安全探索设置好边界。
今年4月,国家网信办发布《生成式人工智能服务管理办法(征求意见稿)》,对用于生成式人工智能产品的预训练、优化训练数据提出明确要求。从治理原则到伦理规范,近年来我国一直加强对人工智能行业“立规”。
“大模型推动人工智能实现一次历史性跨越,中国经济社会高质量发展为大模型创新提供丰富场景和数据基础。”中国科学技术信息研究所所长、科技部新一代人工智能发展研究中心主任赵志耘认为,未来需要在四个方面着力:加强资源和研发力量统筹,促进产学研合作与开源开放;加强大模型技术研发,提升学术和开源影响力;强化大模型发展中的场景牵引作用,打造大模型标杆项目;强化政策支持和配套服务,加快推动大模型应用落地。
从更深层次看,助力大模型走深走透,还需要更高质量的数据库。“未来对数据的高质量和多维度要求都会更高。”中国人工智能开源软件发展联盟副理事长王健宗说,比如以前标注一张图,只需要说这是“一个公园”;但现在标注就需要详细描述为“母亲和小孩在公园里散步”,标注难度和工作数量级呈指数上升。
“数据变成必要的生产要素后,怎么安全合理地使用,是政府必须考虑的问题。以后对数据的质量要求、使用门槛都会越来越高,需要规则的提前制定。”赵志耘说。