科技日报记者 俞慧友
“我国亟需针对数据标注产业结构性矛盾,加快构建社会化标注体系,推动产业高质量发展。”3月5日,全国政协委员、中国工程院院士、湖南工商大学党委书记、湘江实验室主任陈晓红表示。
人工智能是当前全球科技竞争焦点,事关社会转型与产业革命。数据标注是对原始数据进行分类、清洗、标记、注释等加工处理的基础工作,是实现原始数据价值转化、支撑大模型研发与训练的关键环节。随着大模型向垂直领域的加速渗透,医疗、金融、工业等场景的专用标注需求将迎来井喷式增长。
“与之对应的是数据标注产业规模不足、结构失衡、效能低下等问题,难以满足高质量数据供给需求。”陈晓红表示,高质量数据标注供给短缺会严重制约垂直领域大模型的创新与应用落地,因此我国亟需构建政府、市场和社会力量多元主体参与的社会化数据标注体系,并同步推动数据标注产业链扩容、提质和增效。这包括需持续释放高质量数据标注需求,深化社会智慧化转型,加快推动政务、交通、能源、农业等重点领域和行业的“AI+”改造,完善数据标注标准与合规指引,激活垂直场景标注需求。
同时,她建议通过设立数据标注产业升级专项支持基金,重点支持标注企业研发智能标注系统与数据服务平台,打通AI数据标注与治理到大模型落地部署的全链条服务,以及鼓励企业培训跨学科复合型标注人才,加速从数据标注“外包商”向“知识服务商”转型。她还建议,应积极加大高端人才供给与培养,培育产业链价值共享生态和创建社会化标注基础设施。
(受访者供图)
责任编辑:孙莹