□本报记者 董盈
作为人工智能落地应用的基础支撑,数据标注对于人工智能产业的发展至关重要。当下,全国多地都在推动数据标注产业发展,大力发展数字经济的黑龙江省在数据标注产业这条赛道上有何机遇、如何发力?近日,受黑龙江省数据局邀请,四川省产业大数据应用研究院执行院长沈益民来哈开展讲座。记者采访了沈益民教授,畅谈我省发展数据标注产业的机遇与策略。
发展数据标注产业有何益处?“数据标注有助于整体提高数据质量、促进数据要素流通、创造就业机会以及盘活现有资产。”沈益民提到数据标注所带来的多重价值。
沈益民展开解释道,数据标注是对原始数据进行加工处理,让加工后的数据能够被人工智能模型所使用,相当于给原始数据赋予了分类或者标签,目的是让数据具有更丰富明确的信息,使数据质量大幅度提升。数据标注如果形成独立的产业,就意味着数据企业只需要关注如何采集数据,数据处理工作则交给标注公司去做,数据标注后交给人工智能公司使用,这就可以打破以往的行业、地区等壁垒,从而使数据能够在整个产业链进行市场化配置,哪里需要就向哪里流动,更好发挥数据标注连接大数据和人工智能的重要桥梁作用。
沈益民说,数据标注既是劳动密集型产业,能够为大学、职业院校的毕业生创造新的、较好的就业机会;同时,专业大模型数据标注业务也给领域专家和有经验的技术人员带来创造价值的机会,因此也出现了向知识密集型发展的趋势。此外,数据标注可以盘活地方现有资产,比如空置率较高的园区、可以使用的算力、电力盈余等,提高整个社会的经济效率。
今年6月,国家数据局发布了承担数据标注基地建设任务的城市名单,支持各地推动数据标注的产业培育和集聚发展。黑龙江省如何突破发力?沈益民认为,黑龙江具有相关产业优势。从哈工大、哈工程到各类本科、职业院校,黑龙江省的人力资源结构能够满足数据标注产业所需的人才条件。黑龙江电力充沛、气温较低,对于数据标注及其上下游的存储、处理、模型训练等创造了很好的能源条件。在算力方面,黑龙江新建了万亿级模型训练能力的算力设备,具备发展数据标注产业的基础设施。
谈到标注产业生态建设,沈益民建议,省市协同建立支撑标识确权、业务协同的标准规范和公共服务平台,为产业做好引导、保驾护航。同时对于数据流通过程中的安全、质量、异常进行采集分析,作为促进数据产业和人工智能产业发展的一个抓手。
政府可以支持院校开展培训,让更多的毕业生和社会人员掌握数据标注的基本技能,同时增强数据安全和隐私保护的意识,为发展数据标注产业打好人才基础。黑龙江省各市地、区县可以发挥各自优势,根据自身经济特点、人口结构、经济重点等去选择他们想发展的数据标注产业细分领域方向,形成错位发展格局,产业发展空间很大。
未经允许不得转载:跨境财经 » 沈益民:发展数据标注产业 黑龙江有优势有空间