漫画 王建明
近日,国度四部门发布《对于促进数据标注产业高质料发展的实际成见》(以下简称《实际成见》),明确建议了要加强基础举止竖立,升迁数据标注的质料和成果;到2027年,数据标注产业专科化、智能化及科技改动材干权贵升迁,产业领域大幅跃升,年均复合增长率跳跃20%。
什么是“数据标注”?简便衔接,即是给文本、语音、图片、视频等等多样万般的数据“打标签”,自动驾驶、低空经济、智能制造、聪慧医疗等领域王人离不开数据标注。本次印发的文献是国度层面初度对数据标注这一新兴产业进行系统场合。
《实际成见》围绕深切需求牵引、增强改动脱手、蕃昌产业生态、优化产业复古等四方面建议13条具体计谋举措。其中还建议,竖立收效权贵、特质显着的数据标注基地,造成相对完善的数据标注产业生态。现在,我国已确信成王人、沈阳、合肥、长沙等7个城市承担数据标注基地竖立任务。
从产业链单干纬度来看,数据标注上游包括数据汇集斥地制造商、数据供应商等。中游主如果数据标注企业,厚爱对数据进行标注处理。卑鄙则是数据标注行使领域,涵盖了自动驾驶、聪慧医疗、金融科技、智能安防、当然说话处理等繁密行业。
中信证券以为,跟着AI时刻的不停熟练和行使领域的拓展,数据标注行业将迎来更无边的商场空间。绝顶是在自动驾驶、智能医疗、智能金融等新兴领域,AI爆发对高质料标注数据的需求将握续增长,为行业带来雄壮的商场机遇。举例,在图像识别领域,需要对多数的图像进行标注,如标注图像中的物体类别(是猫、狗照旧汽车等)、物体的位置信息等。这些标注好的数据会被用于试验神经汇集模子,而模子的试验历程需要多数的算力支握。莫得经过标注的数据,算力就莫得符合的“原料”来进行灵验的模子试验。
据关系机构测算,2023年我国数据标注产业领域已达 800亿元领域。跟着数据标注行业的快速发展,对标注数据的质料和数目条件不停提高,这就需要更顽强的算力来支握模子试验。恰是为了沸腾这种需求,数据中心、云遐想等算力关系产业才不停发展壮大。
1月16日,深圳市政务做事和数据解决局下发了对于搜集数据标注优秀案例的奉告,在全市范围内组织搜集数据标注优秀案例。
深圳上市公司云天励飞15日在回应投资者发问中示意:“现在仍是造成了智能自研数据标注系统、可表率化高效出产算法的YMIR平台、支握辩认式的模子部署平台以及自动化模子评测平台。公司自研大领域试验及部署时刻,旨在于买通从数据底座、数据标注、模子试验、模子部署、模子评测等从数据到模子出产的全链条开yun体育网,用于公司里面时刻千里淀、降本增效以及外部长尾算法的出产。”