数据标注,通往AI时代的“数字基座”
创始人
2025-12-01 03:40:11

(来源:沈阳日报)

转自:沈阳日报

  清晨,在和平区一条尚未完全苏醒的马路上,一辆外观略显“奇特”的白色作业车正以时速30公里的匀速平稳行驶。车顶,一个不断旋转的激光扫描部件像一只敏锐的眼睛,每秒向四周发射百万束激光,悄无声息地捕捉着路面的每一条标线、每一盏路灯,甚至是老建筑墙面上精致的雕花。

  这是辽宁宏图创展测绘勘察有限公司(以下简称宏图创展)的外业数据采集现场。车内,高精度激光扫描设备配合惯性导航与定位系统,正以厘米级的精度,将真实的城市街景转化为海量的三维点云数据。这些看似无序的“数字尘埃”,即将在后端经历一场关键的“精加工”——数据标注,从而成为训练各种人工智能模型的“标准教材”。

  什么是数据标注?

  简单来说,数据标注就是给原始数据“做注释”,是AI模型学会“看世界、听声音、懂语言”的关键前提。如果把AI模型比作一个正在求学若渴的学生,那么海量的原始数据就是堆满桌子的“无字天书”。而数据标注员,就是那位在书上划重点、写注释、出习题的“老师”。

  例如,在一张城市街景图片中,标注员需要框选出哪些是“行人”、哪些是“车辆”、交通信号灯是“红”还是“绿”;在一段语音中,需要标记出每个字词的发音和含义;在一段文本中,需要标识出人名、地名、关键情绪。正是通过这样千千万万次地“标注教学”,AI才得以识别模式,作出智能判断。

  从“劳动密集”到“技术驱动”的产业升级

  在位于皇姑区的辽宁京数云大数据科技有限公司(以下简称京数云)内,数百名标注员正专注于屏幕前,对短视频内容进行安全审核。“以前大家觉得数据标注门槛低,甚至说是‘宝妈行业’,”京数云的技术总监刘吉在接受采访时坦言,“但现在,简单、重复性的标注工作,60%~70%已能通过AI模型自动完成。人的价值,更多体现在处理新兴领域、高复杂度或空白领域的标注任务上。”  ,数据标注,通往AI时代的“数字基座”)

  刘吉的观点印证了行业的变迁。随着大模型时代的到来,数据标注产业正从劳动密集型加速转向技术密集型。对标注的精度、效率以及场景理解能力提出了更高要求。

  沈阳的“标注工厂”不止于标注

  去年5月,沈阳市被国家数据局确定为首批国家级数据标注基地建设城市。这块“国字号”招牌,为沈阳发展数据产业按下了加速键。

  据沈阳市数据局有关人士介绍,截至目前沈阳已引育数据标注企业65家,从业人员达1.18万人,拉动产业规模约25.9亿元,已完成国家试点任务的80%。在不久前公布的全国数据标注优秀案例中,沈阳入选3个,数量位列试点城市第一。

  在这片土壤上,生长出了形态各异的标注企业。

  宏图创展深耕空间地理信息,其标注的数据服务于自动驾驶、高精导航和智慧城市建设。

  京数云则聚焦内容安全审核和AI基础数据服务,为国内各大视频等平台提供“AI+人工”的审核方案,年处理数据超3600万条。另外,该公司残疾人员工占比55%,打造了全国首个残健融合的AI数据服务基地,将社会责任融入商业模式。

  商本(沈阳)大数据产业发展有限公司走的是另一条技术路径。其技术总监李林遥介绍,他们更像是一个“数据清洗工”和“分析师”。“我们获得授权,对海量的非结构化商业数据进行清洗、加工,打上标签,从而为政府招商、金融机构风控提供精准的产业分析和企业尽调报告。”他们的“掌上招投”产品和自研的“商思”大模型,已成为多地政府精准招商的智能工具箱。

  发展数据标注对企业有何用?

  对于广大企业而言,数据标注产业的价值,在于它能够直接赋能其核心业务的智能化升级。

  对于制造业(如华晨宝马、三一重装),高质量的工业数据标注可以帮助训练视觉检测模型,实现产品瑕疵的自动识别,大幅提升质检效率和准确性。

  对于医疗行业,标注后的医学影像数据可以训练AI辅助诊断系统,帮助医生更早、更准地发现病灶。

  对于金融业,通过标注交易行为和文本数据,可以构建更精准的风控模型,降低信贷风险。

  对于互联网内容平台,高效的内容审核标注是其平台内容安全和用户体验的生命线。

  正如宏图创展董事长刘莉萍在采访中所言:“数据标注一定要从某些单一行业,成为一个‘数据海洋’,才有价值。”她将自己比作一头“饿狼”,必须时刻保持敏锐的嗅觉,在广阔的数据旷野中寻找下一片蓝海。她的公司业务已遍及全国各大主流车企,却深感本地应用场景开放不足之痛,这也反映了产业生态建设仍需努力。

  未来培育20家

  数据标注“专精特新”企业

  沈阳市数据局表示,下一步,沈阳市将强化技术创新和人才储备,计划到2026年底,引育超过2000名高水平数据标注人才,培育20家数据标注“专精特新”企业,打造具有全国竞争力的数据标注产业集聚区。

  当扫描车日复一日地穿行于沈阳的大街小巷,当标注员们在屏幕前点亮一个个数据点,他们不仅仅是在完成一项具体的工作,更是在为这座老工业基地浇筑通向未来的“数字基座”。数据标注,这个听起来科技感强的行业,正悄然成为沈阳在人工智能时代破局的关键落子,让冰冷的数据转化为驱动千行百业智能升级的温暖力量。

  沈阳日报、沈报全媒体记者 黄超

相关内容

热门资讯

香港受伤的12名消防员已出院 (来源:北京时间)转自:北京时间 【#香港受伤的12名消...
宜良县人民检察院第二届听证员拟... 为进一步深化司法公开,提升检察工作透明度和公信力,根据《人民检察院听证员库建设管理指导意见》《云南省...
路改桥!G104国道穿东淀蓄滞... (来源:天津广播) 【路改桥!G104国道穿东淀蓄滞洪区...
多所高校宣布,调整外语专业 近日,随着景德镇陶瓷大学在原有外国语学院基础上,整合文化研究、新闻传播、中文教育等方面的师资力量和软...
长城汽车:前11月累计销量11... 长城汽车12月1日晚间公告,2025年11月公司销量为13.32万台,同比增长4.57%;产量为13...