人工智能行业的发展催生基础数据服务产业。当前,在市场需求提升、政策环境利好的情况下,人工智能基础数据服务产业持续扩张。从实践来看,人工智能基础数据服务产业能够有效推动传统资源型城市、工业型城市、内陆型区县以及生态型区县的转型和振兴,实现区域的可持续发展。
数据、算法、算力是人工智能的三大核心要素,其中数据是人工智能算法模型开发和迭代的基石。以深度学习为代表的人工智能算法从设计、训练、评测到更新迭代的全生命周期都需要持续不断的“结构化数据”输入作为支撑,而从自然数据源简单收集取得的原料数据大部分为“非结构化数据”,必须经过专业化的采集和清洗、标注等加工处理完成结构化的转变,才能激活数据价值,满足各类人工智能算法模型训练使用的技术需求。因此,人工智能基础数据服务产业应运而生。
图1 人工智能基础数据服务产业链
资料来源:公开资料整理,普华永道分析
中国人工智能产业在新理论、新技术演进以及经济社会发展需求的共同驱动下,呈现高速增长态势,带动基础数据服务产业市场规模飞速扩张。一方面,随着人工智能已落地场景的不断拓展完善,基础数据服务成为存量市场算法迭代的刚需;另一方面,不断涌现的新型应用场景催化基础数据服务增量市场持续扩容。据IDC数据测算,2023年中国人工智能基础数据服务市场规模将超过70亿元,并将在2025年突破120亿元,2019-2025年年均复合增长率(CAGR)约为47%。
图2 中国人工智能基础数据服务市场规模(亿元)
数据来源:IDC,普华永道分析
从市场主体分布看,基础数据服务头部企业总部高度集中于人工智能产业基础雄厚的地区,随着北京、上海、深圳等人工智能产业领先地区企业加速成长,新应用、新场景不断涌现,将持续吸引人工智能相关企业进一步集聚。同时,数据标注项目逐步下沉至全国各地,呈现分散布局态势。当前,全国已经有超40座城市布局数据标注项目或基地,在河北、河南、山东、陕西、四川、湖南、新疆等地区多点开花,为劳动力密集地区创新创业、传统工业地区产业转型带来发展新机遇。
图3 人工智能基础数据产业基地分布示意
资料来源:公开资料整理,普华永道分析
伴随着如ChatGPT、Stable Diffusion等现象级生成式人工智能产品破圈,人工智能预训练大模型已成为人工智能领域的发展热点。当前,人工智能大模型开发正围绕“大算力、优数据、强算法”展开激烈竞争,专业处理过的训练数据将成为大模型开发的关键基础要素和价值跃迁的“赛点”。根据对行业发展规律和海外企业实践的观察,大模型发展预期将为国内数据标注行业带来业务需求增长、人员素质提升的重大红利,推动数据标注行业步入发展快车道。
训练数据市场需求呈现体量、难度、效率、合规性持续上升的趋势,智能化升级、数据安全管理将成为未来数据服务商重点发展的方向。一方面,头部企业已在数据采集、标注、质检等各个环节探索引入算法辅助,智能化人机耦合的数据服务模式将大幅扩大产能、提高质量、降低成本,是行业大势所趋。另一方面,随着《数据安全法》《个人信息保护法》《汽车数据安全管理若干规定(试行)》等法律法规相继实施,基础数据服务行业法律环境不断完善,数据安全和隐私保护将成为数据服务企业生存的关键。
党的十八大以来,党中央高度重视发展数字经济,将其上升为国家战略。人工智能是数字经济创新发展的前沿和焦点,作为人工智能产业链必不可少的重要环节,基础数据服务对所在区域培育人工智能产业、促进上下游产业集聚、塑造发展新动能新优势等方面起到积极作用。
人工智能基础数据服务行业进入门槛较低,对大多数高端人才、产业资源有限的三、四线城市而言,发展基础数据服务产业有望成为以较低成本切入人工智能赛道的最优选择。此外,布局基础数据服务能够推动地方数字经济纵向延链升级,衍生出数据分析、数据治理等数据应用服务,或横向扩展赋能,推动数字经济和本地实体经济融合发展,助力打造区域特色化产业应用生态。
基础数据服务帮助促进就业,增强创新创业发展动能。
数据标注产业入行门槛低、培训上手快,为大量高职院校学子或职业转型受阻的人群提供数字经济领域的就业创业机会。此外,从职业自身发展路径来看,基础数据服务也逐渐从劳动密集型行业向智能化、专业化方向发展,对从业人员行业专业知识、逻辑思维能力的要求逐步提升,从业人员收入逐年提高,能够成为三、四线城市留存高质量人才的有力抓手之一。从海外实践看,数据标注企业Surge AI在为Open AI提供服务时,曾专门招募具有数学或STEM学位的员工组建标注团队,顶级标注员薪酬可达25美元/小时,国内数据标注行业未来仍具有广阔的发展空间。
基础数据服务利于去化物业,带动商业配套发展。
在过去十年间,全国多地过度扩张产业园、写字楼建设,导致园区空置率高、经济效益低,引入基础数据服务产业和项目,有助于盘活闲置资产,提升物业去化率,提高周边区域活力。同时,大量劳动人口迁入将有效提升当地消费活力,拉动周边餐饮、交通、零售、娱乐等商业配套和基础设施完善。以百度山西数据标注基地为例,落地以来,众多生活服务类商户在基地周边集聚,带动开设幼儿园、超市、饭店、洗车店、娱乐场所等50余家,为服务业带来超千万元收入。
人工智能基础数据服务产业可助力多种类型区域实现产业发展破局、提质增效,赋能城市可持续发展。
山西省是国家重要的能源和工业基地,是典型的资源型地区,“转型升级”成为产业发展的重要课题。2018年,山西转型综合改革示范区与百度合作共建人工智能基础数据产业基地,创造了资源型地区加快转变经济发展方式的新模式。
运营模式
基地由政府提供办公场所与资金支持,百度智能云负责基地运营和品牌建设,入驻企业开展基础数据服务相关业务的具体实施,三方协同合作,实现共赢。基地依托百度人工智能技术基础与资源优势,通过搭建数据标注平台,为入驻企业提供标注工具、作业管理和运营经验,并帮助企业组建团队、开展培训以及导入业务资源,持续孵化培育企业,形成本地基础数据服务和创新能力,逐步打造产业集群。
建设成效
挖掘政企诉求,拓展业务布局。
一是横向拓展业务场景,聚焦本地政府与本地特色产业需求,关注政务服务、社会治理、数据安全等政府端业务增长点,和自动驾驶、智慧工业、智慧医疗等企业端业务增长点。二是纵向延伸产业链条,例如聚焦数据产品深加工,提供数据分析、数据治理等增值服务,探索数据交易,或拓展标注工具开发、算法研发、软硬件服务等技术研发业务,提升企业技术含量与商业价值。
严守数据安全,迭代升级技术。
一是搭建完善的数据安全防护机制,加大核心技术投入,提升数据加工、分析处理阶段的隐私安全保护能力。二是探索MaaS模式(Model as a Service,模型即服务),将数据标注业务沉淀为适配特定领域数据的自动化标注模型,以基于自动化标注模型的MaaS模式提升人工标注效率,筑牢基地核心业务护城河。
引入基础数据服务基地,助力产业蓬勃发展。
一是强化顶层设计,研究制定人工智能基础数据服务产业规划,积极推动引入数据标注基地,优化区域产业布局。二是着力培育人工智能基础数据服务产业领军企业,积极引入龙头企业,带动产业链上下游协同发展,形成产业生态集群。
推动专业人才培育,提高从业人员能力。
一是探索产学研人才培养机制,大力发挥校企联合培养优势。二是推动建立人工智能基础数据服务相关的专业学科建设,着力培养高端人才,提供从业人员综合职业水平。
在当前人工智能发展热潮中,基础数据服务企业需基于自身禀赋和行业发展趋势调整战略定位、优化业务布局,而地方政府面对全国范围内的数智化竞争优势重构,也需积极探索基础数据服务产业等数字经济切入新路径。普华永道持续关注城市可持续发展,依托专业的行业洞察、丰富的产业经验、深度的政策理解以及遍布全球化的网络资源,为城市可持续发展提供智力支持和解决方案。