关于印发大同市国家级数据标注基地建设实施方案的通知

同政办发〔2024〕44号

各县(区)人民政府、大同经开区管委会,市人民政府各委、办、局:

《大同市国家级数据标注基地建设实施方案》已经市政府同意,现印发给你们,请结合实际,认真贯彻执行。


大同市人民政府办公室

2024年12月11日

(本文有删减)


大同市国家级数据标注基地建设实施方案

大同市国家级数据标注基地建设遵循国家数据局任务书要求,通过“以链带面,面状思维”发展数据产业的新思路,以“数据标注+算力中心”为两大基石,以高效率数据处理平台为技术手段,以建设高质量数据集和促进数据流通为目标牵引,以产教融合及职业院校为人才供给,以软硬件一体的安全环境为安全保障,最终形成以龙头企业为引领,中小企业蓬勃发展的数据标注产业新生态。

一、指导思想

以习近平新时代中国特色社会主义思想为指导,深入贯彻落实党的二十大、党的二十届三中全会精神,坚决履行省委赋予大同“融入京津冀,打造桥头堡”的历史使命,完整、准确、全面贯彻新发展理念,发挥数据的基础资源作用和创新引擎作用,以推动数据要素高水平应用为主线,培育新产业、新模式、新动能,充分实现数据要素价值,积极建设国家级数据标注基地,发挥数据要素乘数效应,赋能经济社会发展,打造具有山西特色的人工智能数据标注产业基地。

二、发展目标

按照“1234”的发展思路,充分发挥大同数据标注基地的示范引领作用。

“1”--1个产业链,即打造1条数据标注全产业链;

“2”--2条路径,即重点聚焦“算力”和“数据”2条建设路径,探索大同人工智能发展模式;

“3”--3个方向,即重点与京津冀对接,向山西各地市纵深,和内蒙、宁夏等算力枢纽节点联动;

“4”--4个赛道,即重点围绕“能源、文旅、农业、科技”4个赛道,深入挖掘人工智能技术,开放应用场景,建设高质量数据集,不断夯实人工智能产业发展基础。

在两年建设期内,以高水平标注产业云平台、高效率一体化数据处理平台和高质量数据集公共服务平台,共同构建“实体园区+云上园区”的新型产业生态,实现线上线下的融合发展,共同打造以数字文旅和智慧能源等行业多模态数据为特色的数据标注产业基地,标注数据规模达1770TB,构建8个以上行业高质量数据集,新增27家标注企业,带动标注从业人员3.5万人,拉动标注产业规模达11亿元,形成标注产业同国家人工智能重大生产力协同发展的产业生态新格局。

三、主要任务

(一)技术创新

1.打造研发一体化智能标注平台。目前已引入多家数据标注公司,在此基础上进一步邀请国内头部数据标注平台类企业入驻,吸引标注产业生态合作伙伴以线上、线下两种模式入驻,利用算力资源共同研发集数据预处理、标注、合成、评测等功能为一体的智能数据标注生成管理平台。实现平台并发访问量1000次以上、不同模态间标注的一致性不小于90%、语音识别标注准确率不小于95%、文本标注准确率不小于95%。(责任单位:市数据局;配合单位:市科技局,市经开区管委会和各县区人民政府)

(二)行业赋能

2.推动数据标注赋能千行百业。鼓励和倡导全市各行业和部门开放应用场景,在交通运输、医疗健康、教育教学、文化旅游、工业制造、智慧能源、城市治理、应急管理、农业农村、金融经济、商贸流通、气象服务、互联网治理等重点行业深入挖掘人工智能技术,打造“AI+千行百业”应用场景,推动传统行业与人工智能技术融合创新,两年内每个行业建设不少于两个行业数据集和两个可推广可复制的典型案例,推动传统产业数字化智能化转型发展。(责任单位:市交通局、市卫健委、市教育局、市文旅局、市工信局、市能源局、市城市管理局、市应急管理局、市农业农村局、市商务局、市气象局,市经开区管委会和各县区人民政府;配合单位:市数据局)

数字文旅:打造“数据要素×文物保存”范式,围绕“数字云冈石窟”项目,着力推动数据标注在山西文物保护领域的应用。开展石窟本体数据和各类档案数据的采集,依据文物数据资源量级的特殊性,对现有数据进行轻量化、清洗和标注。结合“数字云冈石窟”的经验,综合运用数据标注、人工智能、AR/VR等数字技术,打造数字化华严寺、数字化恒山等景点,采用线上线下结合的方式共同推进数据标注赋能山西数字文旅新业态。同时响应山西省文旅集团“国风吹晋山西”的号召,开展其他旅游景点的数字化工作,让用户足不出户即可随时随地体验到山西传统文化与风俗民情。(责任单位:市文物局、市文旅局;配合单位:云冈研究院、市数据局)

数字政务:对本市政务数据进行梳理,充分利用本地政务公文数据构建公文语料库和知识中心,推动人工智能大模型政务智能办公平台建设,打造“大同政务办公大模型”,建设包括政务文档智慧检索与智能问答、公文智能写作助手和公文检索生成能力等覆盖公文检索、审核、排版、填单、比对、查重的智能化应用,实现电子公文全生命周期规范化、高效化、智慧化管理,助力全市通用人工智能产业的高质量发展。(责任单位:市数据局;配合单位:市经开区管委会和各县区人民政府)

智慧医疗:以医学影像、临床病历、处置处方、检查检验等多源医疗服务数据标注为基础,打造“人工智能+医疗健康”试点;建设高质量医疗健康数据集,带动训练数据集的快速发展,以标注后医疗数据集为底座,对外提供安全合规的医疗健康数据集资源,满足AI及大模型客户对数据集资源在构建多阶段疾病诊断推理算法等多方面需求。围绕医疗领域患者快速分诊、医生问诊引导、诊断和治疗辅助决策、用药和病历书写助手、健康随访和宣教、肿瘤自动分析、全病历内涵质控、DRG分组与诊疗路径一致性分析等场景,推动大模型在医疗领域的应用。不断推广智慧医疗典型案例,扩大产业影响力,辐射山西、华北地区,带动区域医疗资源扩容下沉。(责任单位:市卫健委;配合单位:市数据局、各县区人民政府)

智慧能源:立足我市自身资源禀赋,在“人工智能+能源”领域先行先试,依托工业互联网建设,探索以人工智能赋能能源行业高质量发展,培育和发展新质生产力。重点围绕煤矿安全生产方面的应用场景,在大同地区开展先行示范,在已形成统一数据规范的煤矿,实现跨系统的流动与共享,未形成统一数据规范的应逐步规范数据标准,逐步实现跨系统的流动与共享。打造煤矿安全生产监控模型,并形成可复制可推广的典型案例。(责任单位:晋能控股集团、市能源局;配合单位:市工信局、市数据局、各县区人民政府)

智慧教育:搭建教育大模型从学习空间、学习资源、教师发展三个方面推动教育数字化转型和智能化升级,形成人机协同共生的教育新生态。逐步完善教育相关数据的保密机制、共享机制(房产、户籍信息)、交易机制。通过使用更加专业、深入的教育相关数据进行训练,并引入教育专业人士的参与和指导,对教育数据进行专业的标注和注释,完善教育大模型的术语、概念和规则,保证输出内容的专业性、可解释性及准确性,构建自主可控数据集,助力实现教育高质量发展。(责任单位:市教育局;配合单位:市数据局、市经开区管委会和各县区人民政府)

3.打造高质量数据集。构建交通运输、医疗健康、教育教学、文化旅游、工业制造、智慧能源、城市治理、应急管理等8个行业高质量数据集,赋能不少于20个行业大模型及传统智能模型研发。新建设的相关系统,应符合国家数据局关于高质量数据集的总规模要求,并可直接用于大模型训练。文化旅游、智慧能源等行业内高质量数据集规模至少要达到2024年中央预算内投资“行业高质量数据集试点工程”指标要求。(责任单位:晋能控股集团、市能源局、市文旅局、市文物局、市卫健委、市教育局、市交通局、市工信局、市城市管理局、市应急管理局;配合单位:市数据局)

4.搭建数据集公共服务平台。围绕我市人工智能业务场景,汇聚区域企业场景数据集、第三方数据集和自建自主知识产权的知识数据集,打造人工智能高质量数据集公共服务平台,面向企业及科研院所提供数据标注、交换共享、流通交易等数据资源一体化服务。打通数据开发、数据生产、数据交易、数据应用等环节,实现数据商品化和可循环的数据生态产业模式,完善大同人工智能数据产业链。(责任单位:市数据局;配合单位:市科技局、市经开区管委会和各县区人民政府)

(三)生态培育

5.组建大同市数字经济研究院。研究院与智库、企业、高校和科研院所展开合作,共同探讨研究数据标注技术、标准、生态等方面的发展趋势;每年定期推出《中国数据标注产业发展白皮书》;制定大同数据标注产业相关产业政策;负责推进大同数据标注基地建设的相关具体任务。(责任单位:市数据局;配合单位:市委组织部、市财政局、市委机构编制委员会办公室、山西大同大学)

6.加大数据标注产业资金扶持力度。积极争取上级专项资金,加大数据标注企业落地、市场开拓、人才培训、平台建设等方面的支持力度。各级财政做好省市级财政专项资金和相关资金的兑现拨付工作,保证资金尽早落实到位。(责任单位:市财政局、市数据局;配合单位:市经开区管委会和各县区人民政府)

7.加大数据标注企业引培力度。引导人工智能产业头部企业落地,建设自有的数据标注工厂,并向数据生产类企业提供订单;利用大同的算力优势,引导数据标注公司将其平台中心节点或区域节点部署在大同;通过不定期召开产业供需对接会,为本地中小企业对接数据标注订单;为数据标注领域的上市企业、独角兽企业将总部、财务结算中心、运营中心、研发及共享服务中心等在大同落地开设绿色通道。(责任单位:市促投局、市数据局;配合单位:市工信局、市商务局、市财政局、市税务局,市经开区管委会和各县区人民政府)

8.加大产业链企业招商力度。在大力发展数据标注企业的同时开展产业链招商,打通数据标注产业上下游,通过积极对接大模型、自动驾驶、AI工业质检、算力等企业,持续扩张数据标注行业广度和市场空间。同时,合理布局数据流通领域的招商工作,大力引进应用场景开发企业、数据安全服务企业和数据交易服务企业。(责任单位:市促投局、市数据局;配合单位:市工信局、市商务局,市经开区管委会和各县区人民政府)

9.加快算力基础建设。利用区位优势和骨干光纤专线,积极对接争取国家部委、全国性金融机构、头部企业、互联网龙头企业等在同布局云计算、智能计算业务,通过与京津冀枢纽张家口算力集群“结对子”方式,建设一批具有全国影响力的算力型行业数据中心,大力发展人工智能公共算力中心。(责任单位:市工信局、市数据局;配合单位:市商务局,市经开区管委会和各县区人民政府)

10.大力开展职场建设。在县区全覆盖的基础上,统筹区位发展优势,全力推动数据标注产业社区职场试点建设工作,支持和鼓励市属国有企业依托存量资产,通过股权合作、安置员工等方式,参与数据标注产业发展,进一步盘活国有资产,优化我市职场布局,为我省盘活国有资产,解决民生就业问题,提供大同思路。(责任单位:市国资委、市数据局、市经建投;配合单位:市经开区管委会和各县区人民政府)

11.打造中小企业孵化中心。通过构建数据标注产教融合实训平台,为中小企业提供信息沟通、人才招聘、人才培训、产业咨询、技术支持、创业帮扶、融资咨询、商业调研等综合性服务,组织整合、集成优化各类资源。(责任单位:市人社局、市数据局、市教育局、山西大同大学;配合单位:市经开区管委会和各县区人民政府)

12.举办大同数据标注产业研讨会。围绕数据标注产业,邀请全国数据标注产业专家、企业等相关人士,共同探讨产业现状及未来发展趋势,有针对性的开展精准营销,全面提升产业品牌影响力,吸引数据标注企业落地大同。(责任单位:市数据局;配合单位:市委宣传部、市财政局,市经开区管委会和各县区人民政府)

13.组织“数据要素×”案例征集活动。鼓励各行业主体利用大数据、人工智能等先进技术,开发具有创新性和实用性的数据应用解决方案,推动数据技术的创新和发展。广泛开展“数据要素×”案例征集工作,助力政府、高校、企业等开展基础性研究和应用性研究,不断提升学术界、实业界应用和创新能力,培育新质生产力。(责任单位:市数据局;配合单位:市委宣传部、市财政局、市教育局,市经开区管委会和各县区人民政府)

14.建设大同数据标注产业园区。打造集标准化职场、产业数据中心和生活服务配套设施于一体的数据标注产业园区。园区将根据数据标注产业发展趋势建设符合市场需求的标准化职场,在满足数据安全的基础上,依托大同数据中心,统一配置云电脑,并在园区内建设产业数据中心,打造大同数据标注产业云平台,为数据标注提供数据储存和计算服务,以提高工作效率并降低运营成本。园区将开展中小企业孵化、龙头招商和产教融合等多种形式的入驻方式,推动大同数据标注产业的快速发展。(责任单位:市数据局、市经建投;配合单位:市经开区管委会和各县区人民政府)

(四)标准化建设

15.推进数据相关标准制定。围绕行业赋能、数据流通、生态建设和实验室检测方向,开展《工业数据管理数据资产目录管理要求》行业标准和《数据质量评估指标体系通用指标要求》《数据质量评估实施方法》《公共数据授权运营合规指南》团体标准等四项标准的制定。鼓励企业、行业协会、高校、科研院所积极参与人工智能领域数据标准的制定,并开展相关标准的试验验证工作。(责任单位:市数据局;配合单位:市市场监管局)

16.建设数据集评测体系和标准化体系。鼓励企业、行业协会、高校、科研院所等,围绕人工智能高质量数据集,聚焦语音与图像等多模态数据,开展语音及图像数据集质量检验检测能力的建设,制定国家、行业、地方和团体标准。搭建人工智能和软件产品测试验证仿真环境,建设数据集检测室和软件检测室,开展相关标准的试验验证工作。(责任单位:市数据局、市市场监管局;配合单位:市委宣传部、市教育局,市经开区管委会和各县区人民政府)

17.推进标准化建设的广泛应用。结合大同传统行业及人工智能产业发展现状,推进相关过程标准化,并进一步扩大标准化范围,利用实验基地AI产品测试工作推进产品检验标准化推广;利用场景开发推进数据集的标准化推广;利用技术创新推进数据标注生产过程中的标准化建设;利用数据安全机制推进数据安全分级管理标准化和职场建设标准化工作,形成标准化推广典型案例。(责任单位:市数据局;配合单位:市经开区管委会和各县区人民政府)

(五)人才就业

18.健全就业机制畅通就业渠道。进一步完善《大同市促进数据呼叫(标注)产业发展若干政策》(同政办发〔2022〕42号),根据数据产业发展需要,制定出台《大同市促进人工智能领域人才高质量就业的若干措施》,满足未来数据产业蓬勃发展,人才高质量就业的需求。统筹公共就业和人才服务机构,提供专业的人才招聘、用工指导、信息发布等服务,对用工需求达到一定规模的,可举办专场招聘活动。(责任单位:市教育局、市人社局;配合单位:市数据局,市经开区管委会和各县区人民政府)

19.建立健全数据标注产教融合人才培养工作机制。建立以企业为主导、高校为支撑、产业技术攻关为中心的产教融合人才培养工作协调创新机制。负责全市数据标注人才队伍建设的统筹规划、政策协调和督促落实,完善现代职业院校和企业治理制度,积极推动双方资源、人员、技术、管理、文化等全方位融合。围绕生产性实训、技术研发、检验检测关键环节,推动校企依法合资、合作设立实体化机构,实现市场化、专业化运作,推进数据标注专业人才库建设,强化对数据标注人才队伍建设的考核激励。(责任单位:市教育局、市人社局;配合单位:市委组织部、市数据局,市经开区管委会和各县区人民政府)

20.打造国际一流数据标注人才聚集地。围绕全市数据标注产业发展需要,扩大数据标注人才培养规模。全面对接高校、企业、政府等机构,打造国际一流数据标注人才聚集地,推进高等院校、职业院校数据标注学科建设,每年培养不少于3000名专业化数据标注人才,推动形成“产业龙头+产教融合+专业职业学院”的产教有机互动人才队伍建设模式。(责任单位:市教育局、市人社局;配合单位:市数据局,市经开区管委会和各县区人民政府)

21.启动实施数据标注人才引进计划。根据我市数据标注产业发展的战略需求,出台数据标注人才引进专项计划,重点引进一批数据标注高层次紧缺人才。统筹招商引资和招才引智,加大我市数据标注人才政策和创新创业环境的推介力度。加强对高层次数据标注人才的跟踪服务,简化人才引进办事程序。(责任单位:市人社局;配合单位:市数据局、市委组织部、市促投局,市经开区管委会和各县区人民政府)

(六)数据安全

22.推动数据安全保护机制建立。成立数据安全责任工作组,从门禁、网络、监控等硬件设施上合理布局,从培训、日常管理、安全演习上进行整体规划,制定日常管理规章和演习应急预案,形成日常汇报机制,开展数据安全管理工作,确保数据安全。(责任单位:市委网信办、市公安局、市数据局;配合单位:市经建投,市经开区管委会和各县区人民政府)

23.推动建立数据安全溯源机制。通过区块链、数字签名等数据安全溯源技术,对数据标注企业的数据进行标签化溯源,追踪和记录数据的流动和变化过程,确保数据的可溯性和完整性。保护数据的可信性、可靠性和安全性,阻止数据的篡改、损坏和泄露。(责任单位:市委网信办、市公安局、市数据局)

24.推动数据标注基地安全设施建设。推动工作区域安全设施建设,工作区域需要实现视频监控无死角全覆盖,视频监控的录像需保留6个月,视频监控应覆盖所有工位,并监控到工位上人员动作、电脑屏幕内容及操作情况;配备门禁系统实现访问控制,使用防尾随功能的全高旋转门或者速通门,门禁系统具备反潜、自动闭合的能力。(责任单位:市数据局;配合单位:市经建投,市经开区管委会和各县区人民政府)

25.推动数据标注基地安全软件建设。在软件方面,职场需要具备VPN办公能力,能支持在家远程办公,并且保证网络稳定性及可用性;用于客户的专属VLAN必须与其他VLAN实现必要的隔离(通过防火墙或者网络ACL),隔离规则的制定和修改需经过客户审核通过方可执行。(责任单位:市数据局;配合单位:市经建投,市经开区管委会和各县区人民政府)

26.推动数据标注基地人员保密培训。建立数据标注从业人员数据安全保密培训体系,以国家数字经济与人工智能政策为引导,开展宏观政策以及行业背景普及培训,制定完备的数据安全培训流程,提升数据安全性和保密性。(责任单位:市人社局、市委保密办;配合单位:市数据局)

四、组织保障

(一)构建数据标注产业发展领导体系

成立大同市国家级数据标注基地建设工作专班,构建部门协作、分工负责、管理高效、整体推进的工作格局,其中数据标注人才培养由教育、人社部门负责;资金扶持由财政部门负责;知识产权保护由市场监督管理部门负责等等,各相关责任部门要根据职责分工,抓紧制订相应的实施细则,共同推动人工智能数据标注产业实现快速发展。(责任单位:市国家级数据标注基地建设工作专班成员单位)

(二)引入智库统筹产业规划

引入国家级智库在大同建立分中心,编著《大同市数据产业发展三年行动计划》,立足我市实际情况和优势不足,明确城市定位、发展目标、重点领域和关键举措,形成独具大同特色的数据标注发展路径。(责任单位:市数据局;配合单位:市发改委、市工信局、市科技局、市商务局,市经开区管委会和各县区人民政府)

(三)加强对外宣传

学习借鉴先进城市的经验和做法,加强对大同市国家级数据标注基地的整体包装,提高品牌知名度和行业美誉度。市经开区和各县区要加强对本地数据标注企业的宣传包装,将一批成长性好、特色鲜明的数据标注企业推向全国以及国际市场。(责任单位:市委宣传部;配合单位:市财政局、市数据局,市经开区管委会和各县区人民政府)

(四)完善考核机制

将国家级数据标注基地建设和产业发展目标纳入各级政府部门综合考核指标,对相关单位、部门进行考核,有效推动数据标注基地建设和产业发展相关工作任务的落实。市经开区和各县区要按照“目标明确、责任清晰、措施有力、绩效考核”的原则,加大工作的考核督查力度。(责任单位:市委组织部;配合单位:市经开区管委会和各县区人民政府)

(五)出台专项政策

对标国内其他城市政策,结合我市实际,编制和出台大同市促进数据标注产业发展的专项政策体系,完善对人工智能数据标注产业的政策扶持。重点支持技术创新、载体基地和平台建设,大力扶持人工智能企业开展市场开拓、研发创新、品牌打造、国际认证、版权登记、人才培养等业务。(责任单位:市数据局、市科技局;配合单位:市发改委、市财政局、市工信局、市人社局、国家金融监管总局大同监管分局、国家税务总局大同市税务局,市经开区管委会和各县区人民政府)

五、工作步骤

第一阶段:全面启动阶段(2024年8月—2024年11月)

成立建设工作专班,组织召开动员大会。科学编制产业发展任务书和规划,制定产业发展实施意见等,细化分解目标任务,明确责任职责。广泛发动宣传,构建市县联动、部门协同、社会参与的浓厚氛围。同时,按照工作时序要求,做好相关资料的收集、整理和完善。

第二阶段:建设提高阶段(2024年12月—2025年10月)

各责任单位要对标国家数据局对国家级数据标注基地的评价指标体系和责任分工,持续强化调度推动,补齐差距短板,实现各项指标全面达标。同时,按照工作时序要求,做好相关申报工作,及时跟进国家数据局对标注基地建设工作的指示。

第三阶段:评价验收阶段(2025年11月-2026年1月)

持续深化建设工作,对标要求,抓好问题整改落实,为我市国家级数据标注基地建设工作交出满意答卷,如期高质量通过国家数据局考核。


                        该类型已订阅

很抱歉,暂无相关信息

拨打助企热线

免费获取一对一政策申报建议服务

在线客服(点击咨询)

  • 【科小申报】认定成功科技型中小企业,奖励3万元
    奖励3万元 资质认定
    立即评测
  • 【忻州市】省级新型研发机构申报
    立即评测
  • 【长治市】省级新型研发机构申报
    省级20万元 市级10万元
    立即评测

客服电话

固定电话:

手机号码:130 9907 7097 139 3512 8636

微信客服

公众号

在线QQ

QQ咨询

需求提交