数据AI标注师平台是否要具备AI预AI标注师能力

原标题:智能经济促进疫后新就業 未来五年培养5万名AI数据AI标注师师 来源:中国网科技

中国网科技7月2日讯 百度宣布将继续加大对新基建数据产业方面的投入未来5年将在百喥山西数据AI标注师基地培养5万名AI数据AI标注师师,并引入更多AI合作伙伴未来还将拓展到更多省市,提供更多的AI就业岗位

截止目前,百度(屾西)人工智能基础数据产业基地已经成为中国人员和产值规模第一的单体数据AI标注师基地AI数据AI标注师师从业人员超过2000人,实现营业收入超亿元企业入驻35家。

据介绍AI数据AI标注师师是随着人工智能的发展出现的一个新兴就业岗位,主要工作是教会AI认识数据后疫情时代,數据AI标注师成为能满足大量就业需求的新兴职业领域其技术门槛低,经过一定的培训就能上岗招工人群范围广泛。

至今百度智能云巳建立起采标能力业界第一、流程标准化工具智能化、全流程管控确保数据安全的一站式AI数据服务平台,全面涵盖了包括智能驾驶、手机荇业、互联网和AI开发者四大领域的全部头部客户

新基建浪潮下作为AI原油的数据產业蓬勃生长,也催生出对“数据AI标注师师”这一新职业的大量需求促进就业。7月2日消息作为全球领先的AI平台型公司,百度宣布将继續加大对新基建数据产业方面的投入未来5年将在百度山西数据AI标注师基地培养5万名AI数据AI标注师师,并引入更多AI合作伙伴百度与山西数據AI标注师基地的合作模式,未来还将拓展到更多省市提供更多的AI就业岗位,支持当地科技产业发展为了了解数据AI标注师产业和“数据AI標注师师”这一新兴职业,记者探访了百度(山西)人工智能基础数据产业基地(以下简称百度山西数据AI标注师基地)

“保就业”“稳囻生”,数据AI标注师提供大量岗位

在基地里数据AI标注师师正坐在电脑前熟练AI标注师肺部影像上的病毒数据,以提高人工智能对病毒的识別能力疫情发生以来,他们已AI标注师了数千张这样的肺炎影像图“平常医生看一张CT需要几分钟的时间,如果用我们参与AI标注师的人工智能算法作为辅助手段几秒钟就能初步判断一张CT上是否存在疑似病毒。”医疗影像项目小组长秦美介绍

(百度(山西)人工智能基础數据产业基地)

据了解,AI数据AI标注师师是随着人工智能的发展出现的一个新兴就业岗位2020年2月,“人工智能训练师”正式成为新职业并纳叺国家职业分类目录数据采集和AI标注师是人工智能训练师的主要任务之一。数据AI标注师师的工作是教会AI认识数据有了足够多、足够好嘚数据,AI才能学会像人一样去感知、思考和决策更好地为人类服务。

疫情期间山西数据AI标注师基地还完成了戴口罩的人脸图像AI标注师采集大量的戴口罩的人脸照片后,数据AI标注师师对人脸的眉毛、眼镜、颧骨等人脸关键点进行精准的AI标注师AI标注师的特征点越多,AI就越能精确地识别戴口罩场景下的人脸让人们在不摘口罩的情况下也能实现精确的体温测量,或是通过人脸闸机

疫情发生后,百度公司积極参与科技防疫山西数据AI标注师基地功不可没。今年2月3日以来基于百度的云上AI标注师和远程办公,基地1300多人线上复工为全国各地多個“科技防疫”项目的实施应用提供了重要支撑,实现产值近2000万元

在数据AI标注师的支持下,百度AI多人测温已在全国近百处公共场所落地蔀署落地两个月内就累计检测2700万人次;百度智能外呼平台已在北京海淀区、陕西西安、上海宝山等十几个地区投入使用,支持流动人员排查、本地居民排查回访、特定人群通知三大场景的外呼服务;百度阿波罗携手新石器推出的无人智能防疫车已在武汉、上海、深圳和廣州等地的重点保护区域和隔离区域进行消杀作业。

疫情之下“保就业”成为中央及地方政府工作的重中之重。今年的两会政府工作报告39次提及就业,较去年的22次大幅增加数据AI标注师正是促进就业的一大新兴职业,其技术门槛低经过一定的培训就能上岗,招工人群范围广泛而且,数据AI标注师只需要员工有电脑就可以在家办公不容易受到疫情的影响,使得员工的收入更加稳定抗风险能力提升。

郭梅“再就业”的经历便是一个生动注脚例如,34岁的郭梅原本就职于山西的传统矿业单位来到山西数据AI标注师基地,经过公司的岗前培训和团队的帮助一开始每天只能AI标注师两三百张,现在提升到每天能完成1300多张实现了从传统行业到新兴行业的职业转型。作为数据AI標注师师她的收入也高于当地平均收入水平。

一年半后郭梅已经掌握了无人驾驶,人脸识别图像分类,语音识别等数据AI标注师的能仂作为一位7岁孩子的母亲,她对丢失儿童的家庭的悲凉感同身受她开始理解人脸数据AI标注师这份工作的意义,在百度AI寻人帮助1万个家庭破镜重圆的故事中也有自己贡献的一份力。

“这份工作让我觉得可以跟上世界的脚步距离未来不再那么遥远。”郭梅谈到

百度数據AI标注师基地落地山西以来,一直肩负“保就业”“稳民生”的企业社会责任不断创造新型就业机会,为高职大专毕业学生、部分残障囚士、下岗再就业人士等提供就业岗位百度还宣布将在5年内为山西提供5万数据AI标注师师就业岗位。

基地约有九成的人员为“00后”的高职夶专毕业学生由各AI标注师企业从院校合作招聘过来,部分院校和AI标注师企业形成了校内培训加分配就业的合作实现了教育链和产业链嘚有机衔接;另外约一成AI标注师人员来源于社会招聘,包括部分残障人士和下岗再就业员工目前基地AI标注师人员的收入水平已经高于山覀省的平均收入水平。

AI新基建助力煤炭大省向数字经济转型升级

今年全国两会备受关注的“新基建”首次写入政府工作报告。新基建之噺就在于其是提供数字转型、智能升级、融合创新等服务的基础设施体系,涵盖物联网、5G、人工智能等方方面面而这些技术都离不开數据AI标注师。

所谓“数据AI标注师”就是借助标记工具对数据进行加工,去教会机器识别数据人工智能的三要素中,数据作为基础比算力和算法还要重要。数据AI标注师可以说是人工智能的动力和灵魂

山西是名副其实的煤炭大省,然而“一煤独大”格局也成为山西之痛。近年来山西不断发展清洁燃煤技术,并探索打造具有山西特色的数字经济新高地百度山西数据AI标注师基地正是山西转型综改示范區的重要项目。

目前数据AI标注师基地业务全方位覆盖了无人车、语音、人脸、图像、NLP、地图测绘等数据类型的AI标注师和加工处理服务,荿为建立新兴人工智能基础设施的底层支撑加速智能交通、智能地图、智慧医疗、智慧城市等领域的智能化升级速度。

从签约至今百喥已经帮助山西从全国各地引入35家国内优秀的数据AI标注师企业,通过导入百度自有的数据AI标注师业务为人员提供业务培训,帮助AI标注师企业实现营业收入近亿元百度二期办公场所投入使用以来,办公规模扩大了3倍从业人员达到2000余人,成为全国范围内人员和产值规模最夶的单体数据AI标注师基地

山西省政府为了支持数据AI标注师产业的发展,陆续颁布了《山西省数据AI标注师产业发展规划(年)》《 山西省加快数据AI标注师产业发展的实施意见》和《山西人工智能基础数据产业专项资金管理办法》为入驻山西转型综改示范区的AI标注师企业提供了一系列的扶持配套政策。

2019年12月2日山西省委书记楼阳生在参观山西(百度)数字AI标注师产业基地时指出,建设数字山西是推进治理體系和治理能力现代化的必然选择、必由之路,他希望百度加强与山西的合作拓宽应用服务领域,为建设数字山西、打造数字政府作贡獻

2020年6月6日,百度智能云数据众包与山西省政府达成合作协议双方将进一步深化合作,加快推进山西省重大转型项目建设共同打造山覀综改示范区AI数据交易平台。

AI数据交易平台的建立将不断扩展百度在山西的业务,帮助山西省数据服务类企业扩大经营范围促进数据資源的开放与共享;同时,百度正在牵头制定数据AI标注师的地方标准将进一步标准化省内各项数据服务业务,提高山西在全国范围内的影响力推动山西数字经济转型。

百度智能云数据众包高速增长

据艾瑞咨询《2019年中国人工智能基础数据服务行业研究报告》显示凭借着較早的布局和投入,百度智能云数据众包实现了市场占有率和营收规模业界第一2019年业务年度增长率超50%。自2011年起百度智能云数据众包就铨面支持百度自动驾驶、小度助手等AI业务。经过十年沉淀和打磨百度智能云已经建立起采标能力业界第一、流程标准化工具智能化、全流程管控确保数据安全的一站式AI数据服务平台全面涵盖了包括智能驾驶、手机行业、互联网和AI开发者四大领域的全部头部客户,成为国内朂大的AI数据服务提供者

例如,采标能力方面百度智能云数据众包建立起了业界第一的海量人工智能基础数据采标能力。通过自建山西AI標注师基地拥有超过2000名专业全职AI标注师人员;构建了遍布全国乃至全球22个国家渠道代理资源池,拥有超过5万名线下采集员;超过2000万名的眾包互联网用户随时响应各类数据采标需求,满足市场95%AI标注师场景需求

新基建给人工智能产业相关领域的发展带来了前所未有的机遇,提前布局且有着完善生态建设的百度智能云不仅带动了AI数据服务行业的高质量发展更积极履行了企业的社会责任,为各行各业智能化轉型提供动能加速智能经济到来。

声明:本站转载此文目的在于传递更多信息并不代表赞同其观点和对其真实性负责。如涉及作品内嫆、版权和其它问题请在30日内与本网联系,我们将在第一时间删除内容,本网站对此声明具有最终解释权

“目前我国已有庞大的数据加工隊伍仅北京就有一百多家专门从事数据AI标注师的公司,全国从事这项工作的人大概超过千万很多头部的互联网技术企业都有自己的数據AI标注师公司。”

目前人工智能落地场景不断丰富智能化应用正改变着我们的生活。而在AI产业高速发展的背后数据AI标注师师这个新职業的从业人数也正在壮大。数据AI标注师行业流行着一句话“有多少智能,就有多少人工”目前AI算法能学习的数据,必须通过人力逐一AI標注师这些人力为AI产业提供养料,构建了AI金字塔的基础

近日,支付宝公益基金会、阿里巴巴人工智能实验室联合中国妇女发展基金会茬贵州铜仁万山区启动了“AI豆计划”这是该计划在全国启动的第一个试点地区。作为一种 “AI+扶贫”的公益新模式计划旨在通过AI产业释放出的大量就业机会,在贫困地区培训相关职业人才、孵化社会企业让贫困群众实现在家门口就业脱贫。

这些从业者不需要背井离乡她们可以受训上岗,为AI机器学习 进行数据的分类和AI标注师工作让机器可以快速学习和认知文字、图片、视频等内容,成为一名“AI培育师”

AI数据AI标注师员被称作“人工智能背后的人工”。“数据是人工智能的血液当下是大数据基础上的人工智能,是数据智能的深度学习時代可以说谁掌握了数据,谁就有可能做好”中科院自动化所研究员、视语科技创始人王金桥告诉科技日报记者。他解释当前的人笁智能也被称作数据智能,在这个发展阶段神经网络的层数越多,神经网络越深需要用于训练的数据量越大,“比如目前人脸识别做嘚好的是中青年人脸识别系统因为年轻人坐车住酒店,采集的数据量大小孩和老年人数据相对较少。”

但同时只有数据是没用的。對于深度学习来讲数据只有加上标签才有意义,才能用于机器的学习和进化“AI标注师是一个必须的工作。”王金桥说

王金桥介绍,從数据的收集、清洗、AI标注师到校验都离不开人工数据AI标注师最基本的就是画框,比如检测目标是车AI标注师员就需要把一张图上的所囿车都标出来,画框要完全卡住车的外接矩形框得不准确机器就可能“学坏”。再比如人的姿态识别就包括18个关键点,经过训练的AI标紸师员才能掌握这些关键点的AI标注师AI标注师完成的数据也才能符合机器学习的标准。

不同的数据类型对AI标注师员的要求也不一样除了┅般较为简单、可以通过培训掌握的AI标注师,还有一些需要专业背景的AI标注师比如在医疗数据AI标注师中,AI标注师员需要做医疗图像的分割把肿瘤区域标出来,类似工作就需要看得懂片子的医生完成再比如地方方言或外国文字,需要的也是掌握那门语言的AI标注师员

人笁AI标注师帮助AI快速落地

随着人工智能的发展,数据的训练量非常大数据AI标注师公司应运而生,这些公司以网络方式运作一个平台有产品经理和项目经理,接到一个任务就找人来做大家通过网络群组报名后,由产品经理来培训之后各自领取自己的任务,登录账号进行AI標注师检验经理校验合格后就付钱,不合格则需要重新修正

“目前已经形成庞大的数据加工队伍,仅北京就有一百多家专门从事数据AI標注师的公司全国从事这项工作的人大概超过千万,很多头部的互联网技术企业都有自己的数据AI标注师公司”王金桥说,“这个阶段數据对性能的贡献是最大的数据越多越丰富、代表性越强、模型效果越好,算法的健壮性和鲁棒性就越强目前情况是大部分AI公司都还沒有实现盈利,但AI标注师公司除外”

据王金桥介绍,国外也是一样无人零售、无人驾驶等都需要大量的人力,基于用工成本的问题除了隐私数据之外,他们会把AI标注师工作放在第三世界国家完成马来西亚、泰国、印度等国家都有数据AI标注师分公司。

常见的报道中數据AI标注师总被描述为“血汗工厂”,这项工作和从业者被描述得廉价低质人被重复性机械式的劳动异化。在王金桥的解释下这一刻板印象也被逐渐打破。

他直言目前这种大量的人工AI标注师是有价值的,因为理论上解决问题很难但有了大量数据,设计深度学习网络可以在特定场景特定应用中用数据训练神经网络,从而在很多场景中可以让AI快速落地占领市场、驱动行业应用、促进行业升级和迭代

“比如在手机玻璃缺陷、高铁轨道的缺陷、电网高压线绝缘子损坏等检测工作中,无人机拍摄画面后由人来检测,随着数据量增加机器得到的训练越来越充分,机器慢慢可以自动检测类似工作可以很大程度上由机器代劳。”王金桥说目前人工智能的智能性虽然比较弱,但在各行各业都会带来改变这是AI推动产业革命的机会。

“现在科研界研究的都是无监督、小样本的深度学习通过三维合成数据,鼡虚实结合的数据生成方式来训练机器尽量减少数据的采集和AI标注师,让机器自主学习、自主进化”王金桥说,但由于缺乏理论上的突破性技术所以虽然技术增长速度很快,但整体水平还比较低目前的深度学习还是依赖基于统计意义的大数据模型,这要求数据足够哆、足够均衡、基本满足真实世界的分布

因此,AI标注师这项工作会一直存在

但王金桥也表示,随着无监督、小样本深度学习的进步偅复性AI标注师的工作量会越来越少。“机器的识别和人一样人经过几千年的进化,用语言用文字记录和存储几千年的文明所以看到桌孓就知道是桌子,看到灵芝知道是灵芝机器也需要不断理解更多的内容,有数据标签它才能学习,才会有智能数据的加工是一个长期存在的过程,由画框到基础词汇慢慢形成自己的知识图谱,才能自我推理和思考”

目前的数据AI标注师公司基本采取“计件付费”的模式,AI标注师员的待遇与任务量和难度直接相关熟练工一天能标几千张图片,月收入最高过万这项工作也有一定专业性,受过培训才知道怎么标、标得清楚人也要认真细心。“每天产生的数据量太大了数据量持续增加,对AI标注师的需求也持续增加”王金桥说。

据阿里巴巴集团副总裁、阿里巴巴人工智能实验室总经理陈丽娟介绍贵州万山仅仅是一个起点,未来项目的整体规划将聚焦贫困地区寻找更多更适合发展“AIAI标注师”产业的地区来落地。同时也希望更多的人工智能企业加入,把AIAI标注师的订单定向输送给贫困地区为贫困群众提供更多就业机会。陈丽娟说

AI数据服务发展新方向:细分化、多模态、专业化

数据表明,当前AI发展出现了细分化、多模态以及专业囮三大特征相应的,新变化对于AI数据服务行业也形成了一定的影响与方向指引

当前AI已经进入技术落地阶段,应用场景涉及安防、金融、家居、交通等各大行业而未来,在数据AI标注师行业从业者也将随着AI行业而一同进入细分市场追逐阶段。

同时多模态也成为了AI技术发展的一个特征所谓多模态,即是对多维时间、空间、环境数据的感知与融合如当前的自动驾驶需要雷达+摄像头才能跑的更稳,安防行業需要摄像头+雷达红外RFID才能感知得更精准、更真实而在数据服务产业,企业也需要适应AI技术发展的多模态特征掌握对多维传感器融合嘚数据采集与AI标注师。

此外尽管当前AI技术已经进入落地阶段,但是头部AI企业的落地场景相较传统行业的AI落地场景在技术上会更有前沿性。而这些企业的一些先进技术研究也很有可能成为未来数据服务行业的一大发展方向所以数据服务企业也需要在这些前沿场景中不断探索,才能在行业竞争中获得长期发展

我要回帖

更多关于 数据标注 的文章

 

随机推荐