人工智能背后的人工

摄影 | Chin Chen 编辑 | 米杜 董淑云 新浪图片出品

人工智能,当今全球最炙手可热的前沿科技,已经悄然进入了人类生活的各个方面。人工智能看似高深莫测,但其背后必不可少的要素之一,供机器学习的大数据采集工作,如今依然出自人工之手。这是中国贵州大数据展示中心的时光隧道,在这里的深山之中,就有一群大数据采集者,他们是“人工智能背后的人工”。

人工智能背后的人工

                                             文/Chin Chen

  “嗒嗒嗒”的鼠标敲击声在偌大的办公室里交汇着,一个眼圈发红的女孩眼睛牢牢地盯住电脑屏幕,她所需要做的是把图片中放置在冰箱的饮料名称和类别一一对应起来。

  面对不太常见的饮料,她在右下角的菜单栏里不停地翻阅着“碳酸饮料、乳制品、凉茶”等类别。一轮过后,还是没能找到这瓶饮料的名称。她开始有点焦急,抬起头来看了看周围的人,然后又埋头在茫茫大海中“捕捞”着。

  不久后,她分类标注出来的这些数据将用于智能冰箱的物体识别。

  近几年,随着AlphaGo击败人类顶尖围棋选手李世石、柯洁等一系列事件,人工智能开始逐渐走红。而人工智能需要大量的数据来供机器深度学习,这些数据正是出自这群隐形者手中,他们是“人工智能背后的人工“。

贫困山区里的大数据“硅谷”

  在过去数年,大数据、人工智能逐步走进社会成为公众话题。而位于西南贫困山区的贵阳,从2014年开始扛起了大数据战略的大旗,致力成为中国大数据的“硅谷”。

  从贵阳市区沿着刚修好的公路驾车50多公里,就到了百鸟河数字小镇上,道路两边的松树站得齐刷刷的,一列又一列。小镇四面环山,人迹罕至,去年因举办了人工智能服务论坛逐渐被外人所知。

  在这里,有着一个能容纳400多人的数据工场,电脑前坐满了来自附近一家扶贫高职的学生,他们流程化地框图或处理语音,这些大量标注好的数据将用于“人脸识别、无人驾驶、语音识别”等高科技项目。

  在1000多平方的标注服务部里,学生们被划分成不同的小组:有的负责把道路上的汽车、行人、红绿灯等框起来,用于自动驾驶的训练;有的负责把每一段语音记录下来,用于语音识别;有的负责把视频抽出几帧,用于机器对运动物体的识别。

“数据标得再好,还是没有前途”

  小纯是扶贫高职的一名学生,这个寒假,她并没有像以往一样早早回家。临近期末的一节宣讲课上,小纯第一次听到了“人工智能”这个词便被吸引住了,她毫不犹豫地报名参加了数据工场的实习。

  小纯每天从学校来到办公室的第一件事便是打开电脑,登录众包平台,那里有着2000多个图片拉框任务等着她完成。

  数据标注作为一个劳动密集型行业,门槛并不高。经过几天的培训,小纯很快就上手了。框图要求十分精细,每一个物体边缘都需要放大对准,小纯每天从早上九点框到晚上八点,这时常让她的眼睛感到疲劳。

  小纯的桌上摆着一盆万年青,旁边的苹果已经开始腐烂。小纯坐在电脑旁,翘着腿,时不时抖动一下,目光没离开过屏幕。邻座的胖子对她说话的时候,她还是一动不动地保持姿势回答,不想让说话影响了自己的进度。

  小纯电脑屏幕上的道路指示牌上写着“北六环”,这显然是一条北京郊区的高速公路。她右手拖动鼠标,为道路图片中的车辆和行人打上边框,并标注行进方向和是否有遮挡,连续框了十几张完全一样的道路图片后,她看起来有些无聊。

  时常待在山区里,小纯对被自己框住的汽车一概不了解。一边是一线大城市的自动驾驶研发,一边是贫困山区中坐在电脑前框图的高职学生,小纯和同学们源源不断地为北上广深的人工智能公司提供数据,但他们之间存在着被忽视的数据折叠。

  “SUV到底长什么样?无人驾驶是不是真的安全?以后还要不要考驾照?”小纯好奇地问着。她经常会把答案寄托于我这个外来者身上,时不时回过头来对我使着眼色。

  小纯每天上班七八个小时,一个月能挣两千元,她很珍惜这个相对体面的挣钱机会。二十天的工期里,还不太熟手的她拿到了800元。腊月二十七,小纯第一时间给奶奶买了她最喜欢的猕猴桃,转了两趟车,回到了位于偏远山区的家乡。

  然而这个春节对小纯来说是残酷的,糟糕的事一桩接着一桩:腊月二十九,身体一直不错的奶奶因为一场突如其来的大病,卧床不起,几天不吃不喝;父母俩人常年分居两地打工,年前办理了离婚手续;哥哥不满父亲带后妈回家过年的举动,和父亲大吵一架后,离家出走;而她,只能一个人扛起了全家的担子。

  从家里回到公司,小纯的状态一直很压抑,不仅烦恼没人能倾诉,连数据标注的质量也出现了下降。周边不断有朋友问她:“为什么还留在数据工场?每天就坐那里框啊框的,学不到任何东西,眼还容易花掉。”渐渐地,她对自己的未来前途也开始感到迷茫。

  “周边的同学说,即使数据标得再好,还是没有前途。”小纯一直梦想着,有朝一日能够通过自己的努力,走出这座大山。

未来的机器人会不会取代我们

  与小纯渴望走出去的梦想不同,标注组长小广希望毕业后能继续留在这里打拼。

  小广是数据工场的元老级员工,见证了工场从几十人增至几百人的历程。2015年10月,他先是加入了扶贫高职的电子商务俱乐部,做跨境电商的产品分类。面对密密麻麻的字母,英文基础不好的他做得很吃力,常常借助翻译工具理解。三个月后,大数据工场成立,他随着实践团队移到数据标注部。

  在做了一段时间的标注员后,经理欣赏小广踏实和勤奋的工作态度,并举荐他和另一个同学去竞争标注组长的岗位。然而爷爷突然因病去世的消息在午后的一个电话传到他这里,很长一段时间,小广都待在家里没回去上班。

  调整好自己后,小广决定回到公司,原以为当标注组长的机会没了,但经理还是相信他的能力,让他试着带十来个同学做项目。在数据工场的一年零一个月,他从标注员升到了标注组长。

  “加入数据标注公司最大的改变是性格。”自懂事以来,小广的父母就外出打工,把自己一个人放在外婆家生活。每当遇到烦恼,小广就躲在房里,也不知道怎么和外婆诉说,慢慢地变得有点自闭。来到这里,小广开始和同学、老师有了更多的交流,开始谈了第一次恋爱。

  现在,小广手下管着十几个同学,他的主要工作是检查、指导组员的标注质量,并向主管汇报标注进度。如今,小广处理起来已经得心应手。

  然而,数据标注的市场才刚打开,公司的运营也遭遇了寒冬。在前一两个月,数据工场处于过渡期,大多时间用于培训和锻炼学生,仅有少数项目产量化为盈利,学生的工资也往后拖延。“那时候项目不稳定,收入也时多时少,以补贴的形式,一般我能拿到五六百。” 小广说。

  此后,每天都有同学抗议。在新调来的经理在与小广、其他同学持续的长谈之后,这场危机总算是化解,工场也渐渐步入正轨。现在项目产量多的时候,小广一个月能赚五千多块。最近,他给远在浙江打工的妈妈买了一部价值1300元的手机。

  随着人工智能深入更多垂直行业,需要的数据数量也持续增加。数据工场现有的400多人已经不能够满足甲方的要求。在紧邻工场的地方,他们又租下了一幢三层高的大楼,待装修好继续扩招标注员工。

  在那里,小广看到了公司的招牌被换成了数据工厂,他以为公司搞错了:“怎么变成了工厂呢,不应该是操场的‘场’吗?”同学继续低头看着手机,用着很坚定的语气回答小广:“这本来就是工厂啊,四百多人,大量生产的工厂。”

  现在距离毕业的时间仅有三个月,小广希望自己能留下来。“用通俗一点的话说,就是赚多点钱,养活自己和家人。”小广笑笑说。同时,小广和他的同学也在担心着,他们教会了机器人学习工作,而未来的机器人会不会取代他们的工作。

欢迎联系我们

 

如果您有悄悄话想告诉我们,欢迎私信@看见微博;
如果您也有故事想通过摄影的方式来讲述,欢迎来稿。
邮箱:sinaphoto@vip.sina.com

《看见·看不见》新书已上市,讲述有力的图片故事。

人工智能背后的人工

摄影:Chin Chen 编辑 | 米杜 董淑云     新浪图片出品 2018-04-12 10:27:37

1/35
  • 贵州,曾经中国最落后的省份之一,近几年着力发展人工智能和大数据,一跃成为中国最炙手可热的高新产业区。这是在贵阳,一家互联网企业正在建设隐藏在山体隧道的大数据中心。2017年,根据中国国家信息中心发布的《中国大数据发展报告》,贵州的大数据发展政策环境指数居全国第一。截至目前,大数据产业对当地经济增长的拉动超过20个百分点。

  • 从贵阳市区沿着刚修好的公路驾车50多公里,就到了百鸟河数字小镇上。小镇四面环山,人迹罕至。2017年12月,百鸟河数字小镇召开了人工智能服务论坛,渐渐为人所知。如今,这里吸引了不少外地的科技公司进驻。

  • 这是小镇上一个容纳400多人的数据工场,电脑前坐满了来自附近一家扶贫高职的学生。学生来自各个专业,来这里主要进行数据标注的实习。所谓数据标注,即是把人工智能需要识别的数据,通过分类、画框等方式标注出来。譬如,把道路上的汽车、行人、红绿灯等框起来,用于自动驾驶的训练等等。

  • 数据标注部接到了一个新项目,需要采集不同场景下的三十二套动作,学生们按照图纸中的指定姿势拍下照片。数据标注是劳动密集型行业,门槛并不高,一般经过几天的培训,学生们就能很快上手。

  • 小纯是扶贫高职的一名学生,寒假期间来到数据工场进行实习。她每天从学校来到办公室的第一件事是打开电脑,那里有2000多个图片标注任务等着她完成。晚七点,小纯一个人继续留在公司加班,最近她和邻座的胖子比拼标注速度,为了赢过胖子,小纯利用晚上来赶工。

  • 小纯在帮新来的学生装配电脑。虽然被分配到道路标注小组,但小纯对被自己框住的汽车一概不了解,她时常会好奇标注里的SUV长什么样,无人驾驶是不是真的安全,她还要不要考驾照等等。

  • 小纯每天上班七八个小时,一个月能挣两千元,这对她来说是笔不错的收入。腊月二十七放寒假回家,小纯用挣来的钱给奶奶买了最喜欢的猕猴桃。从学校到小纯的家虽然只有几十公里,但也需要倒两趟车,再走一段山路。

  • 在家里,小纯和堂姐、村里的小伙伴一起上山去摘蕨菜。与大城市不同,小纯的家乡属于贫困帮扶地区,网络闭塞,4G网络信号还没延伸到这里,村里面没几户人家能上网,更别提人工智能和大数据了。

  • 小纯和奶奶、大伯母在阁楼里烧腊肉。小纯家买了半头猪熏成腊肉,平常奶奶一人在家舍不得,只有等小纯回来才切来吃。可是小纯回来刚两天,身体一直不错的奶奶突然患了一场大病,几天不吃不喝,卧床不起。这个春节小纯过得胆战心惊,还好离家前,奶奶病好了,现在也能走路了。

  • 小纯房间的墙上,贴着许多初中时候画的画。虽然画画一直是她的最爱,却不得不因家庭贫困打消了学艺术的念头。小纯的父母常年分居两地打工,年前办理了离婚手续;哥哥不满父亲带后妈回家过年的举动,离家出走;小纯则几乎一个人扛起了全家的担子。

  • “我父母一生下来我,就没做到父母的责任,特别是我妈,每次打工回来一下就走。我小时候根本不认得我妈妈,就和奶奶最亲。有时候,我也不知道该不该恨我父母。如今,他们终于办完手续离婚了,从懂事以来,就觉得他们没有感情,离婚后,我好像终于放下了以前的恨。”小纯在附近的山上感慨道。

  • 从家里回到公司,小纯的状态一直很压抑。傍晚下班,她在路旁看见一簇花开了,赶紧拿起手机过去拍,“花开很美,可惜白天没有时间去看它最美的样子。”小纯对自己的未来前途感到很迷茫,“周边的同学说,每天坐在那里不停地框,眼都花了还学不到东西。”小纯一直梦想着,有朝一日能够通过自己的努力,走出这座大山。

  • 与小纯渴望走出去的梦想不同,标注组长小广希望毕业后能继续留在这里打拼。小广是数据工场的元老级员工,见证了工场从几十人增至几百人的历程。2015年10月,他先是加入了扶贫高职的电子商务俱乐部,做跨境电商的产品分类,三个月后数据工场成立,他就进入到了数据标注部。

  • 从数据标注员到质检员再到标注组长,小广用了整整一年的时间。从事数据标注的晋升之路极其狭窄,从组长升到经理的位置,还需要很多个年月。现在,小广手下管着十几个同学,他的主要工作是检查、指导组员的标注质量,并向主管汇报标注进度。

  • 小广的电脑上摆放着几枚硬币,按照他的说法,这几枚硬币可以生出更多的财富。“以前项目不稳定,收入时多时少,一般我能拿到五六百。”小广说,现在项目产量多的时候,他一个月能赚五千多。春节期间,小广经济情况稍显宽裕,就给在浙江打工的妈妈买了一部1300元的手机。

  • 早上八点,小广蹲在洗手间洗了个头,准备去上班。如今,小广已经把生活重心全放在了数据标注上,为了离上班地点更近些,小广从学校搬到了小镇上住。不过,小镇上没有什么生活必需品,每个星期,小广都会到县城里的超市买好一个星期的日常用品。

  • 中午下班,小广邀请朋友来宿舍做饭吃。小广说,加入数据标注公司后,自己改变最大的是性格。自懂事以来,小广父母就在外出打工,他自己一个人在外婆家生活,慢慢地变得有点自闭。来到这里,小广开始和同学同事有了更多的交流,也开始了第一次恋爱。

  • 休息的时候,小广习惯往窗外看。现在距离毕业仅有三个月时间,小广希望自己能留下来。“用通俗一点的话说,就是赚多点钱,养活自己和家人。”

  • 2018年3月26日,一家互联网公司在北京发布了首款人工智能视频音箱。音箱的语音识别大数据,正是出自于像小纯和小广这样的标注员。随着人工智能产业的飞速发展,需要的数据量也在持续增加,贵州那家数据工场的400多人,已经不能够满足甲方的要求。在紧邻工场的地方,他们又租下了一幢三层高的大楼,等待装修好继续扩招标注员工。

  • 类似于百鸟河那样的人工智能小镇,也渐渐在中国遍地开花。这是杭州未来科技城还没完工的人工智能小镇二期、三期。如今,人工智能的高速发展被冠以了“第四次工业革命”的头衔,但在热潮背后,小广和他的同学也在担心着,他们教会了机器人学习工作,而未来的机器人会不会取代他们。

视频

收藏成功 查看我的收藏

已收藏!

您可通过新浪首页(www.sina.com.cn)顶部 “我的收藏”, 查看所有收藏过的文章。

知道了

0