244.非智能重复(1 / 2)

互联网2010 圳南 1229 字 2个月前

<dt class="tp"></dt>

<dt class="kw"></dt>

<dt class="rd"></dt>

周凯这里头,路舟所看到的是有四排工位,每排所做也有一定区别。

一排的员工多是戴着耳机,听取的内容应该是梦谷众包处理过的微讯用户的一些语音数据,他们会在听取后将语音转换成文字,个别指定的词汇还会贴上属性标签。

这些语音在分包出来前会做进行一定的处理。

第二排则是图片中文字选取,需要拉出选框选出文字,然后在选取后将文字打进系统中。

这中间又分成了印刷体和手写体的区别,对人来说识别颇为简单,但对机器却成了两码事。即便是早期的ocr,统计分析后不可避免也需要一定的人工校对。

第三排的屏幕上则多是人脸图片,员工需要在人脸上按照系统提示标注人脸上的特定位置,拉出标注线,也会需要标注些分类标签,诸如性别人种面部朝向表情等。

第四排则多是男性员工,所做则是鉴黄和标注。他们需要从纷繁图库中一遍遍过图,找出涉黄的图片,再按要求进行分类标注等等。

看到这里,路舟也算是大略了解了一下周凯公司内的状况。

尽管ai前景看似光明无比,可看到此情此景路舟却感到了多少有些矛盾。即便他对这样的场景也有所预料。

看似智能,却需要建立在大量人非智能、不间断重复的工作结果。

这里就像一个数据的工厂一般。

有多少人工智能,也许就有多少人工,路舟想。

不过某种意义上,路舟也需要借助这些人工才能获取大量ai训练的数据。

毕竟买数据是一方面,个别开放的标注图片库如image则是更适合于拼比比赛。路舟想要做适配自己系统的ai,那自然就还是得投入成本,这样起码能通过员工端来调整需要标注的范围。

伴随着未来推进速度越来越快,这些工作也许会再学着亚马逊众包一样开始向亚非拉等发展中国家迁移以便拉低成本。但涉及了母语的类目,大抵还是只能在国内做。

周凯一边迎了过来,“路总,怎么样?”

路总微微点头,“不错。”

这倒是真心话。至少管理规划上,周凯做得是比自己想象中要完善得多。

周凯微笑,“这边给到的福利待遇还是不错的,也不怎么加班。我们招人也多会去职专中找员工,毕竟工作虽是简单,但还是要些电脑操作能力。”

路舟,“嗯。我安排开发个专门的标注系统,这样我方便调整,你们也能提高效率。公司的问题,你直接找梦广的王总谈,我们以合资的形式做。记得带上这头的一些账务去和他谈。”

周凯一听是好生大喜,在路舟身后朝王强东和周达两人一挥拳,“没问题路总!”

随后路舟又回身提醒了一句,“我不反对分包到下头的作坊处理,但需要你自己多有注意。原则上梦谷不会参与这公司的任何运作,我也只看结果。”

......

两小时后。

路舟是推却了周凯饭后活动的邀请,“直接带我去酒店吧。联系一下你的朋友,明天我想了解一下对方做siri项目的事情,如果方便的话。”