當(dāng)我們?yōu)闄C(jī)器人每一個(gè)靈巧的動(dòng)作而驚嘆時(shí),不應(yīng)忘記那些在陰影中為其繪制行動(dòng)地圖的“影子”。這不是商業(yè)模式的拷問(wèn),更是一個(gè)關(guān)于技術(shù)倫理與社會(huì)的深刻命題:我們追求的智能未來(lái),究竟應(yīng)該由怎樣的人文基石來(lái)支撐?
我們正在見證林立的具身大廈,但要記得何人把它一手手搭。
作者:彭堃方
?編輯:呂鑫燚
出品:具身研習(xí)社
數(shù)據(jù)成為具身智能進(jìn)化最大卡點(diǎn),成為困住其走向物理世界的“靈魂”時(shí),明面上,產(chǎn)業(yè)內(nèi)討論的是真機(jī)數(shù)據(jù)與仿真、互聯(lián)網(wǎng)等數(shù)據(jù)類型的博弈。其中真機(jī)數(shù)據(jù)由于質(zhì)量更高且在精細(xì)化操作領(lǐng)域的更具效用,被普遍認(rèn)為“海量真機(jī)數(shù)據(jù)集能左右具身智能發(fā)展速度”。
但幾乎不會(huì)有人告訴你,機(jī)器人真機(jī)數(shù)據(jù)集的背后是怎樣一份沉甸甸的付出。
這份付出是一個(gè)略顯老套的商業(yè)故事,正如同騎手越來(lái)越快的車速為的是加速外賣平臺(tái)的即時(shí)零售夢(mèng)實(shí)現(xiàn)一樣。數(shù)據(jù)采集員也在具身智能中扮演同樣的角色,他們通過(guò)身穿操作設(shè)備,一遍又一遍重復(fù)同樣的拿水杯動(dòng)作,為得就是讓具身智能擁有抓取&放置的能力。
但由于數(shù)據(jù)需求帶來(lái)數(shù)采員的缺口巨大,這份工作常以“外包”的形式出現(xiàn),在不穩(wěn)定的工作中誕生出更穩(wěn)定的具身智能產(chǎn)品。
有人說(shuō),這是時(shí)代賦予的“紅利期”,日薪200元不用風(fēng)吹日曬,在兼職工作中屬于香餑餑,還有人說(shuō),這是和網(wǎng)約車司機(jī)、騎手齊肩的新工種,能作為長(zhǎng)線發(fā)展。
亦有悲觀者認(rèn)為,這份工作有點(diǎn)悲劇色彩。“數(shù)據(jù)收集員的工作正是為Optimus最終取代人類勞動(dòng)鋪路?!盉usiness?Insider在報(bào)道特斯拉建立數(shù)據(jù)采集團(tuán)隊(duì)的文中這樣評(píng)述。通過(guò)由數(shù)據(jù)采集員獲取的數(shù)據(jù),機(jī)器人會(huì)變得更聰明,以至于這次他們親手鍛造的,或許成為未來(lái)的競(jìng)爭(zhēng)對(duì)手。
無(wú)論視角如何,短期來(lái)看這好像都是一份能掙到錢的新路子,至于未來(lái)如何發(fā)展或許誰(shuí)也沒(méi)拿到預(yù)言家的牌。
在喧嘩與躁動(dòng)的行業(yè)中,他們像一群“淘金者”,只不過(guò)這次他們不再是向土地要黃金,而是向自己要數(shù)據(jù)。

數(shù)據(jù)勞工的正反面
幾乎所有受訪的數(shù)采從業(yè)者,都將這份工作定義為“枯燥的體力活”。
枯燥,源于工作的重復(fù)性:?jiǎn)T工需身著數(shù)采外骨骼或遙操設(shè)備,重復(fù)數(shù)百次夾取、拿放、搬運(yùn)等動(dòng)作,如同教導(dǎo)嬰兒學(xué)步般,引導(dǎo)機(jī)器人模仿人類行為。體力活,則體現(xiàn)在工作的低技術(shù)門檻,多數(shù)崗位明確偏好男性,甚至要求能抓取15公斤重物。
數(shù)據(jù)采集中心內(nèi),數(shù)采員們?cè)谔囟▓?chǎng)景中行走、抓取、避障,每一個(gè)動(dòng)作都被精確記錄,成為機(jī)器人的行為藍(lán)本?;蛘?,他們坐在電腦前,對(duì)海量視頻逐幀標(biāo)注“這是手”“這是門把手”“這是安全行為”。他們是機(jī)器人在數(shù)字世界中的“鏡像”與“導(dǎo)師”。
Business Insider的采訪對(duì)象直言,這份工作對(duì)身體的負(fù)擔(dān)極大,“幾乎等同于一整天都在做有氧運(yùn)動(dòng)”。
坦白說(shuō),這類工作與兼職群中常見的外賣眾包、快遞分揀、工廠普工,有著高度相似的用戶畫像,以男性為主、無(wú)技術(shù)門檻的勞動(dòng)密集型崗位。
但招聘方卻常常附加“偏好條件”:希望應(yīng)聘者具備計(jì)算機(jī)、人工智能相關(guān)背景,或擁有數(shù)據(jù)采集經(jīng)驗(yàn)。這份在社交媒體上被貼上“含金量低、需避坑”標(biāo)簽的工作,反而成為許多計(jì)算機(jī)、人工智能專業(yè)大專生的實(shí)習(xí)與就業(yè)選擇。
這些以相關(guān)專業(yè)、大專學(xué)歷為主的新生力量,大多將其視為“行業(yè)紅利”。曾從事醫(yī)療機(jī)器人數(shù)采與標(biāo)注的大專生小呂,數(shù)科專業(yè)本科剛畢業(yè)的小陳,都對(duì)這份工作給予了較高評(píng)價(jià)。小陳認(rèn)為,滿意的待遇、相對(duì)安全的工作環(huán)境、蓬勃發(fā)展的行業(yè)前景,再加上個(gè)人興趣的驅(qū)動(dòng),讓他對(duì)這份工作充滿好感。但和大多數(shù)從業(yè)者一樣,他也清楚這份工作的不穩(wěn)定性,計(jì)劃先積累經(jīng)驗(yàn)作為跳板,在行業(yè)中探索更多可能性。
這種“鯉魚躍龍門”的職業(yè)期待,與外包的AI數(shù)據(jù)標(biāo)注、AI訓(xùn)練師渴望晉升為大廠的AI產(chǎn)品經(jīng)理的職業(yè)規(guī)劃如出一轍?!百N近風(fēng)口賽道,從底層積累經(jīng)驗(yàn)逐步晉升”“優(yōu)秀者可轉(zhuǎn)正交社?!?,這也是HR在招聘中常用來(lái)吸引求職者的敘事邏輯。
但若將視野從這些“專業(yè)對(duì)口”的勞工群體,擴(kuò)展到更廣泛的從業(yè)者,便會(huì)發(fā)現(xiàn)他們身上諸多令人深思的“異狀”。
正如光與影相伴,當(dāng)機(jī)器人最終站在聚光燈下接受掌聲時(shí),這些教會(huì)它一切的數(shù)據(jù)勞工卻成為不被看見的影子。
而更詭異的是,這種數(shù)據(jù)勞動(dòng)正在“異化”。就像程序員們與其親手打造的AI編程工具相愛相殺一樣,勞動(dòng)密集型崗位上的數(shù)據(jù)勞工正在教會(huì)其偉大的機(jī)器人如何從事基礎(chǔ)性、枯燥的重復(fù)性勞動(dòng)。
看不見的另一層是“無(wú)根”。
從互聯(lián)網(wǎng)、移動(dòng)計(jì)算,到大模型和如今的具身智能,技術(shù)風(fēng)口一輪接一輪,數(shù)據(jù)勞工們也隨著浪潮遷徙,難以扎根。技術(shù)迭代,數(shù)據(jù)勞動(dòng)便會(huì)游移。
另一層面的“隨波逐流”則是體現(xiàn)在他們的勞工關(guān)系上。他們的工作多通過(guò)層層外包獲得,勞動(dòng)關(guān)系脆弱。項(xiàng)目一旦終止,都可能導(dǎo)致整個(gè)團(tuán)隊(duì)瞬間解散,失業(yè)如影隨形。
在這場(chǎng)具身大潮中,不說(shuō)與動(dòng)輒百萬(wàn)年薪的算法工程師相比,數(shù)據(jù)勞工薪資與招工群里的其他體力工種并無(wú)區(qū)別。在數(shù)據(jù)采集方面,以北上廣深一線城市為例,普遍日薪160元-200元之間,時(shí)薪20出頭。在數(shù)據(jù)標(biāo)注環(huán)節(jié),更是價(jià)低。這類工作就是針對(duì)客戶視頻里的目標(biāo)檢測(cè)識(shí)別,打標(biāo)簽,屬于遠(yuǎn)程辦公,全國(guó)可做。目前正在三四線城市正迅猛發(fā)展,攤薄用工成本。
他們是這條高附加值產(chǎn)業(yè)鏈上最基礎(chǔ)、也是待遇最微薄的一環(huán)。招聘的低門檻,意味著其可替代性之強(qiáng),也注定了議價(jià)權(quán)之弱。
人工智能領(lǐng)域知名政經(jīng)批判學(xué)者凱特·克勞福德在《技術(shù)之外:社會(huì)聯(lián)結(jié)中的人工智能》一書中表示,“這些工人從事支持AI‘魔法’說(shuō)法的重復(fù)性工作,但他們從未因?yàn)槭惯@個(gè)系統(tǒng)正常運(yùn)行而獲得認(rèn)可。盡管這項(xiàng)工作對(duì)AI系統(tǒng)的‘工作’至關(guān)重要,但通常薪酬很低”。
譯文翻譯有些拗口,換句話說(shuō)當(dāng)智能展現(xiàn)出震撼人心的魔力時(shí),那些支撐其運(yùn)作的幕后勞動(dòng)者,卻未得到應(yīng)有的認(rèn)可,至少在薪資回報(bào)上是如此。

數(shù)據(jù)勞工現(xiàn)狀從何而來(lái)?
回到問(wèn)題的開始,數(shù)據(jù)勞工的這些“異狀”究竟從何衍生呢?
AI的發(fā)展促進(jìn)了具身智能的誕生,而具身智能也承襲了諸多AI的技術(shù)底層邏輯,其中之一是“大力出奇跡”的Scaling?Law。
具身智能的智能水平某種程度上與數(shù)據(jù)的質(zhì)與量成正比,甚至業(yè)內(nèi)一度認(rèn)為具身智能要理解復(fù)雜的物理世界,或許要達(dá)到“互聯(lián)網(wǎng)”數(shù)據(jù)量級(jí)。因此,只有在保證質(zhì)上足夠干凈精確、足夠豐富,才能從規(guī)?;芍写呱悄苡楷F(xiàn)。
于是,具身智能需要數(shù)據(jù)采集、標(biāo)注等大量人力才能堆砌出。這些大量的人力成本,就成為初創(chuàng)企業(yè)的輜重了。而為了“輕裝上陣”,在摩爾定律逐漸打破,模型迭代日新月異的節(jié)奏里,企業(yè)選擇把這項(xiàng)基礎(chǔ)工作外包給三方。
從資本的邏輯來(lái)看這一點(diǎn)無(wú)可厚非。具身智能公司的核心資本必須投入到算法研發(fā)和硬件制造等“硬核”環(huán)節(jié)。將數(shù)據(jù)工作外包,是降本增效的好辦法。
但需要強(qiáng)調(diào)的是,外包后,企業(yè)管理鏈條延長(zhǎng),企業(yè)規(guī)范(權(quán)力)的傳導(dǎo)會(huì)遞減、乏力。這當(dāng)中極容易滋生亂象。
拿標(biāo)注質(zhì)量來(lái)說(shuō),當(dāng)具身智能企業(yè)下達(dá)一份數(shù)據(jù)采集或標(biāo)注的操作手冊(cè)供三方員工按部就班實(shí)現(xiàn)標(biāo)準(zhǔn)作業(yè)流程。這其中“具身企業(yè)—?jiǎng)趧?wù)公司—三方員工”之間存在“二次合格”。即原本“具身公司—全職員工”要求及格的數(shù)據(jù),在上述鏈路后,變成三方員工“得過(guò)且過(guò)”地交付勞務(wù)公司數(shù)據(jù),而勞務(wù)公司又“得過(guò)且過(guò)”地把數(shù)據(jù)交給具身智能公司,最終影響數(shù)據(jù)質(zhì)量。(部分情況下如此)
回到數(shù)據(jù)勞工的薪資待遇問(wèn)題。當(dāng)工人在接受層層外包后,薪資普遍像洋蔥一樣,剝的越來(lái)越少。你可以看到網(wǎng)絡(luò)上,圍繞這項(xiàng)工作的外包方,工資各有差異,一手的三方可能日薪250元,二手的勞務(wù)公司則可能日薪200元,而更多層的勞務(wù)則可能變?yōu)?50元。最終這些勞工被當(dāng)作資源反復(fù)倒手。
當(dāng)然,數(shù)據(jù)勞工勞動(dòng)價(jià)值的壓低,還表現(xiàn)在外包項(xiàng)目方本身也可能“吃不飽”。具身研習(xí)社也采訪到某數(shù)據(jù)采集項(xiàng)目負(fù)責(zé)人,他表示“目前與廠商合作都比較困難,部分廠商要求需要買他們的機(jī)器人才能分到業(yè)務(wù)。現(xiàn)在很多都是希望輸入人過(guò)去,去客戶那采集,用客戶的場(chǎng)地。但是這種本質(zhì)上已經(jīng)變成了純?nèi)肆尽薄6?dāng)企業(yè)選擇成為人力外包公司,就會(huì)發(fā)現(xiàn)企業(yè)在具身產(chǎn)業(yè)鏈已經(jīng)走到很邊緣的位置,自然這份蛋糕注定吃不到多少。
總之,低質(zhì)量、低激勵(lì)的數(shù)據(jù)工作甚至可能反噬技術(shù)本身,導(dǎo)致數(shù)據(jù)質(zhì)量下降,這些亂象也共同揭示出產(chǎn)業(yè)初期的“野蠻生長(zhǎng)”。
結(jié)語(yǔ)
當(dāng)我們沉浸在具身智能描繪的未來(lái)藍(lán)圖中,不應(yīng)忽略那些支撐技術(shù)迭代的“數(shù)據(jù)勞工”。他們的職業(yè)發(fā)展與產(chǎn)業(yè)演進(jìn)本就是相互依存的整體,而非割裂的個(gè)體與背景。
從勞工視角來(lái)看,像小陳一樣試圖“轉(zhuǎn)正進(jìn)管理”只是少數(shù)人才能實(shí)現(xiàn)的理想路徑,更多人面臨的是“技能無(wú)沉淀、就業(yè)無(wú)保障”的困境。真正的職業(yè)成長(zhǎng),應(yīng)當(dāng)圍繞“經(jīng)驗(yàn)轉(zhuǎn)化”與“風(fēng)險(xiǎn)兜底”展開。
底層采集員可憑借一線實(shí)操經(jīng)驗(yàn),轉(zhuǎn)向數(shù)據(jù)質(zhì)量把控,比如篩選有效動(dòng)作數(shù)據(jù)、修正冗余標(biāo)注,或是參與編寫場(chǎng)景化采集手冊(cè),將“如何讓機(jī)器人精準(zhǔn)識(shí)別障礙物”“不同場(chǎng)景下的動(dòng)作規(guī)范”等經(jīng)驗(yàn)轉(zhuǎn)化為行業(yè)標(biāo)準(zhǔn),擺脫純體力勞動(dòng)的局限。
從產(chǎn)業(yè)方來(lái)看,數(shù)據(jù)勞工不會(huì)永遠(yuǎn)伴隨著數(shù)采廠的建設(shè)而呈線性增長(zhǎng),未來(lái)AI自動(dòng)標(biāo)注、世界模型生成與仿真技術(shù)優(yōu)化數(shù)據(jù)采集方案,可能會(huì)逐步“擠占”勞工的生存空間。
但需要明白的是,在“感知”層面(如識(shí)別物體)的自動(dòng)化可能較快,但在需要“理解”物理世界復(fù)雜交互(如力度、觸感、突發(fā)情況)的“認(rèn)知”層面,高質(zhì)量的人類演示數(shù)據(jù)大概率在較長(zhǎng)一段時(shí)間內(nèi)仍是不可替代的“教科書”。
當(dāng)我們?yōu)闄C(jī)器人每一個(gè)靈巧的動(dòng)作而驚嘆時(shí),不應(yīng)忘記那些在陰影中為其繪制行動(dòng)地圖的“影子”。這不是商業(yè)模式的拷問(wèn),更是一個(gè)關(guān)于技術(shù)倫理與社會(huì)的深刻命題:我們追求的智能未來(lái),究竟應(yīng)該由怎樣的人文基石來(lái)支撐?
我們正在見證林立的具身大廈,但要記得何人把它一手手搭。
特別聲明:本文為合作媒體授權(quán)DoNews專欄轉(zhuǎn)載,文章版權(quán)歸原作者及原出處所有。文章系作者個(gè)人觀點(diǎn),不代表DoNews專欄的立場(chǎng),轉(zhuǎn)載請(qǐng)聯(lián)系原作者及原出處獲取授權(quán)。(有任何疑問(wèn)都請(qǐng)聯(lián)系idonews@donews.com)