DAIR報告中揭示數據工作者遭受科技行業剝削的細節

數據工作的基礎勞動,如審核和標註,往往被那些受益於這些勞動成果的人所隱藏。一個新項目將世界各地數據工作者的生活經驗聚焦在一起,首次展示了海外科技工作的成本和機遇。

許多乏味、毫無感謝或對心理有損害的任務被外包到較貧窮的國家,那裡的工人樂意以低於美國或歐洲工資一部分的價格從事工作。這種勞動市場與其他屬於“乏味、骯髒或危險”類別的工作 (如電子“回收”和拆船) 相結合。審核或標註工作的條件沒有可能讓你失去一條手臂或患上癌症,但這並不意味著他們安全,更不用說愉快或有價值。

數據工作者調查是DAIR和柏林工業大學合作的項目,名義上是按19世紀末馬克思的作品模式而製定的,旨在辨明報告中的勞動條件“是集體製作的且可政治行動”。

所有報告均可免費獲得,並在今天的線上活動上發布,項目負責人在該活動上討論了該項目。

AI應用的不斷擴展範圍是建立在人類專業知識的必要基礎之上的,迄今為止這種專業知識是以公司可以提供的最低價值收購的,而不會引起公共關係問題。當你舉報一篇帖子時,它不會說“很好,我們會將這發送給敘利亞的一位工人,他將被付3美分來善後這個事宜。” 但由於報告的量 (和報告中值得舉報的內容) 如此之高,因此對於公司來說,除了對廉價勞動市場大規模外包工作之外,其他解決方案實際上是不合理的。

審視這些報告,它們大多是以軼事為主,這是刻意這樣安排的。這些報告更多地是在系統性人類觀察的水平上,而不是量化分析。

對於這些經歷進行量化往往無法捕捉到真正的成本,最終您得到的統計數據是公司喜歡吹噓的那種類型 (因此在研究中要求的數據) :比當地其他公司的薪資更高,工作創造,為客戶節省的錢。很少提到像審核工作者因噩夢而失眠或肆意依賴化學品等問題,更不用說被測量和展示。

以肯尼亞數據工作者為例,法絲卡·貝荷尼·格伯基丹在報告中講述了他們在應對心理健康和藥物問題上的掙扎 (完整PDF請查看這裡)。

她和她的同事為Sama工作,Sama自稱是一個更具道德的數據工作管道,但實際上這份工作,正如實際人員所描述的那樣,帶來的是無休止的痛苦和當地辦公室的支持不足。

一位告密者在肯尼亞Samasource的審核工作空間中拍攝的圖像。
圖片來源:法絲卡·貝荷尼·格伯基丹

被招聘來處理票 (即被標註的內容) 的本地語言和方言,他們接觸到一個永無止境的暴力、血腥、性虐待、仇恨言論和其他內容流,他們必須快速查看和“操作”,以免表現低於預期水平,導致減薪,報告稱。對一些人來說,這意味著每分鐘超過一則,這意味著他們每天至少要查看約500個這樣的項目。(如果您想知道AI在哪裡 —— 它們可能正在提供培訓數據。)

“這絕對是摧毀靈魂的。我看到了人們可以想像到的最糟糕的事情。我擔心這項工作將讓我終生難忘,”一位被訪談的承包商說。

支援人員“裝備不足,不專業,資歷不夠”,審核人員經常依賴藥物來應對,並抱怨有侵入性的想法、抑鬱症和其他問題。

我們有些聽過這些內容,但了解到這種情況仍在發生是相當重要的。有幾個類似這樣的報告,但其他報告更多地是個人故事或採取不同格式。

例如,雅瑟·尤塞夫·阿爾雷斯是敘利亞的一名數據標註員,他在為自己的高等教育支付工作。他和室友一起從事視覺標註任務,例如解析文本圖像,經常是定義不清晰,客戶提出了令人沮喪的要求。

他選擇通過一部短片來記錄他的工作,值得您花費八分鐘的時間觀看。

像雅瑟這樣的工作者常常被許多組織層次所隱藏,作為轉包給次承包商的次承包商,這樣當問題或訴訟發生時,責任線就會變得模糊。

DAIR和柏林工業大學的米拉格羅斯·米切利 (Milagros Miceli) 是該項目的領導之一,她告訴我們,截至目前,他們還沒有見到有關報告中提到的公司的任何評論或變化,但現在還言之過早。但結果似乎足以讓他們繼續進行更多工作:“我們計劃與第二部分數據工作者續作此項工作,很可能來自巴西、芬蘭、中國和印度。”她寫道。毫無疑問,有些人會因為這些報告本身的一些特質而對其不屑一顧。然而,儘管可以用統計數據說謊,但軼事總是至少帶有一定的真實性,因為這些故事是直接來自原始的來源。即使這些肯亞、敘利亞或委內瑞拉這個問題的十幾名審核者是唯一的,他們所講的內容應該引起任何依賴他們的人的關注 — 總之,就是幾乎每個人都依靠他們。