肯尼亚「喂养」GPT-4

肯尼亚「喂养」GPT-4,在光鲜亮丽的社会变革和投资热潮背后,却是一群时薪不到两美元的肯尼亚人来教会AI,何为善恶。

积灰的吊扇慵懒地转着,十几个肯尼亚人盯着笨重的台式电脑屏幕,不断露出惊讶的神情。

考虑到这里是肯尼亚内罗毕的基贝拉贫民窟,一个过半居民没有工作,连自来水和干净的厕所都难得一见的地方,可能有人会误以为,他们一定是“村里刚通上网”,才会露出这种没见过世面的反应吧?

与想象的不同,实际上,他们在为全球*进、最热门的AI产品ChatGPT工作。这些人被称作数据标注师,正是他们保障了ChatGPT“健康成长”,使其成为一个彬彬有礼、夸夸其谈的聊天AI。

近半个月以来,随着ChatGPT最新版本GPT-4的发布,全球科技公司纷纷跟进,例如英伟达宣布在芯片硬件和云服务领域上全面支持AI的开发,百度发布文心一言,而AI也再次成为全球焦点。

但在光鲜亮丽的社会变革和投资热潮背后,却是一群时薪不到两美元的肯尼亚人来教会AI,何为善恶。

而且这份工作,并不光鲜。

一、“精神污染”

互联网上的言论总是充满着“戾气”,几条恶毒的言论就可以影响一个人的心情。如果有这样一份工作,要求员工每天高强度阅读9个小时的恶意内容,时薪多少能让人接受?

为OpenAI阅读和标记这些内容的肯尼亚人,实得工资约为每小时1.32美元至2美元(约合9~13.7元人民币)。

这些肯尼亚数据标注师的工作内容类似于鉴黄师,但更重口。

为了教会ChatGPT什么内容不该学,数据标注公司Sama从暗网上找来了各种由人性最黑暗面产生的文本和图片,包括但不限于无码的血腥酷刑、反人类的犯罪现场、儿童性虐待和仇恨言论。

一位负责为OpenAI阅读和标记恶意文本的肯尼亚数据标注师表示,他在阅读了一则跨物种猎奇性行为的图片后,反复出现幻觉。“那是一种折磨,即便是在一周后,我还是偶尔会想起那张图片,止不住地犯恶心。”

用中文互联网的流行语来形容,就是“我的脑子不干净了”,或“辣眼睛”。

一张图片的影响已如此之大,但除了图片之外,肯尼亚的数据标注师们每天还需要阅读150至250段文本,长度从大约100个单词到1000多个单词不等。

这些让人心理和生理上不适的内容,不断撕裂着数据标注师的三观,每个人都积攒了大量的精神压力。最终,没人能坚持超过3个月。

因此,雇佣他们的Sama公司在2022年2月终止了为OpenAI提供服务的合同,比计划提前了八个月。

Sama是一家总部位于美国旧金山的公司,长期在肯尼亚、乌干达和印度雇用员工,为谷歌、Meta和微软等硅谷公司提供类似的数据标注业务。Sama将自己定位为一家“有道德的AI公司”,声称已帮助50000多人摆脱贫困。

自称是改善社会生产方式的变革,但AI的源头却从这样令人痛苦的工作开始。剥削贫困国家的廉价劳动力去做最基础的工作,是否会成为AI诞生的“原罪”?

二、离不开人的AI

即便是*进的AI,也仍然离不开人,哪怕这个人来自相对贫困落后的国家。因此,肯尼亚数据标注师们的工作对OpenAI而言至关重要。

事实上,ChatGPT的前身GPT-3,就已经具备了令人印象深刻的语言表达能力和逻辑认知能力。但由于缺乏对于互联网信息的筛选机制,GPT-3也会被充满恶意的信息诱导,输出一些仇恨、暴力、歧视的内容。

在全面推广后,一旦发生类似“AI支持纳粹”这样的公关危机,整个行业都有可能被偏见推上风口浪尖,导致技术进步停滞。

如今,大多数的互联网平台都有着运用AI技术的信息审核机制,从最基础的关键词初筛,到高级的识图和从语言逻辑中判断恶意内容,都离不开AI技术的身影。

想要构建这样能够自我学习和进化的信息审核机制,OpenAI借鉴了Facebook等社交媒体的做法。那便是先收集那些带有血腥、暴力、仇恨言论和性虐待标签的素材,由远在肯尼亚的数据标注师进行人工评级打分,再教给ChatGPT。

经历多轮人工校对后,ChatGPT将建立自己的“善恶观”,在产生恶意言论之前,就将其过滤掉。

现在呈现在世界面前的,这个礼貌、成熟,甚至表现出一定共情能力的GPT-4,可以说是AI见惯了人间百态之后的样子。

OpenAI“诞下”了GPT-4,但雇了一批肯尼亚“保姆”,干着最脏最累的活来“养育”GPT-4。

“ChatGPT和其他语言模型AI令人印象深刻,但他们并不神奇。”人工智能伦理学家安德鲁·斯特雷特表示,因为这些AI仍然依赖于大量人力和数据,其中大部分是未经授权和未经同意使用的,连这个领域最明星的企业OpenAI也没能解决这些严重的基础性问题。

三、为什么是肯尼亚?

对于外界而言,崎岖的山脉、茂密的森林和野生动物丰富的大草原,构成了他们眼中的肯尼亚。

然而在这片不到60万平方公里的国土上,生活着5300万肯尼亚人,其中不少人选择了从事与计算机相关的数字工作。

据2021年肯尼亚媒体《肯尼亚华尔街》的一份报告,肯尼亚成年人口中有超过120万数字工作者。相比于2019年的63.8万人,这一数据有了显著增长。

肯尼亚「喂养」GPT-4

肯尼亚的数字工作者数量逐年增长。(图源:肯尼亚华尔街)

他们从事线上营销、线上助理、学术写作、软件开发和数据科学等工作。

根据市场分析机构埃森哲的预测,到2025年,数字经济预计将占肯尼亚GDP的9.24%。但这一数字仍远低于世界银行统计的全球平均水平15%。

尽管肯尼亚的互联网普及率不高,贫富差距极大,但还是有一部分人率先享受到了线上工作的便利。

政府对数字经济的推动,极低的工资标准,以及劳动法执行的纰漏,促使肯尼亚成为发达国家的数字外包“工厂”。

就拿数据标注师的工资而言,雇佣美国人的平均月薪约为4374美元(约合3万元人民币),雇佣印度人的平均月薪要1.67万卢比(约合1400元人民币),而雇佣肯尼亚人仅需每月2万肯尼亚先令(折合约1044元人民币)。

美国《时代周刊》曾采访多名承担ChatGPT外包数据标注师的肯尼亚Sama员工,他们都表示并没有收到公司承诺的“全身心保障”福利,比如心理咨询、冥想、护理和游戏等。

但对于工资,他们并未表达出明确的不满,Sama承诺的每月21000~40000肯尼亚先令的工资水平,已经远远高于当地*月薪标准15000先令。为了生计,他们也都不愿透露姓名。

遭受“精神污染”的数据标记师终究还是少数,大多数肯尼亚数据标记师处理着相对正常的内容。对于讨生活的肯尼亚人而言,与其考虑自己是否“被剥削”,还不如接受这份高薪的外包工作。

这也促使科技巨头们打着“帮助当地发展人工智能”的口号,变本加厉地在这些国家攫取廉价劳动力资源。

或许在他们看来,一个工业结构不完整,政局不稳定的贫困非洲国家,仅凭一群学历都不高的员工帮助国际科技巨头们做点外包工作,怎么可能实现所谓“人工智能领域的弯道超车”呢?

(0)
小多多的头像小多多创始人

相关推荐

  • 工资5000公积金交多少 最低5%,最高12%

    工资5000公积金交多少?据悉公积金的缴存比例为5%~12%,最低5%,最高12%。个人缴存比例与单位缴存比例相同。 不同公司缴存公积金的比例可由公司自由选择,但不得低于5%,不得…

    创投 2022年1月25日
  • 抛弃会员店的中产,抢起了晚8点的特价菜

    抛弃会员店的中产,抢起了晚8点的特价菜,这些不需要花费太多钱的小确幸,却正在为生活提供更持久的治愈。

    创投 2023年7月6日
  • 信诚基金排名 基金七不买三不卖口诀

    2021年前三季度公募基金收益战绩正式曝光! 总体来看,公募基金前三季度战绩可圈可点。 据东方财富Choice数据显示,截至9月30日,今年以来公募基金回报率排名中,前海开源公用事…

  • 周受资的2023

    01多年之后,周受资回忆起这跌宕起伏的 2023 年,肯定不只是他在 TikTok 上发布的 18 条短视频那么简单和轻松。2023 年,是他发布短视频内容最多的一年,基本保持一个月一到两条的节奏。在年初,经历过今年3月全球瞩目的舌战国会山,他的 TikTok 粉丝从 2 万飙升到了 300 万;到

    创投 2024年1月3日
  • 过年找工作还是年后找工作 其实最主要的还是自己的选择

    没到年关很多人都会对于换工作这件事非常的关心,那么到底是过年前找工作还是年后再换工作呢?这篇文章就给大家分享一些观点! 年终奖都在年前或年后发放,奖金落袋为安自然跳槽也提上议程。企…

    创投 2022年1月25日
  • 3500+人工智能公司「大阅兵」,地表最强AI人才都去了哪里

    人人都想拥有属于自己的生成式AI工具。但是全球只有极少人,能够真正构建出大型语言模型、新的AI应用基础设施和支持技术。这不但需要一套新的、特殊的技术能力,更需要深厚的知识和创造力。细数那些能够推动当今生成式AI技术极限的工程师,都是在全球*的科技公司中磨练多年的专家。有意思的是,如今,这些大公司在很

    2023年9月14日 创投
  • 数腾软件获新一轮战略融资,中电基金独家投资

    数腾软件获新一轮战略融资,中电基金独家投资,本轮融资将用于加大数腾软件灾备领域关键技术和产品的研发投入,扩大政务云、金融、能源等重点领域与区域市场的覆盖,加强与战略合作伙伴的生态建设与市场拓展。

    2023年4月26日
  • 妙鸭刷屏,传统照相馆要被平替了?

    妙鸭刷屏,传统照相馆要被平替了?,从整体来看,妙鸭小程序有多处创新,独特之处在于其采用了先进的人工智能和图像生成技术,利用深度学习算法,进行图片合成。

    2023年8月3日 创投
  • 70岁温州老板,一口气投了两家VC

    来源:投资界(ID:pedaily2012) 作者:刘博 周佳丽 上市公司,正密集做起了LP。 投资界获悉,森马集团新增对外投资企业森马华盖医健协同创业投资(温州)合伙企业(有限合…

    2021年10月25日 创业分享
  • 房企拉响退市警报,20余家仍在停牌

    房企拉响退市警报,20余家仍在停牌,目前,A股市场仅有蓝光发展和中天金融两家房企存在“戴帽”风险,另有嘉凯城和济南高新净资产跌至数亿元的水平。

    2023年4月13日
  • 腾讯音乐「借坡下驴」

    1945年的春夏之交,宝洁时任广告副总裁洛根与技术研究副总裁布洛迪,展开了一场激烈的辩论。争议的焦点,在于是否要加速一场“自杀式改革”——新产品洗衣粉已研发成功,但在那之前的100多年里,宝洁做的都是香皂生意,新方向会破坏品牌原本的资产价值。洛根提出要做谨慎、系统的市场和产品研究,让转型更加稳操胜券

    2023年12月25日 创投
  • 星火大模型+托福青少?阿尔法蛋词典笔值得买的原因不止这些_行业动态

    一见倾“新”是你,满“新”欢喜还是你。金秋开学季,阿尔法蛋AI词典笔用技术创新和合作共进,为万千用户带来了全新的产品价值点。这一次,讯飞星火认知大模型与中高考作文批改同源技术在阿尔法蛋AI词典笔T20旗舰版中珠联璧合,AI像专业老师一样逐点批改点评,让孩子的中英双语作文在启发中快速精准提升。这一次

    2023年8月30日 创投
  • 24岁,深创投执掌4400亿

    “顺势而为,乘势而上。”今日(8月25日),深创投2023年投资年会在深圳湾畔举行,披露了最新战绩——截至2023年7月31日,深创投管理各类资金总规模4466亿元,累计投资企业1420家,投资金额977亿元,已退出531家投资企业;最新259家已投企业分别在全球17个资本市场上市,投资企业和上市企

    创投 2023年8月25日
  • 中国创新药BD二十年:在荒原上织梦,蛰伏与破局

    中国创新药BD二十年:在荒原上织梦,蛰伏与破局,在更远的未来,中国创新药的发展之路仍然漫长。而创新药BD作为一个与创新药发展高度绑定的行业,也会随着创新药的不断发展而走向成熟。

    2023年4月25日
  • 建行2022年银行业百佳网点获评数量蝉联同业第一!_行业动态

    近日,中国银行业协会正式公布了2022年银行业营业网点文明规范服务百佳示范单位名单,建设银行共计20家营业网点从行业22万多家营业网点中脱颖…” />
    <meta http-equiv="Content-Type" content="text/html; charset=utf-8

    创投 2023年7月4日