谷歌承认「窃取」OpenAI模型关键信息:成本低至150元,调用API即可得手

什么?谷歌成功偷家OpenAI,还窃取到了gpt-3.5-turbo关键信息???是的,你没看错。根据谷歌自己的说法,它不仅还原了OpenAI大模型的整个投影矩阵(projection matrix),还知道了确切隐藏维度大小。而且方法还极其简单——只要通过API访问,不到2000次巧妙的查询就搞定

什么?谷歌成功偷家OpenAI,还窃取到了gpt-3.5-turbo关键信息???

是的,你没看错。

根据谷歌自己的说法,它不仅还原了OpenAI大模型的整个投影矩阵(projection matrix),还知道了确切隐藏维度大小。

而且方法还极其简单——

只要通过API访问,不到2000次巧妙的查询就搞定了。

成本根据调用次数来看,*20美元以内(折合人民币约150元)搞定,并且这种方法同样适用于GPT-4

好家伙,这一回奥特曼是被将军了!

谷歌承认「窃取」OpenAI模型关键信息:成本低至150元,调用API即可得手

这是谷歌的一项最新研究,它报告了一种攻击窃取大模型关键信息的方法。

基于这种方法,谷歌破解了GPT系列两个基础模型Ada和Babbage的整个投影矩阵。如隐藏维度这样的关键信息也直接破获:

一个为1024,一个为2048。

所以,谷歌是怎么实现的?

攻击大模型的最后一层

该方法核心攻击的目标是模型的嵌入投影层(embedding projection layer),它是模型的最后一层,负责将隐藏维度映射到logits向量。

由于logits向量实际上位于一个由嵌入投影层定义的低维子空间内,所以通过向模型的API发出针对性查询,即可提取出模型的嵌入维度或者最终权重矩阵。

通过大量查询并应用奇异值排序(Sorted Singular Values)可以识别出模型的隐藏维度。

比如针对Pythia 1.4B模型进行超过2048次查询,图中的峰值出现在第2048个奇异值处,则表示模型的隐藏维度是2048.

谷歌承认「窃取」OpenAI模型关键信息:成本低至150元,调用API即可得手

可视化连续奇异值之间的差异,也能用来确定模型的隐藏维度。这种方法可以用来验证是否成功从模型中提取出关键信息。

在Pythia-1.4B模型上,当查询次数达到2047时出现峰值,则表明模型隐藏维度大小为2048.

谷歌承认「窃取」OpenAI模型关键信息:成本低至150元,调用API即可得手

并且攻击这一层能够揭示模型的“宽度”(即模型的总体参数量)以及更多全局性的信息,还能降低一个模型的“黑盒程度”,给后续攻击“铺路”。

研究团队实测,这种攻击非常高效。无需太多查询次数,即可拿到模型的关键信息。

比如攻击OpenAI的Ada和Babbage并拿下整个投影矩阵,只需不到20美元;攻击GPT-3.5需要大约200美元。

它适用于那些API提供完整logprobs或者logit bias的生成式模型,比如GPT-4、PaLM2。

谷歌承认「窃取」OpenAI模型关键信息:成本低至150元,调用API即可得手

论文中表示,尽管这种攻击方式能获取的模型信息并不多,但是能完成攻击本身就已经很让人震惊了。

已通报OpenAI

如此重要的信息被竞争对手以如此低成本破解,OpenAI还能坐得住吗?

咳咳,好消息是:OpenAI知道,自己人还转发了一波。

谷歌承认「窃取」OpenAI模型关键信息:成本低至150元,调用API即可得手

作为正经安全研究,研究团队在提取模型最后一层参数之前,已征得OpenAI同意。

攻击完成后,大家还和OpenAI确认了方法的有效性,最终删除了所有与攻击相关的数据。

所以网友调侃:

一些具体数字没披露(比如gpt-3.5-turbo的隐藏维度),算OpenAI求你的咯。谷歌承认「窃取」OpenAI模型关键信息:成本低至150元,调用API即可得手

谷歌承认「窃取」OpenAI模型关键信息:成本低至150元,调用API即可得手

值得一提的是,研究团队中还包括一位OpenAI研究员。

谷歌承认「窃取」OpenAI模型关键信息:成本低至150元,调用API即可得手

谷歌承认「窃取」OpenAI模型关键信息:成本低至150元,调用API即可得手

这项研究的主要参与者来自谷歌DeepMind,但还包括苏黎世联邦理工学院、华盛顿大学、麦吉尔大学的研究员们,以及1位OpenAI员工。

此外,作者团队也给了防御措施包括:

从API下手,彻底删除logit bias参数;或者直接从模型架构下手,在训练完成后修改最后一层的隐藏维度h等等。

基于此,OpenAI最终选择修改模型API,“有心人”想复现谷歌的操作是不可能了。

但不管怎么说:

谷歌等团队的这个实验证明,OpenAI锁紧大门也不一定完全保险了。

(要不你自己主动点开源了吧)

论文链接:https://arxiv.org/abs/2403.06634

参考链接:https://twitter.com/arankomatsuzaki/status/1767375818391539753

(0)
小多多的头像小多多创始人

相关推荐

  • 遍地涌现的零食娃娃机

    01“夹零食比夹娃娃更加让人上头。”近日,在北京南五环的商场、街头出现了一些夹零食店,吸引了不少年轻人。傍晚时,位于北京大兴区的一家夹零食店开始热闹起来。这家夹零食店内摆放了数排娃娃机,娃娃机透明的柜子内摆放着各种各样的零食,有果冻、泡面、薯片、饮料等等。不少年轻人拉着购物篮,站在娃娃机前夹零食。“

    2023年12月25日
  • 吴清功:当前生物医药公司的任务,活下来

    2023年8月18日,由中国投资协会股权和创业投资专业委员会、中国医药企业管理协会投融资服务专委会指导,约印医疗基金、中华创投家同学会联合主办,药渡经纬信息科技(北京)有限公司协办,清科创业承办的“第三届约印医疗创新产业大会”在北京举办。大会将以“聚力创新,远见未来”为主题,力邀行业专家、领军企业、

    创投 2023年8月18日
  • 字节游戏,停止跳动

    张一鸣要彻底放弃游戏了。11月27日,据新熵获悉,字节跳动旗下游戏业务朝夕光年将进行大规模业务收缩——对已上线的且表现良好的游戏,会在保证运营的情况下寻求剥离;对还未上线的项目,除少量创新项目及相关技术项目外,均会关停,据了解朝夕光年目前员工2000多人,裁员波及全体人员,一部分业务原地解散,一部分

    2023年11月28日
  • 年底离职潮该怎么办 尤其是公司的管理者应该看看

    对于很多公司的管理者来说年底的离职潮都是一个非常棘手的问题,不少人都完全束手无策不知该怎么处理这种情况,接下来的文章就给大家聊聊该如何解决相关的问题! 年底确实是一个离职率很高的时…

    创投 2022年1月25日
  • 量子之歌发布2024财年Q2财报,营收再创历史新高、净利润首次破亿

    北京时间3月7日,量子之歌(NASDAQ: QSG)公布了2024财年第二季度未经审计的财务业绩(“2024财年第二季度”,指2023年10月1日至2023年12月31日期间)。财报数据显示,量子之歌营业收入达9.805亿元⼈⺠币,同比增长24.7%。本季度净利润为1.076亿元人民币,经调整净利润

    2024年3月8日
  • 刚刚,锂电池发明者仙逝:享年100岁

    刚刚,锂电池发明者仙逝:享年100岁,就在他去世前的一个月,2023年5月,Goodenough还作为主要作者之一,在NANOMICROsmall期刊上发表了一篇文章

    2023年6月27日 创投
  • 吉利变「急」利

    吉利变「急」利,“吉利是比较典型的传统主机厂思维,那几年油车好赚钱,新能源车确实是不赚钱的。”

    2023年5月10日
  • 辉瑞、罗氏、默克等药企看好哪些赛道?

    据智药局不完全统计,2023年第三季度,全球创新药领域至少有15笔超十亿美元的重磅交易,合作总金额超300亿美元。从细分赛道看,主要集中在ADC、核药、基因治疗等爆火领域。其中,AI技术驱动药物研发的相关交易相当突出,当下AI制药概念备受追捧,早已成为创新药领域的新宠。从布局者来看,除跨国药企外,我

    2023年10月7日
  • 微信扛着腾讯走

    “让状态*的人上场”——腾讯董事会主席兼首席执行官马化腾赶在财报同一天的意志传达,既是对过去表现的鞭策,也是对未来业务节奏的表态。11 月 15 日港股盘后,腾讯控股(00700.HK)向市场递上 2023Q3 成绩单:营收 1546.25 亿元,同比增长 10%;净利润(Non-IFRS)449.

    2023年11月17日 创投
  • 一生一养走进红色圣地,传承发扬延安精神,助推品牌高质量发展_行业动态

    2023年5月29日,来自全国各地的一生一养核心合作伙伴,来到革命圣地延安,接受红色革命教育的精神洗礼。延安的第 一站,一生一养执行总裁高翔…” />
    <meta http-equiv="Content-Type" content="text/html; charset=utf-8

    2023年6月14日 创投
  • 这届药企,不想「大大大」了

    Open up, everything’s waiting for you You can go your own way Go your own way11月15日,在三季报电话会议召开前,Alkermes选择了弗利特伍德·麦克的分手歌曲《走自己的路》作为背景音乐,而不是大多数药企喜欢的田园交响乐

    2023年11月17日
  • VITURE联合唯酷光电实现全球首款应用液晶电致变色技术并量产的AR/XR眼镜_行业动态

    作为全球*主打游戏体验的AR/XR眼镜产品,VITURE自2022年4月问世以来获得海外消费者的大量追捧。首发即以310万美元的成绩打破了Oculus在海外知名*平台Kickstarter上保持的品类记录,成为AR/XR品类里历史销量最 高的品牌。VITURE One目前已斩获《时代周刊》年度最

    2023年9月12日 创投
  • 方便面在奇葩口味的道路上越走越远了

    随机提问,你吃过多少种方便面?心中*是红烧牛肉还是老坛酸菜?最近康师傅办展,压箱底的货都拿出来展陈,让人大吃一惊,竟然有261种口味777款方便面。一天吃一种,两年都不带重样。其中有不少口味是西南、江南或华南地区限定,像酸萝卜老鸭面、东坡红烧肉面、泡姜鸡面,口味研发上着实脑洞太大。有人遗憾,好多味道

    创投 2023年10月8日
  • 今天,两位清华室友IPO敲钟

    今天,两位清华室友IPO敲钟,一起做难而正确的事。和九年前刚开始的初心一样,因为卖电脑的时候看到小公司因为成本敏感把设备堆放在角落的铁架上,纪鹏程踏上了一条少有人走的路。不过这一路,他已不是一个人。

    创投 2023年5月25日
  • 元宇宙凉凉?这家游戏公司刚获1.38亿融资

    元宇宙凉凉?这家游戏公司刚获1.38亿融资,但同时,对于元宇宙来说,无论是时尚,还是游戏,又何尝不是帮助它更快走向真实世界的重要途径呢?

    2023年6月29日 创投