(资料图片)
IT之家 5 月 10 日消息,语言模型是一种人工智能技术,可以根据给定的文本生成自然语言。OpenAI 的 GPT 系列语言模型是目前最先进的代表之一,但IT之家注意到它们也有一个问题:它们的行为很难理解和预测。为了让语言模型更透明和可信,OpenAI 正在开发一种新工具,可以自动识别语言模型中哪些部分对其行为负责,并用自然语言进行解释。
这个工具的原理是利用另一个语言模型(也就是 OpenAI 最新的 GPT-4)来分析其他语言模型(比如 OpenAI 自己的 GPT-2)的内部结构。语言模型由许多“神经元”组成,每个神经元都可以观察文本中的某种特定模式,并影响模型下一步的输出。例如,给定一个关于超级英雄的问题(比如“哪些超级英雄有最有用的超能力?”),一个“漫威超级英雄神经元”可能会提高模型提到漫威电影中特定超级英雄的概率。
OpenAI 的工具就是利用这种机制来分解模型的各个部分。首先,它会将文本序列输入到被评估的模型中,并等待某个神经元频繁地“激活”。然后,它会将这些高度活跃的神经元“展示”给 GPT-4,并让 GPT-4 生成一个解释。为了确定解释的准确性,它会提供给 GPT-4 一些文本序列,并让它预测或模拟神经元的行为。然后它会将模拟的神经元的行为与实际神经元的行为进行比较。
“通过这种方法,我们基本上可以为每个神经元生成一些初步的自然语言解释,并且还有一个分数来衡量这些解释与实际行为的匹配程度。” OpenAI 可扩展对齐团队负责人 Jeff Wu 说,“我们使用 GPT-4 作为过程的一部分,来生成对神经元在寻找什么的解释,并评估这些解释与它实际做什么的匹配程度。”
研究人员能够为 GPT-2 中所有 307,200 个神经元生成解释,并将它们编译成一个数据集,与工具代码一起在 GitHub 上以开源形式发布。像这样的工具有朝一日可能被用来改善语言模型的性能,比如减少偏见或有害言论。但他们也承认,在真正有用之前,还有很长的路要走。该工具对大约 1000 个神经元的解释很有信心,这只是总数的一小部分。
有人可能会认为,这个工具实际上是 GPT-4 的广告,因为它需要 GPT-4 才能运行。但 Wu 说,这并不是这个工具的目的,它使用 GPT-4 只是“偶然”的,而且,相反它显示了 GPT-4 在这方面的弱点。他还说,它并不是为了商业应用而创建的,并且理论上可以适应除了 GPT-4 之外的其他语言模型。
“大多数解释的分数都很低,或者没有解释太多实际神经元的行为。” Wu 说,“很多神经元的活动方式很难说清楚 —— 比如它们在五六种不同的东西上激活,但没有明显的模式。有时候有明显的模式,但 GPT-4 却无法找到。”
更不用说更复杂、更新、更大的模型,或者可以浏览网页获取信息的模型了。但对于后者,Wu 认为,浏览网页不会太改变工具的基本机制。他说,它只需要稍微调整一下,就可以弄清楚神经元为什么决定进行某些搜索引擎查询或访问特定网站。
“我们希望这将开辟一个有前途的途径,来以一种自动化的方式解决可解释性问题,让其他人可以建立在上面并做出贡献。” Wu 说,“我们希望我们真的能够对这些模型的行为有好的解释。”
标签:
-
苹果联合创始人沃兹呼吁加强监管,标记所有AI内容据媒体报道,苹果联合创始人史蒂夫・沃兹尼亚克表示,“生成...
-
哈啰成立科技公司,注册资本3500万美元天眼查App显示,近日,南宁哈罗网络科技有限公司成立,法定代...
-
【世界新要闻】比亚迪成立汽车销售新公司,注册资本100万元天眼查App显示,近日,宁海比亚迪卓御汽车销售有限公司成立,...
-
世界微动态丨新东方教学点擅自出版教材被罚天眼查App显示,近日,新东方教育科技集团有限公司子公司长沙...
-
每日热门:马斯克杠上扎克伯克吐槽WhatsApp不可信据IT之家消息,有推特工程师爆料称,Meta旗下即时通讯软件Wha...
-
丰田汽车第四季度净利润5,522.9亿日元,同比增长3.4%-最新消息丰田汽车第四季度经营利润6,269 3亿日元,同比增长35%,预估...
-
打造保险业数字化品牌创新典范,轻松集团荣获中国金融品牌“金诺奖”鞭牛士报道在“中国品牌日”来临之际,由中国银保传媒主办的...
-
天天讯息:歌手IU被举报涉嫌作品抄袭,涉及《好日子》等6首歌据韩媒报道,韩国人A某称歌手IU演唱的《粉红色高跟鞋》等6首...
-
微软750亿美元收购案遭英国否决,动视暴雪聘请名律潘尼克上诉_环球新要闻据财联社援引外媒消息,动视暴雪已聘请重量级法律人物潘尼克...
-
百度正在内测文心千帆大模型平台|热闻据证券时报报道,从百度获悉,公司正在内测文心千帆大模型平...
- 智联世界,元生无界!快手虚拟人IP亮相2022人工智能大会
2022-09-07 10:47:54
- 机器人界“奥林匹克”!2022世界机器人大会8月18日举行
2022-08-10 09:58:58
- 2025年全球人口将达到90亿!机器人将在农业领域大显身手
2022-07-14 09:41:10
- 中科院院士蒋华良:AI+分子模拟与药物研发将大有可为
2022-07-14 09:37:00
- “千垛之城荷你有约” 2022兴化市荷文化旅游节正式开幕
2022-07-07 09:28:34