adtop
首页 财经 查看内容

GPT-4“自我反思”后能力大增,测试表现提升30%

2023-04-09 10:45| 发布者: 苏小糖| 查看: 57583| 评论: 0|来自: IT之家  阅读量:13075   

摘要:,OpenAI最新的语言模型GPT-4不仅能够像人类一样生成各种文本,还能够设计和执行测试来评估和改进自己的表现。这种“反思”技术让GPT-4在多项难度较高的测试中,都取得了显著的进步,测试表现提升30%。 GPT-4...

,OpenAI 最新的语言模型 GPT-4 不仅能够像人类一样生成各种文本,还能够设计和执行测试来评估和改进自己的表现。这种“反思”技术让 GPT-4 在多项难度较高的测试中,都取得了显著的进步,测试表现提升 30%。

GPT-4 是继 GPT、GPT-2 和 GPT-3 之后,OpenAI 推出的最先进的系统,也是目前最大的多模态模型。其利用深度学习技术,使用人工神经网络来模仿人类的写作。

研究人员诺亚?辛恩和阿什温?戈平纳特(Ashwin Gopinath)在论文中写道:“我们开发了一种新颖的技术,让 AI 代理能够模拟人类的自我反思,并评估自己的表现。GPT-4 在完成各种测试的时候,会增加一些额外的步骤,让它能够自己设计测试来检查自己的答案,找出错误和不足之处,然后根据发现来修改自己的解决方案。”

在 HumanEval 编码测试中,GPT-4 使用自我反思环路,准确率从 67% 上升到 88%

GPT-4 可以通过设计和执行测试来批判其自身的性能,如 AlfWorld 测试结果所示,可以大大改善其性能

研究团队使用这种技术对 GPT-4 进行了几种不同的性能测试。在 HumanEval 测试中,GPT-4 需要解决 164 个从未见过的 Python 编程问题,原本准确率为 67%,使用反思技术后,准确率提升到了 88%。在 Alfworld 测试中,AI 需要在各种不同的交互环境中,通过执行一些允许的操作,来做出决策和解决多步任务。使用反思技术后,GPT-4 的准确率从 73% 提高到了 97%,只有 4 个任务失败。在 HotPotQA 测试中,GPT-4 可以访问维基百科,并回答 100 个需要从多个支持文档中解析内容和推理的问题,原本准确率为 34%,使用反思技术后,准确率提高到了 54%。

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。

分享至:
| 收藏

相关

  • 快递电子运单新国标对个人信息全加密
  • 国家市场监督管理总局4月7日召开新闻发布会,解读市场监管总局近日批准发布的《快递电子运单》和《通用寄递地址编码规则》两项国家标准,为进一步规范邮政行业发展,顺应行业数字化转型,不断优化改善从业人员和用户体验提供技术支撑。...
  • 企业家在线 发布于  2023-04-09 08:06  
  • 金融消费者权益保护新规实施桔子数科多措并举强化保障消费者权益
  • 近年来,伴随着监管机制及法律法规的不断完善,金融消费者权益保护得到进一步强化,金融市场秩序得到有序发展。消费者权益保护工作不仅是金融机构重点构建的工作机制之一,也是监管机构对金融机构行为进行监管的重要内容。3月1日起,中...
  • 企业家在线 发布于  2023-04-08 16:59  
  • 映宇宙:已接入GPT3.5turbo未来旗下产品将围绕AIGC做升级和探
  • ,据悉,映宇宙集团已经接入GPT3.5turbo,GPT4正在接入审核中。同时,映宇宙集团也于近日公布了在AIGC方面的布局计划。相关负责人表示,未来映宇宙在AIGC领域的探索主要有五大方向:数字人直播、互动社交、AI音...
  • 企业家在线 发布于  2023-04-08 15:13  
  • 百分点科技苏萌谈数据科学发展:从1.0到3.0的进阶
  • ,在近日举办的“2023数据科学峰会”上,百分点科技董事长兼CEO苏萌谈到数据科学的发展。他表示,回顾过去50年的发展,数据科学经历过“小数据时代”(数据科学1.0),走进了“大数据时代”(数据科学2.0),再从大数据时...
  • 企业家在线 发布于  2023-04-08 14:52  

企业家在线© 2012-   X3.4