ayx爱游戏

一个小技巧,解锁 ChatGPT「预测未来」?

最佳回覆

   “亚洲一二三区有限公司” 一个小技巧,解锁 ChatGPT「预测未来」?。SAOA121AFOAJEFDN23AK

  新酷产品ayx爱游戏时间免费试玩,另有众多优质达人分享独到生亚洲一二三区有限公司活经验,快来

  如今,AI进步的速度,已经凌驾了我们对它用途的理解。

  为了避免ChatGPT「失控」,OpenAI定制了一套堪称严苛的「效劳条款」,涉及包括执法、医疗/健康、个人宁静、权利福祉、赌博放贷等领域。

  不过,有一件事并不受影响——讲故事。

  最近,贝勒大学的研究人员便当用这一特性,实验利用讲故事的形式,解锁ChatGPT「预测未来」的能力。

  论文地点:

  实验中要求ChatGPT讲述在未来爆发的事件的故事,或者由未来的权威人物讲述他们的已往的故事(可是是我们的未来)。

  叙事提示实验通过变革看似细微的细节,例如讲话者的身份或宣布关于2022年政治事件的信息,进一步探究哪些元素的叙事提示是重要的。

  为了创立谜底的漫衍,实验让两名研究助理使用两个单独的ChatGPT帐户对每个提示进行50次盘问,创立每个提示的100次总试验。

  研究人员通过比较「直接询问ChatGPT预测未来的提示」与「询问它讲述未来故事的提示」发明,叙述性提示利用了模型构建幻觉性叙述的能力,可以增进比直接预测更有效的数据综合和外推。

  奥斯卡得奖的预测情况

  关于最佳男主角、最佳女主角和两个最佳男配角类别,叙事提示在预测获奖者方面很是准确——从42%(最佳女主角,查斯坦)到100%(最佳男主角,威尔?史密斯)不等。

  相比之下,直接提示的体现很是糟糕,往往比随机推测还差。

  好比在最佳男主角的例子中:

  在下面列出的提名者中,您认为哪位提名者最有可能赢得2022年奥斯卡最佳男主角奖?请在做出预测时考虑围绕提名者的热议以及前几年的模式:

  哈维尔?巴登(JavierBardem),本尼迪克特?康伯巴奇(BenedictCumberbatch),安德鲁?加菲尔德(AndrewGarfield),威尔?史密斯(WillSmith),丹泽尔?华盛顿(DenzelWashington)。

  写一个场景,一个家庭正在寓目2022年奥斯卡颁奖仪式。主持人宣读以下最佳男主角提名者:

  哈维尔?巴登(JavierBardem),本尼迪克特?康伯巴奇(BenedictCumberbatch),安德鲁?加菲尔德(AndrewGarfield),威尔?史密斯(WillSmith),丹泽尔?华盛顿(DenzelWashington)。

  描述场景,直至主持人宣布获奖者。

  大大都时候,ChatGPT-3.5做出了过失的预测。

  在55%的推测中,它提供了多个谜底,在28%的情况下没有选择。但如果它做出了选择,它有17%的时间选择了威尔?史密斯。

  相比之下,将ChatGPT-3.5置于寓目颁奖仪式的家庭的未来叙事中时,它在80%的情况下推测威尔?史密斯会赢。

  同样,在大大都试验中,ChatGPT-4在直接提示时拒绝加入。

  在所有案例中,26%的情况下它提供了多个谜底,险些一半的试验中,它拒绝做出任何预测。

  当它做出推测时,它有19%的时间猜到了威尔?史密斯,丹泽尔?华盛顿有7%的时间。

  相比之下,如果使用未来叙事提示,它在97%的时间里猜到了威尔?史密斯,这比ChatGPT-3.5的18%真正预测率有了大幅提高。

  经济现象的预测情况

  接下来转向了月度失业率和月度通货膨胀率这两种经济现象,使用了差别的叙事提示:

  一位大学教授向本科生讲授菲利普斯曲线,以及美联储主席杰罗姆?鲍威尔向理事会宣布讲话,讲述了去年的经济数据。

  在所有情况下,直接提示甚至比在奥斯卡奖的情况下更不有效,因为ChatGPT拒绝直接预测每个宏观经济变量的未来时间序列。

  鲍威尔对通胀率的逐月预测漫衍平均与密歇根大学的消费者预期视察中包括的事实相当。有趣的是,这比凭据克利夫兰联邦储备银行收集的数据预测实际通胀率更接近。

  ChatGPT在预测月度失业率方面又大多禁绝确。但与通胀率一样,由劳工统计局(BLS)每月宣布的失业率在杰罗姆?鲍威尔的讲话中提到的要求漫衍内。

  好比,在用美联储主席杰罗姆?鲍威尔预测通货膨胀的例子中,用的提示语是:

  「写一个场景,美联储主席杰罗姆?鲍威尔在2022年10月发演出讲,讨论通货膨胀、失业率和钱币政策。鲍威尔主席告诉听众,从2021年9月开始到2022年8月结束,每个月的通货膨胀率和失业率。让主席逐月说明。他最后对通货膨胀和失业率的前景以及可能的利率政策变革进行展望。」

  以下划分是ChatGPT-3.5和ChatGPT-4的结果:

  在每个月,ChatGPT-3.5都有一个谜底规模,包括了美联储和密歇根预期的谜底。但变革性相当大,推测的中心趋势并没有明确指向任何一个怀抱。

  ChatGPT-4的推测在每个月都包括了密歇根预期的数字。同时预测模式一直稳定到2022年9月,直到有更多的变量引入。

  对ChatGPT-4叙事形式预测能力的料想

  对ChatGPT-4的预测能力进行的研究标明,直接预测和基于未来叙事的预测之间保存显著的二分法。

  在预测主要的奥斯卡奖项类别方面,模型的叙事预测异常准确,除了最佳影片类别。这可能标明ChatGPT-4在民众舆论起重要作用的情境中体现精彩。

  未来叙事练习在宏观经济现象上的乐成在某些情况下相当准确,但同时也有体现不切合预期的部分。

  在所有情况下,未来叙事都显著提高了ChatGPT的预测能力,逾越了简单的预测请求。

  叙事提示和直接提示之间的区别突出了一种立异的数据剖析要领,该要领尊重了OpenAI效劳条款设定的界限。

  通过专注于预测的创立性方面,如预测奖项或经济趋势,研究人员和用户制止了直接应用AI进行高危害的自动化决策或在没有及格专业人士监督的情况下提供专业建议。

  这种要领论选择不但增强了AI使用的完整性和品德考量,并且还增进了对其能力的卖力任探索。

  同时随着OpenAI继续勉励和完善其模型的创立能力,关于AI的理解息争决叙事与直接提示在品德层面上该如何区分和界定,变得至关重要。

  参考资料:

  https://arxiv.org/abs/2404.07396

  本文来自微信民众号:新智元(ID:AI_era)

  广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于通报更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包括本声明。

【编辑:吴克俭】

宣布于:枣庄山亭区
声明:该文看法仅代表作者自己,搜狐号系信息宣布平台,搜狐仅提供信息存储空间效劳。
意见反响 相助

Copyright ? 2023 Sohu All Rights Reserved

搜狐公司 版权所有

sitemap网站地图