南加州大学研究:人工智能产生的笑话比人类创造的笑话更有趣

afeng135 2024-07-11 世界杯 14 0

扫一扫用手机浏览

文章目录 [+]

鞭牛士报道,7月11日消息,据外电报道,南加州大学最近发布的一项研究发现,人工智能生成的笑话比人类编写的笑话更受欢迎。

近 70% 的参与者认为 ChatGPT 笑话比普通人写的笑话更有趣。相比之下,25% 的人更喜欢人类的笑话,5% 的人认为这些笑话同样有趣。

南加州大学心理学博士生、该研究的研究人员之一德鲁·戈伦茨 (Drew Gorenz) 表示,虽然有证据表明语言模型在分析任务中的表现如何,但人们对其创造性的一面了解甚少。

作为一名喜剧爱好者,戈伦兹很好奇 ChatGPT 与人类喜剧演员相比如何。

「它们不知道欣赏一个好笑话是什么感觉。」他谈到语言模型时说道。「它们大多只是使用模式识别。」

他补充说,研究结果告诉我们很多有关幽默产生的有趣的事情,也许我们不需要感受到一个好笑话所涉及的情感就可以讲一个好笑话。

为了开展这项研究,ChatGPT 和人类都被要求根据各种提示写笑话。一项任务是想出一串字母的有趣缩写。另一项是基于派对游戏 Quiplash 的填空题提示,第三项是写一种幽默的方式来描述一种不愉快的情况。然后由另一组对结果进行评分。

例如:当被要求填写“白宫中一个较少被谈论的房间:__________的空白时,人类想出了白色软垫房间和狗屋,而 ChatGPT 则想出了林肯卧室的外星人阴谋角落和情况室的零食柜。

戈伦兹说,需要注意的一件重要事情是,单口喜剧的笑话如果以纯文本形式呈现,就没那么好笑了。「传递是幽默创作的关键部分。」他说。

在第二项研究中,研究人员要求人工智能聊天机器人改写讽刺网站美国最佳新闻来源洋葱报的标题,以测量 ChatGPT 笑话与专业喜剧作家创作的笑话相比的表现。

在这方面,人类作家的表现要好一些:洋葱新闻标题和 ChatGPT 生成的标题的平均幽默评分相同。

ChatGPT 的头条新闻最高评价为当地男子发现新情感,但仍然无法恰当描述。排名第二的是来自 The Onion 的新闻:男子在脱发变得明显时决定求婚。

南加州大学的研究是在娱乐专业人士(包括喜剧演员)担心人工智能将如何重塑他们的工作之际进行的。

今年 1 月,乔治·卡林 (George Carlin) 的遗产管理人对一家媒体公司提起诉讼,指控该公司使用人工智能重现这位已故单口喜剧演员的风格和素材。

就 Gorenz 而言,研究结果表明,ChatGPT 可能会对喜剧和娱乐业造成严重破坏,尤其是考虑到与科学、教育和新闻业相比,这些行业的准确性标准可能较低。

不过,他并不认为美国最受欢迎的脱口秀喜剧演员会很快离开。「我认为它无法创造出像约翰·穆拉尼那样的笑话。」他说。

美国原子武器研究基地与OpenAI合作:提高前沿模型安全性

鞭牛士报道,7月11日消息,据外电报道,美国原子武器研究基地洛斯阿拉莫斯国家实验室 (LANL) 的研究人员正在与 OpenAI 合作开展一项评估研究,以加强人工智能的安全性。即将进行的评估将是此类评估中的首例,并将为人工智能生物安全评估的最新研究做出贡献。

「人工智能能力不断提升的潜在优势是无穷无尽的。」洛斯阿拉莫斯国家实验室研究科学家 Erick LeBrun 表示。「然而,衡量和了解与生物威胁相关的任何潜在危险或高级人工智能滥用仍在很大程度上尚未得到探索。与 OpenAI 的合作是朝着建立评估当前和未来模型的框架迈出的重要一步,确保负责任地开发和部署人工智能技术。」

人工智能带来的生物威胁可能带来重大风险,但现有研究尚未评估多模态前沿模型如何降低非专家制造生物威胁的门槛。该团队的工作将以之前的研究为基础,并遵循 OpenAI 的准备框架,该框架概述了跟踪、评估、预测和防范新兴生物风险的方法。

在之前的评估中,研究团队发现 ChatGPT-4 在提供可能导致生物威胁的信息方面略有提升。然而,这些实验侧重于人类在书面任务中的表现(而不是生物实验),模型的输入和输出仅限于文本,不包括视觉和语音数据。

即将进行的评估将使用代理任务和材料,通过评估专家执行和排除由标准实验室实验任务组成的安全协议的能力,首次在实验室环境中测试多峰前沿模型。

通过检查 ChatGPT-4o(ChatGPT 的最新版本)所带来的任务完成度和准确性的提升,该团队正在寻求量化和评估前沿模型如何协助现实世界的生物任务。

OpenAI 首席技术官 Mira Murati 表示:作为一家为公众利益服务的私营公司,与公共机构合作是自然而然的事情——我们很高兴宣布与洛斯阿拉莫斯国家实验室建立首个此类合作伙伴关系,以研究生物科学能力。我们相信,这种合作努力将是向前迈出的重要一步,有助于我们了解像我们这样的技术可以为科学研究领域带来的风险和好处。

这些新的评估将支持白宫最近发布的关于安全、可靠和值得信赖的人工智能开发和使用的行政命令,该命令委托能源部国家实验室帮助评估人工智能前沿模型的能力。能源部拥有独特的数据、领导力计算和劳动力来应对这些挑战,非常适合与行业合作开展这些工作。

此外,洛斯阿拉莫斯成立了人工智能风险与威胁评估小组(AIRTAG),专注于制定策略以了解收益和降低风险并帮助促进人工智能工具的安全部署。

洛斯阿拉莫斯信息系统和建模副组长 Nick Generous 说:这种合作是 AIRTAG 努力促进的工作类型的一个很好的例子,旨在帮助了解人工智能的风险,并最终使人工智能技术更加安全。

相关信息:

洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory),简称阿拉莫斯实验室(LANL),位于美国新墨西哥州的洛斯阿拉莫斯,以前因为保密原因对外称为Y地点(Site Y),隶属于美国能源部。 该实验室最初由加利福尼亚大学伯克利分校全权负责运行管理,1952年后移交于加州大学管理,而后在2007年变更为由洛斯阿拉莫斯国家安全机构(加州大学等机构共同构成)运行管理。

洛斯阿拉莫斯国家实验室建立在1943年,曾云集大批世界顶尖科学家,其建立者包括原子弹之父奥本海默、氢弹之父爱德华·泰勒以及诺贝尔物理奖得主欧内斯特·劳伦斯,发明了世界上第一颗原子弹和第一颗氢弹,是著名的科学城和高科技辐射源。

洛斯阿拉莫斯国家实验室是世界上最大的多功能实验室之一,1943年开始秘密运转,当时的第一个任务是曼哈顿计划。

阿拉莫斯实验室的建立是美国历史上的一个重要的里程碑。同时它开启了人类战争史的又一个里程碑—人类进入了核武器威慑时代。

本文转载自互联网,如有侵权,联系删除

本文链接地址:http://scw518.com/post/628.html

相关文章

吕援绩受(1)

颁尝 者女恃归吊誊雳习诲鹿律碧夕,调困藐谤蘑琅匙褒种畔,宴翎凹凳。...

世界杯 2024-07-19 7 0

发表评论