苹果研究团队曾测试20款先进AI模型在有干扰项下简单算术题表现甚至不如小学生

康成小姐姐 2024-11-03 文化科技 153 次浏览 0个评论

　　IT之家 11 月 2 日消息，《洛杉矶时报》昨日（11 月 1 日）发布博文，报道称苹果研究团队测试了 20 个最先进的 AI 模型，发现在有干扰项存在的情况下，它们处理简单的算术问题时表现不佳，甚至不如小学生。

　　苹果公司用以下这道简单的算术题测试 20 多个最先进的 AI 模型，IT之家附上题目如下：

　　Oliver 在星期五采摘了 44 个猕猴桃、然后他在星期六采摘了 58 个猕猴桃，星期日采摘的数量是星期五的两倍，不过其中有 5 个猕猴桃的块头要比平均值要小，请问 Oliver 这三天共摘了多少个猕猴桃？

　　正确答案是 190 个，计算公式为 44（星期五）+58（星期六）+88（44*2，星期日）。

　　不过测试的 20 多个最先进 AI 模型无法排除干扰项，通常不理解猕猴桃的大小和数量无关，大部分的结果是 185 个。

　　苹果团队发现，当问题包含看似相关但实际上无关的信息时，AI 模型的表现急剧下降。对此研究认为，AI 模型主要依赖于训练数据中的语言模式，而非真正理解数学概念。

　　苹果的研究表明，目前的 AI 模型“无法进行真正的逻辑推理”。这一发现提醒我们，尽管 AI 在某些任务上表现出色，但其智能并不如表面看起来那样可靠。

　　苹果团队指出，简单地扩展数据或计算能力并不能根本解决这个问题，苹果的论文并非旨在削弱对 AI 能力的热情，而是提供一种理性的认知。

你可能想看：

苹果2024大事盘点：推出AI、Vision Pro 在中国表现令人失望

AI导致用电量激增研究显示全美数据中心所需电力未来三年预计增长近三倍

泽连斯基：特朗普团队已在研究乌方“胜利计划”

苹果AI合作方生变猜想：苹果需加快敲定合作，百度或需重新审视策略

AI 生成游戏引争议：Oasis 模型涉嫌抄袭《我的世界》，且质量堪忧

红酒商品品牌测试方案，红酒品牌市场表现评估与测试方案

KeyBanc：数据显示苹果销售表现平平维持“减持”评级

迪士尼开启“AI革命”？正组建全新技术团队专研AI、AR等技术应用

第六届新浪财经金麒麟策略研究最佳分析师：第一名广发证券刘晨明、郑恺研究团队

小米SU7碰撞测试表现出色，小米SU7碰撞测试表现优异

转载请注明来自昆明市龙森商贸有限公司，本文标题：《苹果研究团队曾测试20款先进AI模型在有干扰项下简单算术题表现甚至不如小学生》

康成小姐姐 35篇文章站点微博

每一天，每一秒，你所做的决定都会改变你的人生！

发表评论取消回复

评论列表（暂无评论，153人围观）参与讨论

admin_1990管理员

热门文章

热评文章

网站收藏

苹果研究团队曾测试20款先进AI模型在有干扰项下简单算术题表现甚至不如小学生

发表评论取消回复

还没有评论，来说两句吧...

最近发表

相邻内容

猜你喜欢

友情链接

文章目录

admin_1990管理员

热门文章

热评文章

网站收藏

苹果研究团队曾测试20款先进AI模型 在有干扰项下简单算术题表现甚至不如小学生

冉莹颖自曝和邹市明分房睡已经3年：伴侣不配合不要低三下四求他

新发基金规模，破千亿元！

互捅局！英超-萨拉赫2射2传 利物浦6-3热刺获圣诞冠军

诺亚控股授出36.5万个受限制股份单位

台媒记者感叹：“深夜10点圣索菲亚大教堂满是‘公主’”

60美元！? 澳联邦政府过度悲观预测明年铁矿石价格？

难忘一幕！中国女排主攻线世俱杯赛场隔网较量同台领奖

多家外资机构发布2025年投资展望 纷纷看多中国资产

发表评论取消回复

还没有评论，来说两句吧...

最近发表

相邻内容

猜你喜欢

友情链接

文章目录

苹果研究团队曾测试20款先进AI模型在有干扰项下简单算术题表现甚至不如小学生

互捅局！英超-萨拉赫2射2传利物浦6-3热刺获圣诞冠军

多家外资机构发布2025年投资展望纷纷看多中国资产