首页 > 活动线报 > 每日福利 > 如何减少AI“一本正经地胡诌”?新方法出现了

如何减少AI“一本正经地胡诌”?新方法出现了

发布时间:2024-06-25 16:51:54

人工智能(AI)中广泛使用的大语言模型不时出现的“一本正经地胡诌”是其难以克服的问题。近日,英国牛津大学研究团队开发出一种名为“语义熵”的新方法,有望大幅提升AI回答的可靠性。

大语言模型的“胡诌”在业界被称为“幻觉”,牛津大学计算机科学系的研究人员提出“语义熵”方法试图解决这一问题。在热力学中,熵描述的是系统的混乱或者说不稳定程度。这项研究中,熵衡量了大语言模型回答的不确定性,不确定性高意味着大语言模型的回答可能存在虚构。

该研究成果已发表在近期出版的英国《自然》杂志上。论文中说,如果AI对同一个问题,给出了许多语义相似的答案,那说明它对自己的回答比较有把握;反之,如果答案五花八门,那就意味着AI自己也“心里没底”,很可能是在“胡诌”。

研究人员利用“语义熵”方法,让大语言模型对同一问题生成多个答案,然后将语义相近的答案聚类,最后根据聚类结果计算熵值。熵值越高,表示大语言模型的回答越不确定。

值得注意的是,这一方法不仅考虑了大语言模型回答的字面差异,更关注语义层面的一致性。这使得“语义熵”能够更准确地识别AI的“胡诌”,而不会被表达方式的多样性所迷惑。

研究结果表明,“语义熵”方法在多个数据集和任务中都表现出色,能有效检测大语言模型的错误回答,并通过拒绝回答不确定的问题来提高整体准确率。更重要的是,这一方法无需修改AI模型本身,可以直接应用于现有的大语言模型。

研究人员说,“语义熵”技术有望在问答系统、文本生成、机器翻译等多个领域发挥重要作用,帮助AI生成更可靠、更有价值的内容。这不仅将提升AI在实际应用中的表现,也将增强用户对AI系统的信任。

每日福利更多>>

小米辣920:直播界的“百变歌姬”,用音乐诠释多元魅力 华为到底有哪些部门?一图看懂 华为官宣,Pura 80来了,两个半小时预约人数突破4万! 京东方推出全球首款13.3寸FMLOC集成AES 3.0 主动笔OLED 严禁携带手机等违禁物品!省教育考试院发布高考温馨提醒 小米P15ZM充电宝口袋版限时特惠,直降34元仅需75.65元 小鹏和华为 这slogan好熟悉, 看见未来,为何不buy Q1全球手机市场排名出炉:小米第三,苹果第二,第一不是华为! 包头市青山区三星小学——聚焦教研促提升,共筑教育新未来 北京城市副中心成为国内首个绿建三星级标准地区 手机、电脑屏幕脏了能用酒精擦吗?正确方式 618限时特惠 华硕a豆14 Air悦享版 国补后仅需4239元起 联想来酷“斗战者战 7000”官宣,号称全民超能游戏本 小米辅助驾驶再迎大将 前一汽南京CTO陈光加入 福建:与华为就海洋经济达成合作意向 拟组建数字海洋建设工作专班 OPPO Find X9 Ultra首曝:双2亿像素史无前例 戴尔 Pro Max Plus:独立 NPU 登陆移动端 毕业季购机前瞻,高性能轻薄本华硕天选Air 2025首发到手7099元 每日网签 | 5月28日北京新房网签328套、二手房网签823套 燕郊楼市现“调价补差”项目 推动\"去存量\" 与 \"促消费\" 良性循环 铁头TILTA索尼A7/A9套件选配件9.9元热卖 小米15S Pro更新澎湃OS2.0.126体验:不吐不快,真实感受 配备专业背滤系统:小米米家智能桌面鱼缸国补后 205 元新低 曝华为nova 13系列出货量超650万部 标准版是主力 RTX 5050入门笔记本功耗居然涨了!最低也有50W 三星电机拟引入喷墨打印技术生产镜头模块 最早或用于Galaxy S26系列旗舰机 谷歌处理器告别三星代工,可能不只是因为“嫌弃” 618购机指南:华硕天选6 Pro、ROG枪神9超竞系列以及ROG幻16 Air满足你的不同需求 城商行陆续下调存款利率 利率降至“1字头” 美国3月份房价涨幅放缓 但供应紧张地区买家仍深陷竞价战