首页 >> 科学研究 >> 学术讲座 >> 正文

人工智能学科交叉讲座系列第【28】期:走向灵活推理 将大语言模型作为非正式逻辑程序

信息来源:     发布时间:2024-06-09     浏览量:



报  告 人:梅洪源

               研究助理教授

                    芝加哥丰田技术学院

主  持 人:林宙辰 教授

                    北京大学智能学院、工智能研究院

时      间:2024年6月14日 10:00-11:00

地      址:燕园校区理科二号楼2736报告厅

                 新燕园校区教学楼102教室

        腾讯会议:375-710-564


 报告题目:

走向灵活推理:将大语言模型作为非正式逻辑程序


 报告摘要:   

        正式逻辑程序(formal logic programs)是人工智能中的有用工具。然而,它们要求用户首先用正式逻辑语言(formal logic)表达问题,这对于许多现实世界的问题来说是困难的。在这次演讲中,我将讨论一个替代范式,使用大型语言模型(LLMs)作为非正式逻辑程序。在这个范式中,命题用自然语言表达,推理步骤由被提示的LLM执行。


        这次演讲将介绍三个由此范式有效解决的问题。第一个是事件序列建模与预测,即基于过去推理未来事件的任务。第二个是自然语言推理(language entailment),即确定一个陈述是否由自然语言前提所推导的任务。第三个是具身推理(embodied reasoning),在这个任务中,机器人需要计划多个步骤来完成任务。对于所有这些问题,我们的范式比使用正式逻辑程序和/或将LLMs作为独立求解器的经典方法取得了更强的结果。我将概述一些未来的研究方向,包括理解LLM的最大似然训练是如何产生出现推理能力的。


报告人简介:   


        梅洪源博士目前是芝加哥丰田技术学院(TTIC)的研究助理教授,并即将加入美国普渡大学(Purdue University)担任助理教授。他在约翰霍普金斯大学(JHU)计算机科学系获得了博士学位,导师是杰森·艾斯纳(Jason Eisner)。


        梅洪源的研究领域涵盖机器学习和自然语言处理。目前,他最感兴趣的是利用并改进大型语言模型的推理能力,以解决诸如事件预测之类的挑战性问题。他的研究得到了彭博数据科学博士奖学金(Bloomberg Data Science PhD Fellowship)、2020年JHU杰里内克纪念奖(2020 JHU Jelinek Memorial Award)、以及来自Adobe和蚂蚁集团的研究赞助支持。他的技术创新已经被整合到实际产品中,如支付宝——世界上最大的移动数字支付平台,服务超过十亿用户。他的研究成果还曾被《财富》杂志(Fortune Magazine)和《彭博科技》(Tech At Bloomberg)报道。