当前位置:业界 > 正文
每日快报!科学家解决了近60年的“墙面追击”博弈论难题
2023-04-29 05:29:34 来源: cnBeta

为了理解自动驾驶车辆在复杂道路上的导航能力,科学家们经常求助于博弈论--这是数学的一个分支,涉及代理人在努力实现其目标时的理性行为建模。多年来,加州大学圣克鲁斯分校电气和计算机工程系教授德扬-米卢蒂诺维奇(Dejan Milutinovic)与其他研究人员合作,研究被称为微分博弈的复杂博弈理论子集。


(资料图)

博弈论是数学的一个分支,研究个人或群体之间的决策和战略互动。它被用来分析参与者必须做出影响游戏或局势结果的选择的情况。博弈论为理解个人或群体如何做出决策提供了一个框架,同时考虑到其他人的行动和反应。它被用于各个领域,如经济学、政治学、心理学和生物学,以分析现实世界的情景,包括谈判、拍卖、市场竞争,甚至军事战略。通过了解每个参与者的动机、激励和约束,博弈论有助于对情况下最可能的结果做出预测。

这个领域与运动中的玩家有关。在这些博弈中,墙面追击博弈提供了一个相对简单的框架,即一个较快的追击者旨在捕获一个限于沿墙移动的较慢的逃避者。

自从这个博弈在近60年前首次被描述以来,博弈中一直存在着一个两难问题--一组被认为不存在博弈最优解的位置。但是现在,米卢蒂诺维奇和他的同事在发表在《IEEE自动控制期刊》上的一篇新论文中证明,这个长期存在的困境实际上并不存在,并引入了一种新的分析方法,证明追墙游戏总是存在一个确定性的解决方案。这一发现为解决微分博弈领域中存在的其他类似挑战打开了大门,并能更好地推理无人驾驶汽车等自主系统。

博弈论被用来推理各个领域的行为,如经济学、政治学、计算机科学和工程学。在博弈论中,纳什均衡是最普遍认可的概念之一。这个概念是由数学家约翰-纳什提出的,它定义了游戏中所有玩家的游戏最佳策略,以最小的遗憾完成游戏。任何选择不采取博弈最优策略的玩家最终都会有更多的遗憾,因此,理性的玩家都会有动力去采取他们的均衡策略。

这个概念适用于追墙游戏--对于追击者和逃避者这两个玩家来说,经典的纳什均衡策略对描述了他们在几乎所有位置的最佳策略。然而,在追击者和逃避者之间有一组位置,对于这些位置,经典分析无法得出博弈的最优策略,并以困境的存在而告终。这组位置被称为奇异面--多年来,研究界已将两难境地视为事实。

但米卢蒂诺维奇和他的合著者们不愿意接受这一点。

"这困扰着我们,因为我们认为,如果逃避者知道有一个奇异的表面,就有一种威胁,即逃避者可以去奇异的表面并滥用它,"Milutinovic说。"逃避者可以迫使你去奇异面,在那里你不知道如何以最佳方式行事--然后我们只是不知道这在更复杂的游戏中会有什么影响。"

因此,米卢蒂诺维奇和他的合作者想出了一个新的方法来处理这个问题,使用一个在最初构想追墙游戏时还不存在的数学概念。通过使用汉密尔顿-雅各比-艾萨克斯方程的粘性解,并引入解决奇异面的损失率分析,他们能够发现在游戏的所有情况下都可以确定一个游戏的最优解,并解决这个难题。

偏微分方程的粘性解是一个直到20世纪80年代都不存在的数学概念,它为汉密尔顿-雅各比-艾萨克斯方程的解提供了一个独特的推理思路。现在众所周知,这个概念与推理最优控制和博弈论问题有关。

使用粘性解也就是函数来解决博弈论问题需要使用微积分来寻找这些函数的导数。当与博弈相关的粘性解具有明确的导数时,找到博弈最优解就相对容易。但追墙游戏并非如此,这种缺乏明确导数的情况造成了两难的局面。

通常情况下,当两难境地存在时,一个实用的方法是玩家随机选择可能的行动之一,并接受这些决定带来的损失。但这里有一个问题:如果有损失,每个理性的玩家都会想把它最小化。

因此,为了找到玩家如何最小化他们的损失,作者分析了汉密尔顿-雅各比-艾萨克斯方程在导数定义不明确的奇异表面周围的粘性解。然后,他们在方程的这些奇异表面状态中引入了损失率分析。他们发现,当每个行为者将其损失率降到最低时,他们在奇异曲面上的行动就有明确的博弈策略。作者发现,这种损失率最小化不仅定义了奇异面的博弈最优行动,而且还与经典分析也能找到这些行动的每个可能状态下的博弈最优行动一致。

"当我们采取损失率分析并将其应用于其他地方时,经典分析中的博弈最优行动并没有受到影响,"米卢蒂诺维奇说。"我们采取经典理论,并用损失率分析来增强它,所以在任何地方都存在一个解决方案。这是一个重要的结果,表明增强不只是为了在奇异表面上找到一个解决方案,而是对博弈理论的一个基本贡献。"

米卢蒂诺维奇和他的合作者们有兴趣探索其他具有奇异表面的博弈论问题,他们的新方法可以应用于这些问题。这篇论文也是向研究界发出的一个公开呼吁,希望他们也能类似地研究其他困境。

"现在的问题是,我们能解决什么样的其他困境?"Milutinovic说。

标签:

责任编辑: jkl2