五子棋博弈树算法,蒙特卡洛树与蒙特卡洛算法
今天小编为大家分享Windows系统下载、Windows系统教程、windows相关应用程序的文章,希望能够帮助到大家!
#AMiner必读论文推荐#
#蒙特卡洛树搜索#
论文集地址:蒙特卡洛树搜索 - 必读论文 - AMiner
蒙特卡洛树搜索全称Monte Carlo Tree Search,是一种人工智能问题中做出最优决策的方法,一般是在组合博弈中的行动(move)规划形式。它结合了随机模拟的一般性和树搜索的准确性。MCTS受到快速关注主要是由计算机围棋程序的成功以及其潜在的在众多难题上的应用所致。超越博弈游戏本身,MCTS理论上可以被用在以{状态state,行动action}对定义和用模拟进行预测输出结果的任何领域。
该论文集共收录50篇论文,引用最多的论文为Deep Learning for Real-Time Atari Game Play Using Offline Monte-Carlo Tree Search Planning,引用数是317。
AMiner学术搜索,学者+论文助你快速获得想要信息:AMiner - AI赋能科技情报挖掘
#AMiner# #论文#
#人工智能# #王者荣耀[超话]# 英雄选择在MOBA游戏中至关重要,因为它可以建立双方的团队并直接影响比赛结果。 最新的制图方法没有考虑:1)扩大英雄库时的制图效率; 2)MOBA 5v5比赛系列的多轮比赛性质,即两支球队打出N佳,而同一英雄只能在整个系列赛中选拔一次。 在本文中,我们将选择过程公式化为一个多轮组合博弈,并提出了一种基于神经网络和蒙特卡洛树搜索的新颖起草算法,名为JueWuDraft。 具体来说,我们设计了一种长期价值估算机制来处理N种最佳起草案例。 以目前最流行的MOBA游戏之一“王者荣耀”为例,我们证明了JueWuDraft与最先进的制图方法相比的实用性和有效性。
论文题目:Which Heroes to Pick? Learning to Draft in MOBA Games with Neural Networks and Tree Search
论文链接:网页链接
基于BAT-MCS的长短时记忆递归神经网络在二元状态网络近似时间依赖性问题上的应用
可靠性是评估现代网络性能的一个重要工具。目前,当每个组件的可靠性被假定为固定时,计算一个二元状态网络的精确可靠性是NP-hard和#P-hard。然而,这种假设是不现实的,因为每个组件的可靠性总是随时间变化的。为了满足这一实际要求,我们提出了一种新的算法,称为LSTM-BAT-MCS,它基于长短时记忆(LSTM)、蒙特卡洛模拟(MCS)和二元适应树算法(BAT)。三个基准网络的实验结果证明了提议的LSTM-BAT-MCS的优越性,其均方误差最多为10-4。
《Application of Long Short-Term Memory Recurrent Neural Networks Based on the BAT-MCS for Binary-State Network Approximated Time-Dependent Reliability Problems》
论文地址:网页链接
地外自我复制探测器的 Lotka–Volterra 模型
足够先进的地外文明可以发射一群自我复制的探测器进行太空探索。考虑到这种探测器的数量在快速增长,即使在银河系中只有一个地外文明在发射这样的探测器,我们仍然应该期待看到它们。我们不是费米悖论的一部分,自我复制探针最终会发生突变,消耗它们的祖细胞,从而显著减少总探针的数量,这一观点在文献中已被研究过,但已被驳回。
在这项工作中,我们用一个更现实的Lotka-Volterra模型重新审视了这个问题,并表明突变的探测器将驱动先祖探测器“灭绝”,从而取代它们在整个星系中扩散。因此,突变探针在减少自我复制探针总数方面的效率甚至低于之前的设想。作为分析的一部分,我们还建议,在设计自我复制探针时,人们不应该在足够的突变导致探针无法识别祖探针为“自我”时停止复制。
引言:费米悖论和自复制探针
虽然目前还不清楚宇宙中智能生命的分布有多广泛,但最近蒙特卡洛的一项乐观估计显示,仅在我们的银河系[1]中就有约42000个外星智能文明在进行通信。如果有这么多外星文明,为什么我们一个都没有发现呢?这就是著名的费米悖论,或称“大沉默”[5]。当然也不乏可能的解释(假设生命的出现并不罕见),例如:它们可能不热衷于交流(可能是害怕招致敌对物种的不必要注意);文明通常倾向于以这样或那样的方式毁灭自己。
我们被认为在技术上不够先进,也不够有趣,不值得与之交流,而且被故意隔离,仅举几个例子。我们能想到的所有关于费米悖论的不同情景当然都是以人类为中心的——我们不知道外星物种会怎么想。
然而,缺乏任何确认的来自外太空的信号并不是这个谜团唯一令人困惑的方面。我们期望任何足够先进的文明都能够设计和制造自我复制的探测器(srp,也被称为“复制器”或冯·诺伊曼探测器[16]),甚至可能是可以被集体发射到星际空间探索宇宙的“纳米机器人”。
有人认为,即使对我们来说,小规模的、部分自我复制的探针近期也是可行的。除了纯粹的探索,srp还可以用于征服——消灭所有其他文明(被视为竞争对手或潜在威胁),并接管他们的资源。srp使费米悖论变得更糟,因为这样的复制过程(假设资源几乎无限)将是指数级的,这意味着即使只有一个文明在进行这种复制(保守估计银河系中有O(1)到O(102)个先进文明),它们的探测器也应该在合理的时间内(O(106)到O(109)年之间)传遍整个星系。考虑到我们在银河系的舞台上还很年轻,我们应该被srp包围。我们不需要解释的事实。
一种可能性是srp最终会“突变”。虽然复制过程中的小错误只会产生子变异探针,但更大的错误可能会导致新的srp种群,它们不再把祖探针视为“自己的”(而不是“外来的”),而是将其视为要消耗的资源。我们将这些突变的srp称为“捕食者”,而其余的则称为“猎物”。
这种与生物系统的比较并不完全是一种类比,因为srp在某种意义上可能是部分生物的,因为它们是人工蛋白质组学或分子机器。他们的想法是,捕食可能会减少srp的总数,从而解释了为什么我们没有检测到它们。在中,作者通过用最小生成树建模srp从一个恒星系统到另一个恒星系统的传播,以及用Lotka-Volterra模型建模捕食者和猎物srp之间的动态,研究了这一场景。得出的结论是,这种情况不能充分减少猎物srp,因此,费米悖论仍然没有解决。
正如我们将在下一节解释的那样,以上假设有一些缺点,用Lotka-Volterra方程建模捕食者-被捕食者系统需要注意应该包括什么样的项。在此基础上,我们提出了一个更符合实际的方程来研究物种间的相互作用。我们的模型清楚地解释了为什么捕食者srp不能解决费米悖论。
复制因子的Lotka-Volterra模型
除了从一个星系到另一个星系的迁移效应,中假设的Lotka-Volterra模型本质上是标准的“普通的”footnote1形式:
其中x=x(t),y=y(t)分别为被捕食者和捕食者的数量。假设系数α、β、δ、γ为正。它们分别控制着猎物的增长率、因捕食而减少的猎物数量、因捕食而增加的捕食者数量和捕食者物种的自然死亡率。有人可能会问,为什么不包括猎物物种的自然死亡率。
原因很简单:我们可以添加这样一个项- α ' x(其中α ' >0),但在健康人口中,增长率无论如何都应该大于死亡率,因此总体效果为(α−α ')x,其中α−α ' >0。所以吸收α '和处理α更容易。由于系数是未知的,我们只对定性特征感兴趣。因此,时间t的单位不指定。
wWw.Xtw.com.Cn系统网专业应用软件下载教程,免费windows10系统,win11,办公软件,OA办公系统,OA软件,办公自动化软件,开源系统,移动办公软件等信息,解决一体化的办公方案。
免责声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。内容仅供参考使用,不准确地方联系删除处理!
联系邮箱:773537036@qq.com