基于神经驱动的多智能体强化学习方法研究开题报告

 2021-08-14 16:10:02

1. 研究目的与意义(文献综述)

神经网络作为一种新兴的信息处理科学,是对人脑若干基本特性的抽象和模拟。它的主要是以人脑的工作模式为理论基础,研究自适应和非程序化的信息处理方法。它的工作机制是通过网络中的海量神经元来实现自身的信息处理能力,模拟人脑的结构和各个神经元的功能,实现模拟人脑的处理信息的功能。关于神经网络的研究并不是一帆风顺的,最早的关于神经网络的研究发生在1890年,美国心理学家william james发表了《心理学原理》一书,该书论述了相关学习、联想记忆的基本原理,对人脑的功能做了创见性的工作。但是在这之后,神经网络的发展受到的限制,一直没有取得突破性的进展。近十年来,神经网络理论与实践有了引人注目的发展,它再一次拓展了计算概念的内涵,使神经计算、进化计算成为新的学科,神经网络的软件模拟得到了广泛的应用。

多智能体系统是由多个可计算的智能体组成的集合,其中每个智能体是一个物理的或抽象的实体,能作用于自身和环境,并与其它智能体通讯。多智能体主要研究自主的智能体(agent)之间智能行为的协调,为了一个共同的全局目标,也可能是关于各自的不同目标,共享有关问题和求解方法的知识。

自七十年代后期以来,随着计算机网络、计算机通信和并行程序设计技术的发展,作为人工智能和分布式计算的结合,分布式人工智能(dai,distributed artificial intelligence)正日益受到人们的关注。dai早期的研究主要是分布式问题求解,其目标是要创建描述自然和社会系统的概念模型。多智能体系统是dai重要研究领域。由于mas更能体现人类社会智能,具有更大的灵活性和适应性,更加适合开放、动态的社会环境,因而受到越来越多的重视。多智能体系统的研究成为分布式人工智能的热点,实际系统的分布性、复杂性和动态性有望通过对单个个体能力的有效分工、协调和组织而达到系统整体优化的目的。近几年来,多智能体系统日益成为人工智能领域的研究热点多智能体技术具有自主性、分布性、协调性,并具有自组织能力、学习能力和推理能力。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容与方案

本课题需要完成的基本内容是:掌握神经网络和机器学习的几种经典的算法,例如最简单的反向传播算法,并对算法进行改进和优化,结合多智能体学习,将改进算法应用到多智能体学习中去,提高学习效率和精确性。

1.了解神经网络的发展历程,对发展过程中的经典算法进行学习和研究。

2.关注近年来神经网络、深度学习和多智能体学习的发展动向。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究计划与安排

第1-2周:查阅相关文献资料,确定研究方向(神经网络、多智能体学习),

拟定论文题目;

第3-4周:查阅相关文献资料,明确研究内容;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献(12篇以上)

1. s hsebastian, learning in spiking neural networks by

reinforcementof stochastic synaptic transmission,《neuron》,2003,

40(6):1063-73

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。