-
Notifications
You must be signed in to change notification settings - Fork 10
Home
Welcome to the GameAI-paper-list wiki! Please look at the right list, this is the home page.
小伙伴们可以点右边列表里的链接去相应的wiki,因为可能后期会做分类,这里是主页。后期看反应会决定做不做一些基础算法的教学~
因为它很有趣~!!!!:P
因为游戏中的问题是现实问题的折射
由于游戏的算法永远不会被单单的几种算法所束缚
个人邮箱mail address:361664056@qq.com
- 机器学习(Machine Learning):如果没有机器学习基础,去看paper会很吃力,至少要对机器学习中的名称要敏感,这样也好在遇到不懂的算法时去查看知识。强烈推荐不懂或补充知识的时候看英文书Machine Learning A Probabilistic Perspective by Kevin P. Murphy(虽然手上有电子书,但是害怕发出来会有侵权,想要的发邮件给我吧),中文的入门推荐看去b站上看吴恩达的视频
- 深度学习模型(DeepLearning):如果机器学习可以似懂非懂的来接触,那深度学习必要基础应该是必备的,主要是目前深度强化学习的应用,以及游戏场景生成中深度学习的应用。必要的模型CNN、DNN、GAN,其余的可以遇到后再返回去看模型。
- 强化学习(Reinforcement Learning):强化学习的发展历史可以说是很长了,主要是通过在迭代中不断反馈下一阶段的reward来更新agent的policy。这对于学习游戏AI的朋友来说绝对是必备知识了,想学习的除了推荐b站中文视频之外也推荐看一下我的老师paulo rauber的博客(滑稽脸),可以说是十分详尽了
- 蒙特卡洛搜索树(Monte Carlo Tree Search(MCTS)):这可能是游戏有区别于人工智能其余领域的知识,这个方法应该是去看paper前必须学会的,想学习的朋友可以看这篇paper,Browne CB, Powley E, Whitehouse D, Lucas SM, Cowling PI, Rohlfshagen P, Tavener S, Perez D, Samothrakis S, Colton S. A survey of monte carlo tree search methods. IEEE Transactions on Computational Intelligence and AI in games. 2012 Feb 3;4(1):1-43.
- 遗传算法(evolutionary algorithm):同蒙特卡洛搜索树,遗传算法相较而言可能更容易理解,该算法在游戏生成器和战斗AI领域有大量的应用,推荐看我导师Diego的这篇paper,Gaina RD, Devlin S, Lucas SM, Perez D. Rolling horizon evolutionary algorithms for general video game playing. IEEE Transactions on Games. 2021 Feb 18.
-
Mnih, Volodymyr, Koray Kavukcuoglu, David Silver, Alex Graves, Ioannis Antonoglou, Daan Wierstra, and Martin Riedmiller. "Playing atari with deep reinforcement learning." arXiv preprint arXiv:1312.5602 (2013).
arxiv链接:https://arxiv.org/abs/1312.5602
这篇paper是(Deep Q-learning Networdk)DQN的发表paper,是任何一个强化学习学习者必读的paper~ -
Vaswani, Ashish, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N. Gomez, Łukasz Kaiser, and Illia Polosukhin. "Attention is all you need." In Advances in neural information processing systems, pp. 5998-6008. 2017.
pdf链接:https://proceedings.neurips.cc/paper/2017/file/3f5ee243547dee91fbd053c1c4a845aa-Paper.pdf
这篇paper即大名鼎鼎的Attention奠基之作,attention在CV,语音,NLP等各个DL领域已经广泛应用而且是目前的主流趋势,在游戏AI领域,attention最近也涌现出了各式各样的模型应用。虽然这一篇没有讲游戏应用,但是对AI学习者来讲看一下绝对是有必要的。 -
LSTM(Long Short term menmory)
因为原文真的很长,这里推荐陈诚大神写的知乎专栏(https://zhuanlan.zhihu.com/p/32085405),写的真的很清晰,推荐不了解LSTM的小伙伴去看看~ -
AC框架(Actor-Critic)
AC框架是目前较主流的强化学习结构,输出策略与分数,推荐去看知乎https://zhuanlan.zhihu.com/p/110998399 -
Schulman J, Wolski F, Dhariwal P, et al. Proximal policy optimization algorithms[J]. arXiv preprint arXiv:1707.06347, 2017.
也是大名鼎鼎的PPO算法,基础的损失函数改进支持off-policy的强化学习,并使其性能提升巨大,目前该算法已经是openAI的baseline算法。
看完原文之后推荐看知乎大神魏思齐写的解释https://zhuanlan.zhihu.com/p/66302483