9小时攒一个C++控制台中国象棋程序-树莓派x64开发

发布于2021-06-06 18:03 阅读(1599) 评论(0) 点赞(16) 收藏(2)

前面有同学想做中国象棋的游戏，丁老师夸口一天能做完，结果被抓住了辫子，要在晚自习结束前，12小时内做完（不离开机房，不能上网）。用手机搜索一下，一般用最小最大策略搜索来弄。基于深度学习的程序，没有基础，一天定然是做不出来的，因此，我们先用搜索算法做一个能够玩的样本来。最终发现，效果还挺好，具有一定的棋力，尤其是残局。
代码详见
https://codechina.csdn.net/coloreaglestdio/qtcpp_demo/-/tree/master/chesspi
对奕过程可以参考
例子文件

1. 问题分析

中国象棋复杂的不是绘图和贴图，主要有三部分。

规则控制。包括不同籽粒的走位、杀、将。仔细的控制走位，避免异常的违规走位。
内存控制。在可控的内存下完成搜索树的构建。描述棋子状态的参数要尽可能的小，否则要不了3,4层，内存就耗尽了。
决策算法。既要考虑自己的损失，也要考虑击杀对手。

我们使用GNU C++ 64bit 在RaspberryPi4 8GB 版本的控制台Bash终端里实现一个字符界面的象棋程序，在12小时的工作量内完成开发（笔者用了9小时）。界面类似下图，通过输入横纵坐标来移动棋子。
注意笔者使用的树莓派有8GB内存，安装了64位的OS。在PC Windows下或者Linux下，本代码也建议用64位编译。
round

2. 棋盘构造与维护

2.1 棋盘状态

象棋棋子有32枚，使用一个32字节的坐标数组来描述每个棋子的位置。每个棋子一个字节，高4位为X，低四位为Y。这样尽可能的减少棋盘的体积。

其数据结构如下：

/**
	 * @brief coords 棋盘坐标，
	 * 每个字节一个棋子，X（高4比特）Y（低4比特），X1-9,Y1-10
	 * 顺序：0-15=红方0， 16-31=黑方1
	 * 0                         15 16                       31
	 * 帅士士相相马马车车炮炮兵兵兵兵兵  將仕仕象象馬馬車車砲砲卒卒卒卒卒
	 */
	unsigned char coords[32]{0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0};

同时，可以安排一个4字节的无符号整形，来表示每个棋子的生死。

	/*!
	 * \brief alive 存活标记，每个1比特.顺序：红方(0) 黑方(1)
	 * 0                        15 16                        31
	 * 帅士士相相马马车车炮炮兵兵兵兵兵  將仕仕象象馬馬車車砲砲卒卒卒卒卒
	 */
	unsigned int alive = 0;

这样安排后，一个树节点的大小相对来说要紧凑一些。

2.2 走位算法

走位算法给定初态、红黑方指示，得到当前状态的所有走法。这里要注意的是：

走位算法红方与黑方的坐标不同。为了方便程序开发，我们采用翻转坐标的方法，只为红方编写走位逻辑。这样的好处是要判断的环节少，逻辑单一，便于调试。
将碰头问题、马別腿等规则需要额外处理。

黑方在走位前，整体旋转棋盘，即可利用红方算法进行走位。具体代码详见Git版本库。

std::vector<chess_node>  expand_node(const chess_node & r_root, const int side);

性能：由于C++20的容器支持右值引用，作为参数返回是木有问题的。

2.3 打印棋盘

打印棋盘要用到不同的色彩，需要Bash \033转义。
使用转义符，可以控制Bash的色彩。

if (map_coords[y][x]>0 && map_coords[y][x]<=16)
	printf("\33[1m\033[31m%s\033[0m",pstr[map_coords[y][x]-1]);
else if (map_coords[y][x]>16)
	printf("\33[1m\033[36m%s\033[0m",pstr[map_coords[y][x]-1]);
else
	printf ("  ");

需要注意的是，我的Bash是黑色的，如果不是黑色的，可以参考这里调整色彩。

3. 搜索策略

象棋最复杂的莫过于搜索策略。笔者花在这个上面的时间应该更多，但是太累了，准备把这一块留给同学们来完善了。目前的算法，还是比较基础的，我因为两次坐标输入失误，输了几盘。由于搜索深度随着籽粒减少而更深，在中残局上表现的非常鬼，尤其是残局，不小心是会翻车的。

算法目前使用广度优先建树、逆向遍历加权的方法来决定最佳的路径。主要考虑有：

不同的棋子有不同的基础价值。
棋子的实际价值，还与状态有关。过了河的卒子价值高，深入对手的马价值高，开局时的炮价值高，随着场上棋子的减少，马的价值渐渐高于炮。相士双全时的籽粒价值高于缺失时的籽粒价值，等等。

3.1 跳转代价

跳转代价是从父节点跳转到本节点造成的吃子损耗。

static const unsigned int table_cost[16] = {100000,150,150,150,150,150,150,500,500,150,150,100,100,100,100,100};
float jump_cost[2]{0,0};//跳转损失

jump_cost 分别记录红方、黑方的吃子代价。

3.2 OpenMP并行建树

建立树时，使用OpenMP进行加速。同时，使用哈希集合防止无谓的重复图案出现。

需要注意OpenMP运行时，不能修改树本身，需要为每个线程设置缓存。
一旦本轮创建完毕，使用std::move直接插入，而不要使用std::copy。
哈希表要用临界区保护。

std::vector<chess_node> build_tree(const chess_node & root, const int side,const std::vector<chess_node> & history)
{
	std::vector<chess_node> tree;
	std::unordered_set <std::string> dict;
	//...
	size_t curr_i = 0;
	size_t max_nodes = 1024*1024*4;
	while (tree.size()<=max_nodes && curr_i<tree.size())
	{
		const size_t ts = tree.size();
		const int cores = omp_get_num_procs();
		std::vector<std::vector<chess_node> > vec_appends;
		for (int i=0;i<cores;++i)
			vec_appends.push_back(std::vector<chess_node>());
		std::atomic<int> new_appends (0);
#pragma omp parallel for
		for (int i=curr_i;i<ts;++i)
		{
			if (new_appends + ts >=max_nodes)
				continue;
			const unsigned char clock = tree[i].depth;
			const int tid = omp_get_thread_num();
			if ((tree[i].alive & 0x00010001)==0x00010001)
			{
				const int curr_side = (side + clock) % 2;
				std::vector<chess_node> next_status =
						expand_node(tree[i],curr_side);

				const size_t sz = next_status.size();
				for (size_t j=0;j<sz;++j)
				{
					std::string ha = node2hash(next_status[j].coords,next_status[j].alive);
					bool needI = false;
#pragma omp critical
					{
						if (dict.find(ha)==dict.end())
						{
							needI = true;
							dict.insert(ha);
						}
					}
					if (needI)
					{
						//...
						vec_appends[tid].push_back(next_status[j]);
						//...
					}
				}
			}
		}
		for (int i=0;i<cores;++i)
		{
			if (vec_appends[i].size())
				std::move(vec_appends[i].begin(),vec_appends[i].end(),std::back_inserter(tree));
		}
		curr_i += (ts - curr_i);
	}
	//...
	return tree;
}

3.3 跳转概率与代价传递

对某个节点来说，其具备红黑属性。谁都会选择对自己最有利的局面走。因此，当前节点的跳转概率就是对手的代价/我的代价。

当遍历时，从最底层节点开始，往根部遍历。各个节点的本级代价（jump_cost)会和本级跳转概率加权后累加给父节点。这样，当遍历完成后，首层孩子中最大概率的那个节点就是最优节点。

调整跳转概率的生成，可以控制对手是保守型，还是进攻型。
调整代价传递，会影响到AI对局面的估计。

size_t judge_tree(std::vector<chess_node> & tree)
{
	const size_t total_nodes = tree.size();
	if (total_nodes<2)
		return 0;
	int side = tree[0].side;
	size_t i = total_nodes - 1;
	while (i > 0)
	{
		if (tree[i].side==0)
		{
			float ratio = sqrt((tree[i].jump_cost[1]+1) / (tree[i].jump_cost[0]+1)/ (tree[i].jump_cost[0]+1));
			tree[i].weight = ratio;
		}
		else
		{
			float ratio = sqrt((tree[i].jump_cost[0]+1) / (tree[i].jump_cost[1]+1)/ (tree[i].jump_cost[1]+1));
			tree[i].weight = ratio;
		}
		size_t parent = tree[i].parent;
		tree[parent].jump_cost[0] += tree[i].jump_cost[0] * tree[i].weight/tree[i].depth/tree[i].depth;
		tree[parent].jump_cost[1] += tree[i].jump_cost[1] * tree[i].weight/tree[i].depth/tree[i].depth;
		--i;
	}
    /...
}