Mjx：一款高性能的日本麻将模拟器

2024-09-20 18:05:37作者：魏侃纯Zoe

项目介绍

Mjx 是一款专为日本麻将（立直麻将）设计的模拟器，旨在为麻将 AI 的开发和评估提供一个高效、精确且易于扩展的平台。Mjx 不仅能够作为游戏服务器运行，还具备与 Tenhou 完全兼容的特性，确保了游戏规则和结果的准确性。此外，Mjx 提供了类似 Gym 的 API，使得开发者可以轻松地进行大规模的强化学习和评估。

项目技术分析

Mjx 的核心技术优势在于其高性能和精确性。相比传统的麻将模拟器 Mjai，Mjx 的速度提升了 100 倍，这得益于其优化的算法和高效的实现。Mjx 还支持 gRPC，使得分布式计算变得简单，适合大规模的强化学习任务。此外，Mjx 提供了与 Mjai 兼容的接口，方便已有项目的迁移和扩展。

项目及技术应用场景

Mjx 的应用场景非常广泛，特别适合以下领域：

麻将 AI 开发：Mjx 提供了丰富的 API 和高效的模拟环境，是开发和测试麻将 AI 的理想选择。
强化学习研究：Mjx 的分布式计算能力和 Gym 风格的 API 使其成为大规模强化学习研究的强大工具。
游戏规则验证：Mjx 与 Tenhou 完全兼容，可以用于验证和测试麻将游戏的规则和逻辑。

项目特点

Mjx 的主要特点包括：

高性能：比传统模拟器 Mjai 快 100 倍，适合大规模的模拟和评估任务。
完全兼容 Tenhou：经过大量 Tenhou 游戏日志的验证，确保规则和结果的准确性。
Gym-like API：提供类似 Gym 的 API，方便强化学习模型的开发和测试。
分布式计算支持：通过 gRPC 实现分布式计算，适合大规模的强化学习和评估。
Mjai 兼容：提供与 Mjai 兼容的接口，方便已有项目的迁移和扩展。
美观的可视化：提供美观的游戏可视化界面，方便观察和分析游戏过程。

快速开始

你可以通过 Google Colab 快速体验 Mjx：

Google Colab 快速体验

安装

Mjx 支持 Python3.7 及以上版本，目前支持 Linux 和 macOS Intel（10.15 或更高版本）。你可以通过 pip 安装 Mjx：

$ pip install mjx

示例代码

以下是一个简单的示例代码，展示了如何使用 Mjx 进行游戏模拟：

import mjx
from mjx.agents import RandomAgent

agent = RandomAgent()
env = mjx.MjxEnv()
obs_dict = env.reset()
while not env.done():
  actions = {player_id: agent.act(obs) for player_id, obs in obs_dict.items()}
  obs_dict = env.step(actions)
returns = env.rewards()

服务器使用

Mjx 支持通过 gRPC 进行分布式计算，以下是一个简单的服务器和客户端示例：

服务器客户端

服务器	客户端
`import random import mjx class RandomAgent(mjx.Agent): def __init__(self): super().__init__() def act_batch(self, observations): return [random.choice(obs.legal_actions()) for obs in observations] agent = RandomAgent() agent.serve("127.0.0.1:8080", batch_size=8)`	`import mjx host="127.0.0.1:8080" mjx.run( {f"player_{i}": host for i in range(4)}, num_games=1000, num_parallels=16 )`

import random
import mjx

class RandomAgent(mjx.Agent):
  def __init__(self):
    super().__init__()

  def act_batch(self, observations):
    return [random.choice(obs.legal_actions()) for obs in observations]

agent = RandomAgent()
agent.serve("127.0.0.1:8080", batch_size=8)

import mjx

host="127.0.0.1:8080"

mjx.run(
  {f"player_{i}": host for i in range(4)},
  num_games=1000,
  num_parallels=16
)

注意事项

Mjx 目前仍在积极开发中，API 可能会在 v1.0 之前发生变化。特别是以下几个方面：

env.rewards(reward_type) 和 env.done(done_type) 的默认行为
Protobuf 模式
特征提取 API（目前由 Observation.to_features() 提供）

如何开发

我们建议在容器中开发 Mjx，最简单的方法是通过 VsCode 打开此仓库。如果你有任何问题，欢迎联系 @sotetsuk。

引用

如果你在研究中使用了 Mjx，请引用以下文献：

@INPROCEEDINGS{mjx2022,
  author={Koyamada, Sotetsu and Habara, Keigo and Goto, Nao and Okano, Shinri and Nishimori, Soichiro and Ishii, Shin},
  booktitle={2022 IEEE Conference on Games (CoG)}, 
  title={Mjx: A framework for Mahjong AI research}, 
  year={2022},
  volume={},
  number={},
  pages={504-507},
  doi={10.1109/CoG51982.2022.9893712}}