硬件适配器 & EmbodiedGovBench v2
v0.10.0 ship 完治理核心。v0.11.0 把这个核心同时往两个方向延伸:真机适配器(Unitree G1 + Franka)+ 公开多 LLM benchmark 与排行榜。
- 真 Unitree G1 适配器 —
RealUnitreeG1Robot实现 Robot ABC,对接 Unitree SDK 2 RPC。g1_sim ↔ g1_real切换时identity_hash字节级相等。 - 真 Franka 适配器 —
RealFrankaRobot对接franka_ros2,自带 workspace-bounds + speed-factor 防护。 - 人形场景套件 — 4 个 G1 场景,覆盖
NavigateECM+GraspAndPlaceECM,包括 HR-4 强制检查(无签 operator-relax 必须被拒)。 - 多 LLM provider 矩阵 — 跨 Claude / GLM / Gemini / local-onnx 的矩阵 runner。
--cheap离线 CI 模式。 - 公开排行榜 —
docs/leaderboard/v0.11.0.json+docs/LEADERBOARD.md,每行 commit-pinned,可重生。 - Paper 实验复现 — P11 / P12 / P14 论文 claim 现在通过
pytest tests/benchmarks/papers/跑,旧脚本保留为 thin wrapper。 - Operator 文档 —
docs/BENCHMARK.md+docs/SCENARIOS.md,覆盖完整矩阵跑法、env vars、成本估算、场景作者指南。 - 测试基线 — main 上 ~2,347 通过。
ROS 2 bridge 进程 + 真机端到端 demo(G1 走 1m + Franka 抓物在 live bridge 下)等 maintainer 双机在手时再做。它们随 v0.11.0 完整 tag 一起上,连同硬件 track 完整版 release notes。