Skip to main content

谷歌的推理模型 Gemini 2.5 Pro 首次通关了「宝可梦 蓝」一位与谷歌无关的开发者对 Gemini 2.5 Pro Experimental 进行了测试,在 Twitch 上直播其基本自主地游玩「宝可梦 蓝」

  1. 谷歌的推理模型 Gemini 2.5 Pro 首次通关了「宝可梦 蓝」

    一位与谷歌无关的开发者对 Gemini 2.5 Pro Experimental 进行了测试,在 Twitch 上直播其基本自主地游玩「宝可梦 蓝」。经过数百小时的测试,Gemini 成为首个成功通关了游戏的模型,收集了所有8个道馆徽章,并击败了冠军。之前 Anthropic 的 Claude 也进行过类似尝试,但至今仍未完成。「宝可梦 蓝」于 1996 年发布,以其复杂的机制、策略战斗和开放世界探索而闻名——所有这些都是 AI 系统面临的挑战。为了取得成功,AI 需要具备长期规划、目标追踪和视觉导航等技能,而这些技能对于通用人工智能的发展至关重要。现在该直播还在继续,模型的下一个目标是捕获超梦。

    —— The DecoderGoogle AI