实测 Gemini 3 Pro:从零快速开发自走棋游戏

4 minutes read

Published:

Gemini 3 Pro SOTA模型能力测试

体验地址: auto-battler.precu.re

项目仓库:Auto-Battler

动机

恰逢Gemini 3 Pro Preview正式发布,看到论坛里有人测试一次生成复杂游戏,正好最近在玩货币战争,于是让他写个自走棋出来。

从零到一

初始Prompt为:做一个完整的自走棋类游戏,使用二次元手游角色,给我完整的网页代码。结果第一次生成就确实已经有一个非常可用的版本:ver1.html,即使有不少bug但也像模像样了,而这只用了大约两分钟的时间。我也试过同样让GPT-5.1 High使用这句Prompt生成,虽然也还算可用,但效果会有些差距:gpt51high.html(可能需要右键另存为再在本地打开,直接打开不知为何有点bug)。

顺带一提,尽管我确实经常使用AI Coding,但我并不会经常在小项目上使用Claude Code、Cursor等工具,一部分原因是我觉得小项目完全可以把所有代码都塞进上下文,而无需被各类工具调用的System Prompt干扰。因此,接下来的修改基本都直接使用对话。

下一步是生成美术资源,使用Prompt:请给我每个美术资源的Prompt,人物使用日本二次元可爱美少女风格。我的期望是他给我列出Prompt,不过Gemini似乎内置了绘图的调用,有Prompt后会直接帮我画出来,那我也就直接拿来用了。

之后就是让他使用图片和各种优化修复。这方面倒是和以前的模型差距不大,修改过程中依然会有各种奇奇怪怪的问题需要多轮来解决。最终版本大概使用了10轮左右,主要是美化和各种细节优化。最后加一点指南,就是大家能看到的这个版本。

感想

Gemini 3 Pro目前看起来有不少量变,但是否质变还需观察。即使是SOTA模型,其能力依然有边界,一个一千行的简单游戏也不能保证完美无差错。我也许能信任一个SOTA CoT模型写的几十行的实用工具脚本,但更复杂的系统似乎不应该抱有同样的信任。正好当天Cloudflare还出现了全球性的P0级事故,我在上传此项目时又遇到了GitHub的事故,很难不联想大家面对Vibe Coding生成的一大坨代码都选择了蓝药丸。