你试过最让人又爱又恨的软件是什么?对我来说,Midjourney排第一。爱的是它真的能把我脑子里那个模糊的画面——比如“一只穿西服的猫,坐在深夜地铁里,表情有点累”——变成一张可以直接当壁纸的图。恨的是它藏在Discord里。对,就是那个游戏玩家常用的语音聊天软件。我第一次打开时完全懵了:频道列表、机器人指令、各种陌生人的生成图刷屏。我花了大概二十分钟才搞懂在哪里输入“/imagine”。如果你也卡在这一步,直接去左侧找到一个叫“newbies-xxx”的房间,进去输入指令就好。跨过这个门槛之后,一切都变得极其简单。
你只需要写一句话。中文也行,但英文效果更好。比如我写“a small coffee shop in the rain,studio ghibli style”。六十秒左右,四张图回来。第一张光影不对,第二张构图太满,第三张那个窗户的颜色让我愣了一下——它居然把我没写出来的“湿漉漉的暖黄灯光”给画出来了。第四张不行。然后你点一下“V”按钮让它继续变,或者“U”按钮放大某一张。整个过程像在和一个很听话又有点惊喜的外包画师聊天。你不会画画,没关系。你不懂构图,也没关系。你只需要描述。
Midjourney最值钱的地方不是画得“像”,而是画得“像那么回事”。我用它生成过产品白底图、公众号封面、甚至一个虚拟专辑封面。放出去没人觉得是AI做的,只会问“你找谁画的”。V6版本之后对文字和手的处理好了很多,但偶尔还是会画出六根手指或者乱码招牌。这个问题你要接受。另一个真实的麻烦是免费额度用完就得付费,起步一个月十美金左右,生成大概两百张图。对个人试用来说不便宜,但如果你真的需要配图又不想找设计师,这笔账算下来反而划算。
和同类工具比一下。Stable Diffusion免费且开源,但你要本地部署、调参数、学一大堆名词,我试过一次就放弃了。DALL·E 3用起来更傻瓜,直接在ChatGPT里就能画,中文理解也强,但艺术感和风格丰富度不如Midjourney。简单总结:想要最快最稳地出一张“有氛围感的图”,Midjourney还是第一。前提是你愿意为了那个结果,忍一下Discord的麻烦。
那么你到底该不该用它?适合这三类人:第一,自媒体博主或小创业者,需要高频配图但没有设计预算;第二,想做视觉灵感板的产品经理或文案,用图沟通比说话快;第三,单纯觉得“画画好玩”的人,它能给你远超预期的正反馈。不适合这两种人:一是不想学任何新界面、只想一键出图的人(你更适合用Bing Image Creator);二是对图像有极高精度要求、需要矢量图层或商业印刷级细节的专业设计师(你会被它随机性气死)。
说实话,写完这篇文章我又去玩了一会儿。我输入了“a broken vending machine in a desert,sunset,lonely but peaceful”。回来的图里有一张,机器门半开着,里面没有可乐,只有一小片沙。我不知道AI是否真的理解了“孤独但平静”,但那一刻我看着那张图,确实安静了几秒。这可能就是Midjourney真正给的东西——不是工具,而是一面很小的、能把你脑子里的画面照出来的镜子。而你只需要学会写第一句话。