谷歌发布了一款名为Whisk的新AI工具,它颠覆了传统的图像生成模式,允许用户使用图片作为提示词,而非冗长的文字描述。

通过Whisk,你可以上传图片来指定AI生成图像的主题、场景和风格,并且可以为这三者分别使用多张图片。

谷歌推出全新AI工具Whisk 无需提示词,可多张图片混合生成新风格图像

比如,我输入了一张小猪的图片和猫咪的图片,样式选择了一张插画的风格,然后什么提示词都没输入(当然,你也可以选择同时使用文字提示。),它自动给我生成了这样一张效果图。注意,SCENE这里一般都是输入场景图,当然非要和我一样输入角色图片也没问题,它会自动融合生成,有时候可能相关性不大,但会有意外的惊喜。

如果你手头没有合适的图片,可以点击骰子图标,让谷歌自动填充一些图片作为提示(这些图片似乎也是AI生成的)。

谷歌推出全新AI工具Whisk 无需提示词,可多张图片混合生成新风格图像

我随手点了一下,谷歌随机给了一只狗和一只小船,还有刺绣的图片,看看会混合出什么样的效果:

谷歌推出全新AI工具Whisk 无需提示词,可多张图片混合生成新风格图像

效果还不错,三张图片的元素完美融合在了一起,成了一幅有趣的刺绣图~

谷歌推出全新AI工具Whisk 无需提示词,可多张图片混合生成新风格图像

点击图像,我发现Whisk还为每张生成的图片提供了文字提示。如果对结果满意,你可以收藏或下载图像;如果想要进一步优化,可以在文本框中添加更多文字,或直接点击图像编辑文字提示。

谷歌在博客文章中强调,Whisk旨在进行“快速的视觉探索,而非像素级的精确编辑”。该公司还表示,Whisk可能会“跑偏”,因此允许用户编辑底层的提示词。

我体验了Whisk工具几分钟,发现它非常有趣。虽然图像生成需要几秒钟的时间,略显烦人,而且生成的图像有时会有些奇怪,但迭代过程很有意思。

谷歌表示,Whisk使用了最新版本的Imagen3图像生成模型,该模型也在今天正式发布。谷歌还同时发布了新一代视频生成模型Veo2,据说它能够理解“电影的独特语言”,并且“更少”出现诸如多余手指之类的幻觉。Veo2将首先在谷歌的VideoFX中推出,用户可以通过谷歌实验室的候补名单申请体验,并计划在明年扩展到YouTube Shorts和其他产品。

总而言之,Whisk的出现为图像生成带来了全新的可能性,让用户可以通过视觉方式表达创意,更加便捷地实现图像的个性化定制。

产品体验地址