美册视频编辑剪辑制作app
277.63MB · 2025-11-16
Nano Banana,大香蕉模型小名“纳米香蕉”是 Google/DeepMind 推出的图像生成/编辑子模型(Gemini 2.5 Flash Image 系列的俗称),以强大的一步/迭代图像编辑能力著称,特别擅长在保持主体一致性的前提下对已有照片进行复杂改造(如把真人变成微型摆件、换背景、服装替换、连贯的人物系列编辑等)。
单张/多张图像编辑、one-shot 风格替换、持续迭代保持角色一致、从照片生成风格化3D/半3D小模型/摆件、与 Photoshop等工具集成等。
下面给你一份 详尽的 Nano-banana(即 Google Gemini 的 “Nano Banana / Gemini 2.5 Flash Image”)使用教程,包含:功能概览、逐步上手教程、Prompt 工程与技巧、10 个「神级玩法」案例(含提示词与步骤)、以及如何通过 神马中转 API 直接使用和配置并调用 Nano-banana(含示例代码)。
成功的图像编辑 prompt 通常要“分层、简洁、指向明确”——建议使用下面结构化模板(可复制粘贴改写),也可以直接复制下一部分提示词的示例直接快速上手:
主体描述(谁 / 物);
动作或姿态(在做什么);
风格/细节(写明风格:写实 / 插画 / 纸雕 / 3D 小摆件);
光照/环境(时间/光源/相机角度);
材质/纹理(例如陶瓷、塑料、金属、迷你木雕);
保留或限制(“保留面部表情/不要改变背景中 XX”);
输出格式与修饰(“高细节、4k、自然阴影、无文字”)。
示例(将自拍变成太空宇航服风格):
主体:正面自拍,微笑,年约25岁女性;
动作:面向镜头,头戴透明头盔,身体穿宇航服;
风格:科幻写实,细节丰富;
环境:太空背景,地球在远处,可见星云光晕;
光照:来自右上方的冷色主光,柔和反射;
保留:保留眼睛和面部特征;
输出:可用于头像,裁剪为方形
实用技巧
分句写提示,短句比长段更稳定。
使用否定短语(avoid / 不要)明确排除元素。
用“参考图”或“参考关键词”提高风格一致性(如给出风格参考图或写“像 Studio Ghibli 风格”)。
若要多次迭代,记录每次 prompt 的改动点,方便复现与微调。
思路:把真人照片转成桌面小摆件(mini figurine)风格,保留面部特征且做出“塑料/陶瓷”质感。
示例 prompt:
把主体变为一个桌面微型摆件,类似精致陶瓷人偶,头部细节保留,面部光滑有微光,底座木质,尺寸迷你,浅景深相机镜头,柔和环境光,背景为书桌模糊。保持面部表情不变。
步骤:上传清晰正面照 → 指定 mask(身体或背景)→ 选择“塑料/陶瓷”质感 → 迭代调整材质和阴影。
输入: 需上传一张需要更换发型的人像图片
提示词:
以九宫格的方式生成这个人不同发型的头像
示例 prompt:
把这张城市街拍重制为赛博朋克电影海报风格:霓虹灯、雨滴反射、冷暖对比、宽银幕构图、加深阴影、电影颗粒,保留主体姿态。
步骤:上传原图 → 指定 “风格:赛博朋克” → 要求“宽银幕构图+高对比”。
思路:需上传参考图像
提示:
用这两个角色创作一个令人上瘾的12部分故事,包含12张图像,讲述经典的黑色电影侦探故事。故事关于他们寻找线索并最终发现的失落的宝藏。整个故事充满刺激,有情感的高潮和低谷,以精彩的转折和高潮结尾。不要在图像中包含任何文字或文本,纯粹通过图像本身讲述故事在这张模特图上尝试三种未来感服装:1) 轻质反光外套 2) 高腰结构连衣 3) 层叠功能性战术装。每个输出保持模型脸部与姿态一致。
提示:
让图片中的人直视前方
提示:
将图一人物换成图二姿势,专业摄影棚拍摄
思路:需上传一张物品参考图像和一张包装参考图片
提示:
把图一贴在图二易拉罐上,并放在极简设计的布景中,专业摄影
输入: 需上传一张插画图像
提示词:
生成一个女孩cosplay这张插画的照片,背景设置在Comiket
输入: 需上传一张角色参考图像
提示词:
为我生成人物的角色设定(Character Design)
比例设定(不同身高对比、头身比等)
三视图(正面、侧面、背面)
表情设定(Expression Sheet) → 就是你发的那种图
动作设定(Pose Sheet) → 各种常见姿势
服装设定(Costume Design)
输入: 需上传一张人物图片和服装图片
提示词:
选择图1中的人,让他们穿上图2中的所有服装和配饰。在户外拍摄一系列写实的OOTD风格照片,使用自然光线,时尚的街头风格,清晰的全身镜头。保持图1中人物的身份和姿势,但以连贯时尚的方式展示图2中的完整服装和配饰
下面给出最常见的四种上手方式(带具体步骤)——如果你已经有图像,直接按其中一种走即可。
打开 Gemini Image 编辑页面或 AI Studio(gemini.google / AI Studio)。选择 Gemini 2.5 Flash Image / Nano-banana 模型(有时称“Nano-banana”或“gemini-2-5-flash-image”)。
上传你的原图(单张或多张参考图)。
在文本框输入你的编辑提示(prompt)。可分句写清楚要点:主体、动作/表情、风格、背景、光照、材质、要保留/删除的元素。
若支持 mask(蒙版),可用画笔圈出希望变动的区域,或标注需保留细节(例如“保留左耳环细节”)。
生成后使用“迭代”或“变体”功能微调;每轮在 prompt 里加上“更强的光照/更逼真的阴影/保留脸部特征”等指示。
神马中转API上方菜单-聊天-Nano Banner画图-输入提示词、上传参考图、生成保存图片
Dalle 格式介绍
Generations 通用 (图生图 & 文生图)
用途:用文字或文字+图片来生成一张全新的图片。
import http.client
import json
conn = http.client.HTTPSConnection("")
payload = json.dumps({
"prompt": "cat",
"model": "nano-banana"
})
headers = {
'Authorization': 'Bearer {{YOUR_API_KEY}}',
'Content-Type': 'application/json'
}
conn.request("POST", "/v1/images/generations", payload, headers)
res = conn.getresponse()
data = res.read()
print(data.decode("utf-8"))
如何保持人物一致性? 上传原始图并在每次请求中把上一次输出也作为参考图;在 prompt 中明确写 “保持面部特征 / 保持发色 / 保持脸型”。
结果不理想怎么办? 逐步微调 prompt、使用 mask 精确控制修改区域、或降低生成风格强度(写“more photorealistic / less stylized”)。
速度与成本:通过中转平台可能更便宜/稳定,但要留意延迟与图片大小带来的费用。
法律/道德:避免未经授权修改他人肖像作商业用途,注意隐私与肖像权。官方模型/平台可能会对某些敏感内容进行限制与检测。
用短句分层写 prompt。
首轮先要广,后续再微调细节。
用参考图胜过长篇风格描述。
用 mask 精确改动区域。
保存每次 prompt 便于复现。
若要一致性,提供多张参考角度的原图。
避免在 prompt 中加入模棱两可的词。
使用神马中转API时先做小尺寸测试再放量。
尊重被摄者权限和版权。
关注模型输出中的合规信息(如 SynthID)。