多人场景 prompt:5 个真正有效的模式
bigASP 和 SDXL 在 2 人以上场景为什么合体,以及 5 个让人物保持解剖独立、姿势正确的具体 prompt 模式。
bigASP 和 SDXL 在 2 人以上场景为什么合体,以及 5 个让人物保持解剖独立、姿势正确的具体 prompt 模式。
多人场景是大多数写实 NSFW 模型崩坏的地方。你想生成"床上两个人",出来的可能是两个共生的连体婴附带三只手、或者一个人两个头、或者两个人共享一个躯干。这不是 bug——是 SDXL 注意力分配的已知限制。用对 prompt 模式能大幅降低失败率。
本文针对 bigASP v2.5 和其他 SDXL 写实 checkpoint。FLUX 开箱处理多人就好得多。
SDXL 用单一 attention map 表示整个画面。两个主体在 prompt 心智模型里空间重叠时,模型很难把它们的 token 注意力分离开。默认会偏向合并,因为:
下面 5 个模式都各自针对其中一个或多个问题。
最有效的一个改动:把 two adults(或 three adults)放在 prompt 开头,所有其他描述之前。
- man and woman intimate scene in bedroom
+ two adults, intimate scene, man and woman, in bedroom
two adults 在第一个位置以满权重打到注意力层。放后面(颜色、头发之后)就被稀释。同样的窍门用于群体:three adults、four adults。
为什么用 "adults" 不用 "people":"people" 太通用,"adults" 同时排除儿童 + 设定成人内容 frame,一举两得。
通用的 "couple in bed" 给模型留了合体空间。显式空间关系能阻断合体:
- two adults having sex on bed
+ two adults, woman lying on back on bed, man kneeling between her legs, missionary position
- couple intimate on couch
+ two adults, woman straddling man, both facing each other, on living room couch
模型能渲染 "woman on top" 或 "man behind",因为这些是常见训练标签概念。但渲染不了 "couple sex",因为那含糊。
空间模板(选一个):
[A] lying on back, [B] on top(传教士)[A] kneeling behind [B](后入)[A] straddling [B](女上)[A] facing away from [B](背对/反向)[A] kneeling between [B]'s legs每个人一个短句,不是三段话。每多描述一句,模型注意力就更稀释:
- two adults, beautiful asian woman with long black hair and dark eyes wearing nothing,
muscular caucasian man with brown hair and beard wearing nothing,
having intimate sex on a bed in a hotel room with soft warm lighting
+ two adults, asian woman, long black hair, nude, on bed, missionary position,
caucasian man on top, athletic build, hotel bedroom, evenly lit
第二个版本少了 30% 的词,模型反而有更少东西要稀释。多人场景里"少即是多"。
针对多人场景最有效的负面 prompt 加项:
merged bodies, conjoined bodies, body fusion, fused limbs, body merging,
two heads on one body, multiple heads, siamese twins, fused faces, merged faces,
overlapping bodies, three arms, three legs, extra limbs, extra heads
专门给多人 prompt 加。ximages 默认基线已经包含大部分;难场景可以在用户负面框里再叠加。
画幅越宽 = 多人分离越好。竖版 9:16 把两个身体挤进更窄的宽度,碰撞概率上升。用:
如果你竖版构图老是合体,切换到横版用同一个 prompt 重跑。经常单这一项就够。
差的 prompt(很多人这么写):
two beautiful asian women and a handsome guy in passionate threesome
on a bed in dimly lit bedroom with sensual atmosphere
为什么崩:模糊的 "passionate threesome"、没有空间角色、描述堆叠、"sensual" 是水词。
修好的 prompt:
three adults, threesome on bed,
asian woman in center, lying on back, nude,
asian woman on right, sitting astride, nude,
caucasian man on left, kneeling, nude, athletic build,
clear spatial separation between three figures,
evenly lit bedroom, natural skin pores
负面加项:
merged bodies, fused limbs, three heads on one body, overlapping figures,
extra arms, extra legs, deformed hands
画幅:16:9
跑 4 次。应该有 2 张干净独立。挑最好的。
任何多人场景,点 Generate 之前过一遍:
two adults / three adults 在开头woman on top of man、man kneeling behind)passionate、intense、sensual)某个具体场景连续 4 次都合体:
单人场景不需要数量词和空间语言模式,加了反而是噪音。模式 4(合体负面)留着没事但没贡献。模式 3(精简描述)和模式 5(画幅)对所有场景都适用。
延伸:bigASP v2.5 上手指南 先讲单人基础。12 个 prompt 陷阱 讲更宽的模式。bigASP vs FLUX vs RealVisXL 说明什么时候切模型跑多人。