next-scene-qwen-image-lora-2509 یک آداپتور LoRA است که روی Qwen-Image-Edit (build 2509) به صورت finetune آموزش دیده است و به طور خاص برای تولید توالیهای تصویر سینمایی با پیشرفت بصری طبیعی از فریم به فریم ساخته شده است.
این امر Qwen Image Edit را قادر میسازد تا مانند یک کارگردان فیلم فکر کند؛ دینامیک دوربین، ترکیب بصری و تداوم روایت را درک کند تا نماهایی را ایجاد کند که به طور یکپارچه در یکدیگر جریان مییابند.
🎉 ✨ بهروزرسانی – نسخه ۲ ! (۲۱ اکتبر ۲۰۲۵) ✨ 🎉
🚀 مدل جدید: next-scene_lora-v2-3000.safetensors
ویژگیهای جدید در نسخه ۲:
🎯 آموزش داده شده بر روی دادههای با کیفیت بالاتر برای نتایج به طور قابل توجهی بهبود یافته
💪 پاسخگویی بهتر به دستورات – مدل دستورات شما را با دقت بیشتری دنبال میکند
🖼️ رفع مشکل مصنوعات نوار سیاه – دیگر خبری از حاشیههای سیاه ناخواسته در تصاویر تولید شده نیست
⚡ عملکرد کلی بهبود یافته – انتقالهای روانتر و جریان سینمایی بهتر
توصیه میشود: از نسخه ۲ برای همه پروژههای جدید استفاده کنید.
📥 گردش کار workflow-comfyui-basic-next-scene-v2.json: ComfyUI
نمونههای نمایشی نسخه ۲:



📦 نسخه ۱ (قدیمی)
فایل مدل: next-scene_lora_v1-3000.safetensors
گردش کار در workflow-comfyui-basic-next-scene.json : ComfyUI
نمونههای نمایشی نسخه 1:



عملکرد مدل
LoRA تداوم داستانسرایی سینمایی را به گردشهای کاری تولید تصویر هوش مصنوعی میآورد.
هر فریم خروجی به عنوان “صحنه بعدی” در یک روایت بصری در حال تکامل عمل میکند و انسجام ترکیبی را حفظ میکند و در عین حال انتقالهای ارگانیکی مانند موارد زیر را معرفی میکند:
- حرکت دوربین: نماهای دالی(Dolly shots)، حرکات رو به جل، حرکات عقبنشینی و حرکات ردیابی
- تکامل قاببندی: انتقال از نمای باز به کلوزآپ، تغییر زاویه، تغییر قاب
- آشکارسازیهای محیطی: ورود شخصیتهای جدید به قاب، مناظر گسترده، پیشرفت فضایی
- تغییرات جوی: تغییرات روشنایی، تکامل آب و هوا، انتقال زمان روز
نمونههایی از منطق سینمایی:
“صحنه بعدی: دوربین از یک نمای نزدیک تنگ روی کشتی هوایی به یک نمای هوایی گسترده عقبنشینی میکند و کل ناوگان کشتیها را که در یک منظره فانتزی اوج میگیرند، نشان میدهد.”
“صحنه بعدی: دوربین به جلو حرکت میکند و به پایین کج میشود و خورشید و هلیکوپترها را با تشدید شعله قوی لنز به قاب نزدیکتر میکند.”
«صحنه بعدی: دوربین به سمت راست حرکت میکند و اژدها و سوارش را از دید خارج میکند و در عین حال رشتهکوههای شناور بیشتری را در دوردست آشکار میسازد.»
⚙️ دستورالعمل استفاده
تنظیمات اولیه:
Qwen-Image-Edit 2509 را به عنوان مدل پایه خود بارگذاری کنید.
یک گره LoRA Loader اضافه کنید و موارد زیر را انتخاب کنید:
- نسخه ۲ (توصیه شده): next-scene_lora-v2-3000.safetensors
- نسخه ۱ (قدیمی): next-scene_lora_v1-3000.safetensors
قدرت LoRA را روی ۰.۷ تا ۰.۸ تنظیم کنید (توصیه شده)
برای نتایج بهینه، دستورات خود را با پیشوند “Next Scene:” ساختار دهید.
پرامپت نمونه:
Next Scene: The camera moves slightly forward as sunlight breaks through the clouds, casting a soft glow around the character's silhouette in the mist. Realistic cinematic style, atmospheric depth.نکات حرفهای:
- برای تداوم بیشتر، دستورالعملها را با جهت دوربین شروع کنید
- برای ثبات حس و حال، تغییرات نور و جو را مشخص کنید
- برای ایجاد استوریبوردهای متوالی، چندین تولید را به صورت زنجیرهای ایجاد کنید
- بهخصوص با نماهای منظره و صحنههای نمایشی خوب کار میکند
🎬 فلسفه طراحی
این مدل که بر اساس یک مجموعه داده سینمایی گسترده گردآوریشده و آموزش دیده است، یاد گرفته است که به جای صرفاً بصری، جهتدار فکر کند.
این مدل صرفاً یک تصویر را تغییر نمیدهد؛ بلکه داستان را پیش میبرد و روابط فضایی، ثبات نورپردازی و طنین احساسی را در فریمهای متوالی حفظ میکند.
کاربردهای ایدهآل:
- تولید استوریبورد برای پیشتولید فیلم و انیمیشن
- طراحی و اجرای ویدیویی هوش مصنوعی سینمایی که نیاز به انسجام فریم به فریم دارند
- گردشهای کاری روایت متوالی در ComfyUI و ابزارهای مشابه
- تکامل هنر مفهومی که پیشرفت صحنه را نشان میدهد
- داستانسرایی بصری برای پروژهها و ارائههای خلاقانه
⚠️ محدودیتهای مهم
- برای موارد زیر بهینه نشده است: پرترههای ثابت، وظایف تصویرسازی تک تصویر یا ویرایشهای غیر متوالی
- مناسبترین برای: گردشهای کاری چند فریمی با پیشرفت روایت
- اولویت طراحی: جریان و تداوم داستانسرایی بر کمال تصویر مجزا
- مورد استفاده پیشنهادی: انتقال صحنه به صحنه به جای دستکاری دقیق اشیاء
مشخصات فنی
- مدل پایه: Qwen-Image-Edit (build 2509)
- معماری: انطباق با رتبه پایین (LoRA)
- هدف آموزش: تداوم صحنه و انسجام نمای سینمایی
- مجموعه دادهها: تصاویر سینمایی اختصاصی در مقیاس بزرگ
- قدرت توصیه شده: 0.7-0.8
- پلتفرمهای سازگار: ComfyUI، Automatic1111 (با پشتیبانی Qwen)، طراحی و اجرای سفارشی