تحول ساخت ویدئو بر پایه مدل qwen-image

next-scene-qwen-image-lora-2509 یک آداپتور LoRA است که روی Qwen-Image-Edit (build 2509) به صورت finetune آموزش دیده است و به طور خاص برای تولید توالی‌های تصویر سینمایی با پیشرفت بصری طبیعی از فریم به فریم ساخته شده است.

این امر Qwen Image Edit را قادر می‌سازد تا مانند یک کارگردان فیلم فکر کند؛ دینامیک دوربین، ترکیب بصری و تداوم روایت را درک کند تا نماهایی را ایجاد کند که به طور یکپارچه در یکدیگر جریان می‌یابند.

🎉 ✨ به‌روزرسانی – نسخه ۲ ! (۲۱ اکتبر ۲۰۲۵) ✨ 🎉

🚀 مدل جدید: next-scene_lora-v2-3000.safetensors

ویژگی‌های جدید در نسخه ۲:

🎯 آموزش داده شده بر روی داده‌های با کیفیت بالاتر برای نتایج به طور قابل توجهی بهبود یافته
💪 پاسخگویی بهتر به دستورات – مدل دستورات شما را با دقت بیشتری دنبال می‌کند
🖼️ رفع مشکل مصنوعات نوار سیاه – دیگر خبری از حاشیه‌های سیاه ناخواسته در تصاویر تولید شده نیست
⚡ عملکرد کلی بهبود یافته – انتقال‌های روان‌تر و جریان سینمایی بهتر
توصیه می‌شود: از نسخه ۲ برای همه پروژه‌های جدید استفاده کنید.

📥 گردش کار workflow-comfyui-basic-next-scene-v2.json: ComfyUI

نمونه‌های نمایشی نسخه ۲:

📦 نسخه ۱ (قدیمی)

فایل مدل: next-scene_lora_v1-3000.safetensors
گردش کار در workflow-comfyui-basic-next-scene.json : ComfyUI

نمونه‌های نمایشی نسخه 1:

عملکرد مدل

LoRA تداوم داستان‌سرایی سینمایی را به گردش‌های کاری تولید تصویر هوش مصنوعی می‌آورد.

هر فریم خروجی به عنوان “صحنه بعدی” در یک روایت بصری در حال تکامل عمل می‌کند و انسجام ترکیبی را حفظ می‌کند و در عین حال انتقال‌های ارگانیکی مانند موارد زیر را معرفی می‌کند:

حرکت دوربین: نماهای دالی(Dolly shots)، حرکات رو به جل، حرکات عقب‌نشینی و حرکات ردیابی
تکامل قاب‌بندی: انتقال از نمای باز به کلوزآپ، تغییر زاویه، تغییر قاب
آشکارسازی‌های محیطی: ورود شخصیت‌های جدید به قاب، مناظر گسترده، پیشرفت فضایی
تغییرات جوی: تغییرات روشنایی، تکامل آب و هوا، انتقال زمان روز

نمونه‌هایی از منطق سینمایی:

“صحنه بعدی: دوربین از یک نمای نزدیک تنگ روی کشتی هوایی به یک نمای هوایی گسترده عقب‌نشینی می‌کند و کل ناوگان کشتی‌ها را که در یک منظره فانتزی اوج می‌گیرند، نشان می‌دهد.”

“صحنه بعدی: دوربین به جلو حرکت می‌کند و به پایین کج می‌شود و خورشید و هلیکوپترها را با تشدید شعله قوی لنز به قاب نزدیک‌تر می‌کند.”

«صحنه بعدی: دوربین به سمت راست حرکت می‌کند و اژدها و سوارش را از دید خارج می‌کند و در عین حال رشته‌کوه‌های شناور بیشتری را در دوردست آشکار می‌سازد.»

⚙️ دستورالعمل استفاده

تنظیمات اولیه:

Qwen-Image-Edit 2509 را به عنوان مدل پایه خود بارگذاری کنید.

یک گره LoRA Loader اضافه کنید و موارد زیر را انتخاب کنید:

نسخه ۲ (توصیه شده): next-scene_lora-v2-3000.safetensors
نسخه ۱ (قدیمی): next-scene_lora_v1-3000.safetensors

قدرت LoRA را روی ۰.۷ تا ۰.۸ تنظیم کنید (توصیه شده)

برای نتایج بهینه، دستورات خود را با پیشوند “Next Scene:” ساختار دهید.

پرامپت نمونه:

Next Scene: The camera moves slightly forward as sunlight breaks through the clouds, casting a soft glow around the character's silhouette in the mist. Realistic cinematic style, atmospheric depth.

نکات حرفه‌ای:

برای تداوم بیشتر، دستورالعمل‌ها را با جهت دوربین شروع کنید
برای ثبات حس و حال، تغییرات نور و جو را مشخص کنید
برای ایجاد استوری‌بوردهای متوالی، چندین تولید را به صورت زنجیره‌ای ایجاد کنید
به‌خصوص با نماهای منظره و صحنه‌های نمایشی خوب کار می‌کند

🎬 فلسفه طراحی

این مدل که بر اساس یک مجموعه داده سینمایی گسترده گردآوری‌شده و آموزش دیده است، یاد گرفته است که به جای صرفاً بصری، جهت‌دار فکر کند.

این مدل صرفاً یک تصویر را تغییر نمی‌دهد؛ بلکه داستان را پیش می‌برد و روابط فضایی، ثبات نورپردازی و طنین احساسی را در فریم‌های متوالی حفظ می‌کند.

کاربردهای ایده‌آل:

تولید استوری‌بورد برای پیش‌تولید فیلم و انیمیشن
طراحی و اجرای ویدیویی هوش مصنوعی سینمایی که نیاز به انسجام فریم به فریم دارند
گردش‌های کاری روایت متوالی در ComfyUI و ابزارهای مشابه
تکامل هنر مفهومی که پیشرفت صحنه را نشان می‌دهد
داستان‌سرایی بصری برای پروژه‌ها و ارائه‌های خلاقانه

⚠️ محدودیت‌های مهم

برای موارد زیر بهینه نشده است: پرتره‌های ثابت، وظایف تصویرسازی تک تصویر یا ویرایش‌های غیر متوالی
مناسب‌ترین برای: گردش‌های کاری چند فریمی با پیشرفت روایت
اولویت طراحی: جریان و تداوم داستان‌سرایی بر کمال تصویر مجزا
مورد استفاده پیشنهادی: انتقال صحنه به صحنه به جای دستکاری دقیق اشیاء

مشخصات فنی

مدل پایه: Qwen-Image-Edit (build 2509)
معماری: انطباق با رتبه پایین (LoRA)
هدف آموزش: تداوم صحنه و انسجام نمای سینمایی
مجموعه داده‌ها: تصاویر سینمایی اختصاصی در مقیاس بزرگ
قدرت توصیه شده: 0.7-0.8
پلتفرم‌های سازگار: ComfyUI، Automatic1111 (با پشتیبانی Qwen)، طراحی و اجرای سفارشی

منبع

huggingface.co