DiffusionGemma یک مدل مولد است که توسط Google DeepMind ساخته شده است. DiffusionGemma بر اساس معماری 26B A4B Mixture-of-Experts (MoE) Gemma 4، توکنها را با استفاده از انتشار گسسته تولید میکند. این مدل با وزنهای باز، چندوجهی است و ورودیهای متن، تصویر و ویدیو را برای تولید خروجی متن مدیریت میکند.
DiffusionGemma که بر پایه MoE ساخته شده است، برای بهبود سرعت تولید (توکن در ثانیه) طراحی شده است و در عین حال در محیطهای سختافزاری مختلف قابل استفاده است. DiffusionGemma بر اساس پیشرفتهای معماری و قابلیتهای Gemma 4 ساخته شده و چندین ویژگی اصلی را معرفی میکند:
- انتشار متن گسسته – از خودرگرسیون توکن به توکن به نمونهگیری چند بوم بلوکی خودرگرسیون تغییر میکند. این روش با حذف نویز مکرر بلوکهای توکن (یک «بوم») به صورت موازی، متن تولید میکند و سرعت رمزگشایی را به طور قابل توجهی افزایش میدهد.
- پردازش ورودی چندوجهی – ورودیهای متن، تصویر (با نسبت ابعاد و پشتیبانی از وضوح متغیر) و ویدیو را به صورت درهمتنیده پردازش میکند تا خروجیهای متن را تولید کند.
- معماری رمزگذار-رمزگشا – از یک رمزگذار خودرگرسیون برای پردازش و ذخیره متن سریع، همراه با یک رمزگشا که توجه دو طرفه را بر روی بوم تولید اعمال میکند، استفاده میکند.
- کارایی ترکیبی از متخصصان (MoE) – از یک طراحی MoE پراکنده (8 متخصص فعال از مجموع 128 متخصص) برای ارائه قابلیتهای استدلال قوی استفاده میکند و در عین حال فضای حافظه کم و مناسبی را برای اجرای محلی حفظ میکند.
- حالت تفکر (استدلال) – به عنوان یک استدلالکننده بسیار توانمند، با حالتهای تفکر قابل تنظیم طراحی شده است. بهینهسازی شده برای استنتاج در اندازه دستههای کوچک – به طور خاص برای تولید با تأخیر کم و سرعت بالا بر روی یک شتابدهنده توانمند مهندسی شده است.
- پشتیبانی بومی از اعلان سیستم – همانند Gemma 4، از بهروزرسانی نقش سیستم پشتیبانی میکند و مکالمات ساختاریافتهتر و قابل کنترلتری را امکانپذیر میسازد.
مرور کلی مدل
DiffusionGemma برای کاهش تنگناهای متوالی مدلهای زبان سببی استاندارد طراحی شده است. این مدل از یک معماری رمزگذار-رمزگشا که به طور خاص برای سرعت استنتاج بهینه شده است، استفاده میکند.
رمزگشا با ظرفیت پیش از پر کردن عمل میکند، اعلان اولیه را پردازش میکند و حافظه پنهان KV را تولید میکند. سپس رمزگشا از توجه دو طرفه برای پردازش یک بلوک ورودی (یک «بوم») از توکنها استفاده میکند و از طریق توجه متقابل به زمینه ذخیره شده دسترسی پیدا میکند.
در طول استنتاج، DiffusionGemma از نمونهگیری چند بوم استفاده میکند. به جای تولید یک توکن در هر زمان، مدل به طور تکراری یک بلوک کامل از توکنها را با استفاده از یک نمونهگیر انتشار، نویززدایی میکند. هنگامی که یک بوم به طور کامل نویززدایی شد، توسط رمزگذار پردازش شده و به حافظه پنهان KV اضافه میشود، پس از آن مدل بوم بعدی را تولید میکند. این رویکرد خودرگرسیونی بلوکی، تولید متن را با سرعت بالاتر تسهیل میکند.
جدول مشخصات مدل
| کل پارامترها | ۲۵/۲ میلیارد |
| پارامترهای فعال | ۳/۸ میلیارد |
| لایهها | ۳۰ |
| پنجره لغزان | ۱۰۲۴ توکن |
| طول متن | بیش از ۲۵۶ هزار توکن |
| طول بوم | ۲۵۶ |
| اندازه واژگان | ۲۶۲ هزار |
| تعداد متخصصان | ۸ عدد فعال/مجموعا ۱۲۸ عدد و یک مشترک |
| انواع پشتیبانی از ورودی | متن/عکس |
| پارامترهای رمزگشای تصویری | حدود ۵۵۰ میلیون |
نتایج ارزیابی
این مدلها در برابر مجموعهای بزرگ از مجموعه دادهها و معیارهای مختلف ارزیابی شدند تا جنبههای مختلف تولید متن را پوشش دهند. نتایج ارزیابی مشخص شده در جدول برای مدلهای تنظیمشده با دستورالعمل، با نمونهگیر توصیهشدهی Entropy Bound (EB) (به بهترین شیوهها در زیر مراجعه کنید) هستند.
| Benchmark | DiffusionGemma 26B A4B | Gemma 4 26B A4B |
|---|---|---|
| MMLU Pro | 77.6% | 82.6% |
| AIME 2026 no tools | 69.1% | 88.3% |
| LiveCodeBench v6 | 69.1% | 77.1% |
| Codeforces ELO | 1429 | 1718 |
| GPQA Diamond | 73.2% | 82.3% |
| Tau2 (average over 3) | 56.2% | 68.2% |
| HLE no tools | 11.0% | 8.7% |
| HLE with search | 11.9% | 17.2% |
| BigBench Extra Hard | 47.6% | 64.8% |
| MMMLU | 81.5% | 86.3% |
| Vision | ||
| MMMU Pro | 54.3% | 73.8% |
| OmniDocBench 1.5 (average edit distance, lower is better) | 0.319 | 0.149 |
| MATH-Vision | 70.5% | 82.4% |
| MedXPertQA MM | 49.0% | 58.1% |
| Long Context | ||
| MRCR v2 8 needle 128k (average) | 32.0% | 44.1% |
قابلیتهای اصلی
DiffusionGemma طیف گستردهای از وظایف را در متن و بینایی انجام میدهد. قابلیتهای کلیدی عبارتند از:
- تولید پرسرعت نویززدایی موازی ۲۵۶ توکن از طریق نمونهگیری انتشار، با تولید ۱۵-۲۰ توکن در هر عبور رو به جلو، به تأخیر کم دست مییابد و سرعت تولید به ازای هر کاربر را در تنظیمات اندازه دسته کم (H100، FP8) به بیش از ۱۱۰۰ توکن در ثانیه میرساند.
- محاسبه زمان استنتاج تطبیقی: دستورات سادهتر و وظایف ساختاریافته مانند کدنویسی به مراحل نویززدایی کمتری نیاز دارند و سرعتهای پویای توکن در ثانیه را بر اساس پیچیدگی وظیفه فعال میکنند.
- تفکر – حالت استدلال داخلی که به مدل اجازه میدهد قبل از پاسخ دادن، گام به گام فکر کند.
- متن طولانی – پنجرههای متن تا ۲۵۶ هزار توکن.
- درک تصویر – تشخیص شیء، تجزیه سند/PDF، درک صفحه و رابط کاربری، درک نمودار، OCR (شامل چندزبانه)، تشخیص دستخط و اشاره. تصاویر را میتوان با نسبتهای ابعاد و وضوح متغیر پردازش کرد. درک ویدیو – محتوای ویدیو را با پردازش توالی فریمها تجزیه و تحلیل و توصیف میکند.
- ورودی چندوجهی درهمتنیده – تصاویر، ویدیو و متن را در یک دستور واحد برای استدلالهای سنگین ترکیب میکند.
- فراخوانی تابع – پشتیبانی بومی برای استفاده از ابزار ساختاریافته، که گردشهای کاری عاملمحور را فعال میکند.
- کدنویسی و استدلال – قابلیت تولید کد، تکمیل و استدلال منطقی گام به گام.
- چندزبانه – پشتیبانی آماده برای بیش از ۳۵ زبان، از پیش آموزشدیده روی بیش از ۱۴۰ زبان.
شروع کار
شما میتوانید از تمام مدلهای Gemma 4 با آخرین نسخه Transformers استفاده کنید. برای شروع، وابستگیهای لازم را در محیط خود نصب کنید:
pip install -U transformers torch accelerate
وقتی همه چیز را نصب کردید، میتوانید مدل را با کد زیر بارگذاری کنید:
from transformers import DiffusionGemmaForBlockDiffusion, AutoProcessor
MODEL_ID = "google/diffusiongemma-26B-A4B-it"
Load model
processor = AutoProcessor.from_pretrained(MODEL_ID)
model = DiffusionGemmaForBlockDiffusion.from_pretrained(
MODEL_ID,
dtype="auto",
device_map="auto",
)
بهترین شیوهها
برای بهترین عملکرد، از این پیکربندیها و بهترین شیوهها استفاده کنید:
۱. تنظیمات نمونهبرداری انتشار
از پیکربندی نمونهبرداری استاندارد زیر در تمام موارد استفاده استفاده کنید:
بهترین شیوهها
برای بهترین عملکرد، از این پیکربندیها و بهترین شیوهها استفاده کنید:
۱. تنظیمات نمونهبرداری انتشار
از پیکربندی نمونهبرداری استاندارد زیر در تمام موارد استفاده استفاده کنید:
- روش: نمونهبرداری انتشار با نویززدایی محدود به آنتروپی و توقف تطبیقی.
- پیکربندی نمونهبرداری:
- حداکثر تعداد مراحل حذف نویز = ۴۸
- برنامه دما (برای شکلدهی لوجیت): کاهش خطی از ۰.۸ → ۰.۴
- انتخاب توکن: در هر مرحله، نمونهگیر، نشانهها با کمترین آنتروپی را انتخاب میکند به طوری که مرز اطلاعات متقابل آنها زیر مرز آنتروپی = ۰.۱ باقی بماند.
- نویز مجدد نشانه: نمونهگیر، نشانهها را که انتخاب نشدهاند به طور کامل نویز میکند.
- توقف تطبیقی: نمونهبرداری اگر و فقط اگر هر دو شرط زیر به طور همزمان برآورده شوند، زود خاتمه مییابد:
- پیشبینیهای مطمئن: میانگین آنتروپی مدل روی بوم کمتر از آستانه آنتروپی = ۰.۰۰۵ است.
- پیشبینیهای پایدار: پیشبینیهای نشانه با بالاترین احتمال در دو مرحله متوالی حذف نویز یکسان باقی میمانند.
۲. پیکربندی حالت تفکر
مشابه مدلهای Gemma 4، ما از نقشهای استاندارد سیستم، دستیار و کاربر استفاده میکنیم. برای مدیریت صحیح فرآیند تفکر، از توکنهای کنترلی زیر استفاده کنید:
- فعال کردن تفکر: تفکر با وارد کردن توکن <|think|> در ابتدای اعلان سیستم فعال میشود. برای غیرفعال کردن تفکر، توکن را حذف کنید (توجه داشته باشید که ممکن است هنوز یک کانال تفکر خالی منتشر شود).
- تولید استاندارد: وقتی تفکر فعال است، مدل استدلال داخلی خود و به دنبال آن پاسخ نهایی را با استفاده از این ساختار خروجی میدهد:
<|channel>thought\n[Internal reasoning].
- رفتار تفکر غیرفعال: اگر تفکر غیرفعال باشد، مدل همچنان برچسبها را تولید میکند اما با یک بلوک تفکر خالی:
<|channel>thought\n[Final answer].
توجه داشته باشید که بسیاری از کتابخانهها مانند transformers پیچیدگیهای قالب چت را برای شما مدیریت میکنند.
۳. مکالمات چند نوبتی
بدون محتوای تفکر در تاریخچه: در مکالمات چند نوبتی، خروجی مدل تاریخی فقط باید شامل پاسخ نهایی باشد. افکار مربوط به نوبتهای مدل قبلی نباید قبل از شروع نوبت بعدی کاربر اضافه شوند.
۴. ترتیب حالت
برای عملکرد بهینه با ورودیهای چند حالته، محتوای تصویر را قبل از متن در اعلان خود قرار دهید.
۵. وضوح تصویر متغیر
گذشته از نسبتهای ابعاد متغیر، DiffusionGemma از طریق یک بودجه توکن بصری قابل تنظیم، از وضوح تصویر متغیر پشتیبانی میکند که تعداد توکنهای مورد استفاده برای نمایش یک تصویر را کنترل میکند. بودجه توکن بالاتر، جزئیات بصری بیشتری را با هزینه محاسبات اضافی حفظ میکند، در حالی که بودجه پایینتر، استنتاج سریعتر را برای کارهایی که نیازی به درک دقیق ندارند، امکانپذیر میسازد.
- بودجههای توکن پشتیبانی شده عبارتند از: ۷۰، ۱۴۰، ۲۸۰، ۵۶۰ و ۱۱۲۰.
- از بودجههای پایینتر برای طبقهبندی، زیرنویس یا درک ویدیو استفاده کنید، جایی که استنتاج و پردازش سریعتر فریمهای زیاد، از جزئیات دقیقتر بیشتر است.
- از بودجههای بالاتر برای کارهایی مانند OCR، تجزیه اسناد یا خواندن متن کوچک استفاده کنید.
۶. طول ویدیو
همه مدلها از ورودیهای تصویر پشتیبانی میکنند و میتوانند ویدیوها را به صورت فریم پردازش کنند. ویدیو حداکثر ۶۰ ثانیه را پشتیبانی میکند، با فرض اینکه تصاویر با سرعت یک فریم در ثانیه پردازش میشوند.
دادههای مدل
دادههای مورد استفاده برای آموزش مدل و نحوه پردازش دادهها. مجموعه دادههای آموزشی
مجموعه دادههای پیشآموزشی ما مجموعهای متنوع و در مقیاس بزرگ از دادهها است که طیف وسیعی از حوزهها و روشها را شامل میشود و شامل اسناد وب، کد، تصاویر، صدا و تاریخ انقضای ژانویه ۲۰۲۵ میشود. اجزای کلیدی عبارتند از:
- اسناد وب: مجموعهای متنوع از متن وب تضمین میکند که مدل در معرض طیف گستردهای از سبکهای زبانی، موضوعات و واژگان قرار میگیرد. مجموعه دادههای آموزشی شامل محتوا در بیش از ۱۴۰ زبان است.
- کد: قرار دادن مدل در معرض کد به آن کمک میکند تا نحو و الگوهای زبانهای برنامهنویسی را یاد بگیرد، که توانایی آن را در تولید کد و درک سوالات مربوط به کد بهبود میبخشد.
- ریاضیات: آموزش متن ریاضی به مدل کمک میکند تا استدلال منطقی، نمایش نمادین و پرداختن به پرسشهای ریاضی را بیاموزد.
- تصاویر: طیف گستردهای از تصاویر، مدل را قادر میسازد تا تجزیه و تحلیل تصویر و وظایف استخراج دادههای بصری را انجام دهد.
ترکیب این منابع داده متنوع برای آموزش یک مدل چندوجهی قدرتمند که میتواند طیف گستردهای از وظایف و قالبهای داده مختلف را مدیریت کند، بسیار مهم است.
پیشپردازش دادهها
در اینجا روشهای کلیدی پاکسازی و فیلتر کردن دادهها که بر روی دادههای آموزشی اعمال میشوند، آورده شده است:
- فیلترینگ CSAM: فیلتر دقیق CSAM (مطالب مربوط به سوءاستفاده جنسی از کودکان) در چندین مرحله از فرآیند آمادهسازی دادهها اعمال شد تا از حذف محتوای مضر و غیرقانونی اطمینان حاصل شود.
- فیلترینگ دادههای حساس: به عنوان بخشی از ایمن و قابل اعتماد کردن مدلهای از پیش آموزش دیده Gemma، از تکنیکهای خودکار برای فیلتر کردن اطلاعات شخصی خاص و سایر دادههای حساس از مجموعههای آموزشی استفاده شد.
- روشهای دیگر: فیلتر کردن بر اساس کیفیت و ایمنی محتوا مطابق با سیاستهای ما.
اخلاق و ایمنی
با تبدیل شدن مدلهای باز به هسته اصلی زیرساختهای سازمانی، منشأ و امنیت از اهمیت بالایی برخوردار میشوند. DiffusionGemma که توسط Google DeepMind توسعه داده شده است، همان ارزیابیهای ایمنی دقیقی را که مدلهای اختصاصی Gemini ما انجام میدهند، پشت سر میگذارد.
رویکرد ارزیابی
DiffusionGemma با همکاری تیمهای ایمنی داخلی و هوش مصنوعی مسئول توسعه داده شد. طیف وسیعی از ارزیابیهای خودکار و همچنین انسانی برای کمک به بهبود ایمنی مدل انجام شد. این ارزیابیها با اصول هوش مصنوعی گوگل و همچنین سیاستهای ایمنی همسو هستند که هدف آنها جلوگیری از تولید محتوای مضر توسط مدلهای هوش مصنوعی مولد ما، از جمله موارد زیر است:
- محتوای مربوط به سوءاستفاده جنسی از کودکان و استثمار
- محتوای خطرناک (به عنوان مثال، ترویج خودکشی یا آموزش فعالیتهایی که میتواند باعث آسیب در دنیای واقعی شود)
- محتوای صریح جنسی
- سخنان نفرتانگیز (به عنوان مثال، غیرانسانی کردن اعضای گروههای محافظتشده)
- آزار و اذیت (به عنوان مثال، تشویق به خشونت علیه مردم)
نتایج ارزیابی
در تمام زمینههای آزمایش ایمنی، ما شاهد پیشرفتهای عمدهای در تمام دستههای ایمنی محتوا نسبت به نسلهای قبلی مدلهای Gemma بودیم. به طور کلی، DiffusionGemma، مانند مدلهای Gemma 4، در بهبود ایمنی به طور قابل توجهی از مدلهای Gemma 3 و 3n بهتر عمل میکند، در حالی که امتناعهای ناموجه را کم نگه میدارد. تمام آزمایشها عمداً بدون فیلترهای ایمنی انجام شد تا قابلیتهای خام مدل و رفتارهای پایه ارزیابی شوند. برای هر دو مدل تبدیل متن به متن و تبدیل تصویر به متن، و در تمام اندازههای مدل، این مدل حداقل نقض سیاست را ایجاد کرد و پیشرفتهای قابل توجهی نسبت به مدلهای قبلی Gemma نشان داد.
کاربرد و محدودیتها
این مدلها محدودیتهای خاصی دارند که کاربران باید از آنها آگاه باشند.
کاربرد مورد نظر
مدلهای چندوجهی (که قادر به پردازش بینایی، زبان و/یا صدا هستند) طیف گستردهای از کاربردها را در صنایع و حوزههای مختلف دارند. فهرست کاربردهای بالقوه زیر جامع نیست. هدف از این فهرست ارائه اطلاعات زمینهای در مورد موارد استفاده احتمالی است که سازندگان مدل به عنوان بخشی از آموزش و توسعه مدل در نظر گرفتهاند.
- ایجاد محتوا و ارتباطات
- تولید متن: قالبهای متنی خلاقانه مانند اشعار، اسکریپتها، کد، متن بازاریابی و پیشنویسهای ایمیل را تولید میکند.
- چتباتها و هوش مصنوعی محاورهای: رابطهای محاورهای را برای خدمات مشتری، دستیاران مجازی یا برنامههای تعاملی تقویت میکند.
- خلاصهسازی متن: خلاصههای مختصری از یک مجموعه متن، مقالات تحقیقاتی یا گزارشها تولید میکند.
- استخراج دادههای تصویر: دادههای بصری را برای ارتباطات متنی استخراج، تفسیر و خلاصه میکند. تحقیق
- آموزش
- تحقیقات پردازش زبان طبیعی (NLP) و VLM: به عنوان پایهای برای محققان جهت آزمایش تکنیکهای VLM و NLP، توسعه الگوریتمها و کمک به پیشرفت این حوزه عمل میکند.
- ابزارهای یادگیری زبان: از تجربیات یادگیری تعاملی زبان پشتیبانی میکند، به اصلاح دستور زبان یا ارائه تمرین نوشتاری کمک میکند.
- اکتشاف دانش: با تولید خلاصهها یا پاسخ به سؤالات در مورد موضوعات خاص، به محققان در کاوش در حجم زیادی از متن کمک میکند.
محدودیتها
- دادههای آموزشی
- دامنه مجموعه دادههای آموزشی، حوزههای موضوعی را که مدل میتواند به طور مؤثر مدیریت کند، تعیین میکند.
- کیفیت و تنوع دادههای آموزشی به طور قابل توجهی بر قابلیتهای مدل تأثیر میگذارد. سوگیریها یا شکافها در دادههای آموزشی میتواند منجر به محدودیتهایی در پاسخهای مدل شود.
- پیچیدگی زمینه و وظیفه
- این مدل در وظایفی که میتوانند با دستورالعملها و دستورالعملهای واضح تنظیم شوند، به خوبی عمل میکند. وظایف باز یا بسیار پیچیده ممکن است چالش برانگیز باشند.
- عملکرد مدل میتواند تحت تأثیر میزان زمینه ارائه شده قرار گیرد (زمینه طولانیتر معمولاً تا یک نقطه خاص منجر به خروجیهای بهتر میشود).
- ابهام و ظرافت زبان
- زبان طبیعی ذاتاً پیچیده است. این مدل ممکن است برای درک نکات ظریف، کنایه یا زبان تمثیلی با مشکل مواجه شود.
- دقت واقعی
- این مدل پاسخهایی را بر اساس اطلاعاتی که از مجموعه دادههای آموزشی خود آموخته است، تولید میکند، اما آنها پایگاه دانش نیستند. ممکن است گزارههای واقعی نادرست یا قدیمی تولید کند.
- عقل سلیم
- این مدل به الگوهای آماری در زبان متکی است. ممکن است در موقعیتهای خاص توانایی اعمال استدلال عقل سلیم را نداشته باشد.
ملاحظات و خطرات اخلاقی
در ایجاد یک مدل باز و مبتنی بر زبان بصری، موارد زیر را با دقت در نظر گرفتهایم:
- سوگیری و انصاف
- VLMهایی که بر روی دادههای متنی و تصویری در مقیاس بزرگ و دنیای واقعی آموزش دیدهاند، میتوانند سوگیریهای اجتماعی-فرهنگی نهفته در مطالب آموزشی را منعکس کنند. DiffusionGemma تحت بررسی دقیق، پیشپردازش دادههای ورودی و ارزیابیهای پس از آموزش قرار گرفت، همانطور که در این کارت گزارش شده است تا به کاهش خطر این سوگیریها کمک کند.
- اطلاعات نادرست و سوءاستفاده
- VLMها میتوانند برای تولید متنی نادرست، گمراهکننده یا مضر مورد سوءاستفاده قرار گیرند.
- دستورالعملهایی برای استفاده مسئولانه از مدل ارائه شده است، به جعبه ابزار هوش مصنوعی مولد مسئولانه مراجعه کنید.
- شفافیت و پاسخگویی
- این کارت مدل، جزئیات معماری، قابلیتها، محدودیتها و فرآیندهای ارزیابی مدل را خلاصه میکند.
- یک مدل باز توسعهیافته مسئولانه، فرصتی را برای به اشتراک گذاشتن نوآوری با در دسترس قرار دادن فناوری VLM برای توسعهدهندگان و محققان در سراسر اکوسیستم هوش مصنوعی فراهم میکند.
خطرات شناسایی شده و راهکارهای کاهش آنها:
- تولید محتوای مضر: سازوکارها و دستورالعملهای ایمنی محتوا ضروری هستند. توسعهدهندگان تشویق میشوند که احتیاط کنند و بر اساس سیاستهای خاص محصول و موارد استفاده از برنامه، اقدامات حفاظتی ایمنی محتوای مناسب را اجرا کنند.
- سوءاستفاده برای اهداف مخرب: محدودیتهای فنی و آموزش توسعهدهنده و کاربر نهایی میتواند به کاهش برنامههای مخرب VLMها کمک کند. منابع آموزشی و سازوکارهای گزارشدهی برای کاربران جهت گزارش سوءاستفاده ارائه شده است.
- نقض حریم خصوصی: مدلها بر اساس دادههای فیلتر شده برای حذف اطلاعات شخصی خاص و سایر دادههای حساس آموزش دیدهاند. توسعهدهندگان تشویق میشوند که با تکنیکهای حفظ حریم خصوصی، به مقررات حریم خصوصی پایبند باشند.
- تداوم سوگیریها: توصیه میشود که نظارت مداوم (با استفاده از معیارهای ارزیابی، بررسی انسانی) و بررسی تکنیکهای رفع سوگیری در طول آموزش مدل، تنظیم دقیق و سایر موارد استفاده انجام شود.
مزایا
در زمان انتشار، این یک مدل زبان بینایی باز با تأخیر کم و عملکرد بالا است که گزینهای جذاب برای توسعهدهندگان و علاقهمندان به تحقیق در مورد مدلهای زبان انتشار ارائه میدهد. این مدل در مقایسه با مدلهای با اندازه مشابه، از پایه برای توسعه هوش مصنوعی مسئولانه طراحی شده است.