یکی از کتاب های فنی و بسیار کاربردی در حوزه هوش مصنوعی کتاب آموزش RAG است که در انتهای مطلب به صورت رایگان آن را تقدیم شما خواهیم کرد. دیگر کتاب های فنی هوش مصنوعی ما را نیز دنبال نمایید.
عنوان انگلیسی کتاب: Mastering Rag: Harnessing the power of retrieval-augmented generation in AI
معنی فارسی عنوان: تسلط بر رَگ: بهرهگیری از قدرت تولید مبتنی بر بازیابی در هوش مصنوعی
ناشر: Galileo (rungalileo.io)
سال انتشار: ۲۰۲۴
خلاصه کتاب آموزش RAG
مقدمه
کتاب با بیان موج عظیم پیشرفتهای هوش مصنوعی آغاز میشود و توضیح میدهد که چگونه مدلهای زبانی بزرگ (LLMs) به نقطهای رسیدهاند که میتوانند متون منسجم تولید کنند، اما به محدودیتهای دانش ایستا گرفتارند. نویسندگان مجموعهٔ Galileo این کتاب را برای کسانی نوشتهاند که میخواهند این محدودیت را با فناوری RAG (Retrieval-Augmented Generation) برطرف کنند — یعنی ترکیب قدرت حافظهٔ زبانی مدلها با دانش واقعی و بهروز بیرونی.
در مقدمه گفته میشود که هدف RAG، آشتی دادن «حافظهٔ کوتاهمدت مدلهای زبانی» با «حقیقت جهان واقعی» است. با این روش، پاسخهای هوش مصنوعی نهتنها خلاق، بلکه مستند و قابل اعتماد خواهند شد.
فصل ۱: آشنایی با RAG و نقش آن در اکوسیستم هوش مصنوعی
در این فصل، مفاهیم پایهای RAG معرفی میشود. نویسندگان توضیح میدهند که در معماری سنتی مدلهای زبانی، تمام دانش در وزنهای مدل تعبیه شده است؛ اما در RAG، دادههای بیرونی بهصورت پویا بازیابی میشوند و سپس به مدل تزریق میگردند تا پاسخ تولیدشده بر پایهٔ واقعیت باشد.
ایدهٔ اصلی این است که مدل بهجای «دانستن همهچیز»، بتواند دانش درست را در زمان درست پیدا کند.
فصل، با مثالهایی از جستجوی متون در پایگاههای تخصصی (مانند PubMed و ArXiv) پایان مییابد و نشان میدهد که چگونه RAG در پزشکی، آموزش، و تحلیل اسناد قانونی کاربرد دارد.
فصل ۲: درک زیرساخت بازیابی
در این بخش، خواننده به اجزای اصلی ماژول «بازیابی» هدایت میشود: این شامل ایندکسسازی، بردارسازی (Embedding) و جستجوی معنایی است.
نویسندگان گامبهگام توضیح میدهند که چگونه اسناد به بردارهای عددی تبدیل میشوند تا مدل بتواند شباهت معنایی بین پرسش و محتوا را تشخیص دهد.
در ادامه، مقایسهای بین موتورهای جستجو (مانند Elasticsearch و FAISS) ارائه میشود و بهینهسازی عملکرد در مقیاس بزرگ بررسی میگردد.
نکتهٔ کلیدی این فصل: کیفیت دادهٔ بازیابیشده، کیفیت خروجی نهایی را تعیین میکند.
فصل ۳: ترکیب بازیابی و تولید
در این فصل، تعامل بین دو ماژول اصلی (retriever و generator) تحلیل میشود. RAG در حقیقت یک زنجیرهٔ بسته است: ورودی → بازیابی منابع → تغذیهٔ مدل → تولید پاسخ.
نویسندگان با نمودارهای ساده نشان میدهند که اگر دادههای بازیابیشده مرتبط نباشند، مدل هرچقدر هم قدرتمند باشد، پاسخ نادرست خواهد داد.
در پایان فصل، تکنیکهایی مانند Context Compression و Prompt Engineering برای مدیریت حافظه و افزایش دقت معرفی میشوند.
فصل ۴: طراحی معماریهای RAG
این فصل فنیتر است و ساختارهای مختلف RAG (مانند RAG-Sequence و RAG-Token) را تشریح میکند.
در RAG-Sequence، کل سند بازیابیشده به مدل تزریق میشود؛ در RAG-Token، هر توکن تولیدی میتواند در لحظه با دادهٔ جدید تغذیه شود.
نویسندگان نشان میدهند که انتخاب نوع معماری باید بر اساس حجم دیتا و هزینهٔ پردازش انجام گیرد.
در این فصل همچنین اشارهای به چارچوبهای اجرایی مانند LangChain، LlamaIndex و Haystack میشود.
فصل ۵: تنظیم و بهینهسازی مدلها
در اینجا نویسنده به چالشهای تنظیم دقیق مدلهای RAG پرداخت. لذا ترکیب دو بخش بازیابی و تولید معمولاً منجر به عدم تعادل در یادگیری میشود.
نویسندگان رویکردهایی مانند Fine-Tuning with Augmented Data و Re-Ranking Models را پیشنهاد میکنند.
فصل توضیح میدهد که معیارهای کلیدی عملکرد (Precision، Recall و Relevance) چگونه باید متوازن شوند تا سیستم هم سریع باشد و هم دقیق.
فصل ۶: ارزیابی عملکرد RAG
این فصل کاملاً تحلیلی است و شاخصهای سنجش کیفیت را معرفی میکند:
- Faithfulness: صحت ارتباط بین پاسخ و منبع واقعی
- Groundedness: میزان تکیهٔ مدل بر دادههای بازیابیشده
- Diversity: تنوع پاسخها در مواجهه با ورودیهای مشابه
نمونههایی از آزمونهای انسانی و خودکار آورده میشود و نویسندگان پیشنهاد میکنند برای کاربردهای حساس (مثلاً پزشکی یا مالی) همیشه ارزیابی انسانی انجام گیرد.
فصل ۷: خطاها و چالشهای متداول
در این فصل، خطاهای رایج مانند «hallucination»، بازیابی ناکامل و تکرار دیتاها توضیح داده میشود.
نویسندگان تأکید میکنند که حتی RAG هم در صورت تغذیهٔ دادهٔ اشتباه دچار توهم میشود.
برای حل این مشکل، راهکارهایی چون Context Filtering، Answer Validation و Human-in-the-Loop ارائه میگردد.
فصل ۸: کاربردهای واقعی RAG
این بخش، مثالهایی از پروژههای واقعی میآورد:
- پشتیبانی مشتری با دانشپایهٔ خودکار
- کمک به تحلیل مستندات حقوقی
- خلاصهسازی گزارشهای پژوهشی
در هر مورد، تأکید میشود که طراحی موفق RAG نیازمند تعادل میان خودکارسازی و کنترل انسانی است.
همچنین تجربهٔ عملی Galileo در پیادهسازی RAG در محصولات خود تشریح میشود.
فصل ۹: آیندهٔ RAG و همگرایی با هوش مصنوعی عمومی
در فصل پایانی، آموزش RAG نگاهی آیندهنگرانه ارائه میشود. نویسندگان باور دارند که RAG سنگبنای گذار به سیستمهای Agentic AI است — سامانههایی که میتوانند خود تصمیم بگیرند و اطلاعات جدید بیاموزند.
پیشبینی میشود که در سالهای آینده، RAG با عاملهای خودمختار (Agents) و حافظههای بلندمدت ادغام شود تا نسل تازهای از دستیارهای هوشمند پدید آید.
نتیجهٔ کلیدی این فصل آن است که:
«در آینده، هوش مصنوعی نه فقط میگوید چه میداند، بلکه توضیح میدهد از کجا میداند.»
جمعبندی نهایی آموزش RAG
کتاب Mastering RAG راهنمایی جامع برای مهندسان و پژوهشگران هوش مصنوعی است که میخواهند از مدلهای زبانی، سامانههای پاسخگو و واقعمحور بسازند.
پیام اصلی اثر ساده اما بنیادین است:
دانش واقعی، زمانی ارزش دارد که بتوان آن را بازیابی و درک کرد.
RAG این توانایی را به مدلهای زبانی میدهد تا نهفقط متقاعدکننده حرف بزنند، بلکه درست بگویند.
کتاب نتیجه میگیرد که آیندهٔ AI به سوی «هوش قابل اعتماد» پیش میرود — هوشی که مبتنی بر دیتا، منبعدار و انسانی است.
.
دانلود کامل کتاب: