یکی از کتاب های فنی و بسیار کاربردی در حوزه هوش مصنوعی را تقدیم شما خواهیم کرد.
تسلط بر RAG: بهرهگیری از قدرت تولید مبتنی بر بازیابی در هوش مصنوعی
ناشر: Galileo (rungalileo.io)
سال انتشار: ۲۰۲۴
مقدمه
کتاب با بیان موج عظیم پیشرفتهای هوش مصنوعی آغاز میشود و توضیح میدهد که چگونه مدلهای زبانی بزرگ (LLMs) به نقطهای رسیدهاند که میتوانند متون منسجم تولید کنند، اما به محدودیتهای دانش ایستا گرفتارند. نویسندگان مجموعهٔ Galileo این کتاب را برای کسانی نوشتهاند که میخواهند این محدودیت را با فناوری RAG (Retrieval-Augmented Generation) برطرف کنند — یعنی ترکیب قدرت حافظهٔ زبانی مدلها با دانش واقعی و بهروز بیرونی.
در مقدمه گفته میشود که هدف RAG، آشتی دادن «حافظهٔ کوتاهمدت مدلهای زبانی» با «حقیقت جهان واقعی» است. با این روش، پاسخهای هوش مصنوعی نهتنها خلاق، بلکه مستند و قابل اعتماد خواهند شد.
فصل ۱: آشنایی با RAG و نقش آن در اکوسیستم هوش مصنوعی
در این فصل، مفاهیم پایهای RAG معرفی میشود. نویسندگان توضیح میدهند که در معماری سنتی مدلهای زبانی، تمام دانش در وزنهای مدل تعبیه شده است؛ اما در RAG، دادههای بیرونی بهصورت پویا بازیابی میشوند و سپس به مدل تزریق میگردند تا پاسخ تولیدشده بر پایهٔ واقعیت باشد.
ایدهٔ اصلی این است که مدل بهجای «دانستن همهچیز»، بتواند دانش درست را در زمان درست پیدا کند.
فصل، با مثالهایی از جستجوی متون در پایگاههای تخصصی (مانند PubMed و ArXiv) پایان مییابد و نشان میدهد که چگونه RAG در پزشکی، آموزش، و تحلیل اسناد قانونی کاربرد دارد.
فصل ۲: درک زیرساخت بازیابی
در این بخش، به اجزای اصلی ماژول «بازیابی» پرداخته میشود: ایندکسسازی، بردارسازی (Embedding) و جستجوی معنایی.
نویسندگان گامبهگام توضیح میدهند که چگونه اسناد به بردارهای عددی تبدیل میشوند تا مدل بتواند شباهت معنایی بین پرسش و محتوا را تشخیص دهد.
در ادامه، مقایسهای بین موتورهای جستجو (مانند Elasticsearch و FAISS) ارائه میشود و بهینهسازی عملکرد در مقیاس بزرگ بررسی میگردد.
نکتهٔ کلیدی این فصل: کیفیت دادهٔ بازیابیشده، کیفیت خروجی نهایی را تعیین میکند.
فصل ۳: ترکیب بازیابی و تولید
در این فصل، تعامل بین دو ماژول اصلی (retriever و generator) تحلیل میشود. RAG در حقیقت یک زنجیرهٔ بسته است: ورودی → بازیابی منابع → تغذیهٔ مدل → تولید پاسخ.
نویسندگان با نمودارهای ساده نشان میدهند که اگر دادههای بازیابیشده مرتبط نباشند، مدل هرچقدر هم قدرتمند باشد، پاسخ نادرست خواهد داد.
در پایان فصل، تکنیکهایی مانند Context Compression و Prompt Engineering برای مدیریت حافظه و افزایش دقت معرفی میشوند.
فصل ۴: طراحی معماریهای RAG
این فصل فنیتر است و ساختارهای مختلف RAG (مانند RAG-Sequence و RAG-Token) را تشریح میکند.
در RAG-Sequence، کل سند بازیابیشده به مدل تزریق میشود؛ در RAG-Token، هر توکن تولیدی میتواند در لحظه با دادهٔ جدید تغذیه شود.
نویسندگان نشان میدهند که انتخاب نوع معماری باید بر اساس حجم داده و هزینهٔ پردازش انجام گیرد.
در این فصل همچنین اشارهای به چارچوبهای اجرایی مانند LangChain، LlamaIndex و Haystack میشود.
فصل ۵: تنظیم و بهینهسازی مدلها
در اینجا به چالشهای تنظیم دقیق مدلهای RAG پرداخته میشود. ترکیب دو بخش بازیابی و تولید معمولاً منجر به عدم تعادل در یادگیری میشود.
نویسندگان رویکردهایی مانند Fine-Tuning with Augmented Data و Re-Ranking Models را پیشنهاد میکنند.
فصل توضیح میدهد که معیارهای کلیدی عملکرد (Precision، Recall و Relevance) چگونه باید متوازن شوند تا سیستم هم سریع باشد و هم دقیق.
فصل ۶: ارزیابی عملکرد RAG
این فصل کاملاً تحلیلی است و شاخصهای سنجش کیفیت را معرفی میکند:
- Faithfulness: صحت ارتباط بین پاسخ و منبع واقعی
 - Groundedness: میزان تکیهٔ مدل بر دادههای بازیابیشده
 - Diversity: تنوع پاسخها در مواجهه با ورودیهای مشابه
نمونههایی از آزمونهای انسانی و خودکار آورده میشود و نویسندگان پیشنهاد میکنند برای کاربردهای حساس (مثلاً پزشکی یا مالی) همیشه ارزیابی انسانی انجام گیرد. 
فصل ۷: خطاها و چالشهای متداول
در این فصل، خطاهای رایج مانند «hallucination»، بازیابی ناکامل و تکرار دادهها توضیح داده میشود.
نویسندگان تأکید میکنند که حتی RAG هم در صورت تغذیهٔ دادهٔ اشتباه دچار توهم میشود.
برای حل این مشکل، راهکارهایی چون Context Filtering، Answer Validation و Human-in-the-Loop ارائه میگردد.
فصل ۸: کاربردهای واقعی RAG
این بخش، مثالهایی از پروژههای واقعی میآورد:
- پشتیبانی مشتری با دانشپایهٔ خودکار
 - کمک به تحلیل مستندات حقوقی
 - خلاصهسازی گزارشهای پژوهشی
در هر مورد، تأکید میشود که طراحی موفق RAG نیازمند تعادل میان خودکارسازی و کنترل انسانی است.
همچنین تجربهٔ عملی Galileo در پیادهسازی RAG در محصولات خود تشریح میشود. 
فصل ۹: آیندهٔ RAG و همگرایی با هوش مصنوعی عمومی
در فصل پایانی، نگاهی آیندهنگرانه ارائه میشود. نویسندگان باور دارند که RAG سنگبنای گذار به سیستمهای Agentic AI است — سامانههایی که میتوانند خود تصمیم بگیرند و اطلاعات جدید بیاموزند.
پیشبینی میشود که در سالهای آینده، RAG با عاملهای خودمختار (Agents) و حافظههای بلندمدت ادغام شود تا نسل تازهای از دستیارهای هوشمند پدید آید.
نتیجهٔ کلیدی این فصل آن است که:
«در آینده، هوش مصنوعی نه فقط میگوید چه میداند، بلکه توضیح میدهد از کجا میداند.»
جمعبندی نهایی
کتاب Mastering RAG راهنمایی جامع برای مهندسان و پژوهشگران هوش مصنوعی است که میخواهند از مدلهای زبانی، سامانههای پاسخگو و واقعمحور بسازند.
پیام اصلی اثر ساده اما بنیادین است:
دانش واقعی، زمانی ارزش دارد که بتوان آن را بازیابی و درک کرد.
RAG این توانایی را به مدلهای زبانی میدهد تا نهفقط متقاعدکننده حرف بزنند، بلکه درست بگویند.
کتاب نتیجه میگیرد که آیندهٔ AI به سوی «هوش قابل اعتماد» پیش میرود — هوشی که مبتنی بر داده، منبعدار و انسانی است.
.
دانلود کامل کتاب: