RAG学习资源
我们整理了一系列高质量的RAG相关学习资源,帮助您深入了解RAG技术的各个方面。这些资源包括研究论文、教程、工具库、视频讲解和社区资源等。
核心论文
Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks
Patrick Lewis, Ethan Perez, Aleksandra Piktus, et al.
NeurIPS 2020
这篇开创性论文首次提出了RAG的概念,将检索系统与生成模型结合,显著提升了知识密集型任务的性能。
阅读论文
REALM: Retrieval-Augmented Language Model Pre-Training
Kelvin Guu, Kenton Lee, Zora Tung, et al.
ICML 2020
提出了一种将检索机制集成到预训练阶段的方法,使语言模型能够在预训练过程中学习如何检索和利用知识。
阅读论文
Improving Language Models by Retrieving from Trillions of Tokens
Sebastian Borgeaud, Arthur Mensch, Jordan Hoffmann, et al.
ICML 2022
介绍了RETRO模型,展示了如何从海量文本数据中进行高效检索,并将检索结果整合到语言模型生成过程中。
阅读论文
索引策略相关论文
Efficient and Effective Similarity Search for Large Scale Information Retrieval
Marius Muja, David G. Lowe
Computer Vision and Pattern Recognition 2014
详细介绍了HNSW算法的原理和实现,这是目前最流行的向量索引算法之一。
阅读论文
Hybrid Retrieval for Retrieval-Augmented Generation
Zhengbao Jiang, Frank F. Xu, Luyu Gao, et al.
ACL 2023
探讨了在RAG系统中结合稀疏检索和密集检索的混合索引策略,以及如何有效融合不同检索结果。
阅读论文
ColBERT: Efficient and Effective Passage Search via Contextualized Late Interaction over BERT
Omar Khattab, Matei Zaharia
SIGIR 2020
提出了一种高效的上下文感知检索方法,通过延迟交互机制平衡了检索效率和效果,适用于分层索引策略。
阅读论文
开源工具与框架
LlamaIndex
一个强大的RAG框架,提供了丰富的索引策略和检索方法,支持多种数据源和LLM集成。
Python
向量索引
关键词索引
混合索引
GitHub
文档
LangChain
一个用于构建LLM应用的框架,提供了丰富的RAG组件,包括多种索引和检索策略。
Python
JavaScript
向量存储
检索器
GitHub
文档
FAISS
Facebook AI开发的高效向量索引库,支持多种索引算法,包括HNSW、IVF、PQ等。
C++
Python
向量索引
高性能
GitHub
文档
Milvus
开源向量数据库,专为嵌入相似性搜索和AI应用设计,支持多种索引类型和混合查询。
Go
C++
向量数据库
分布式
GitHub
文档
Elasticsearch
强大的搜索引擎,支持全文检索和向量搜索,适合构建混合索引RAG系统。
Java
全文检索
向量搜索
分布式
GitHub
文档
教程与课程
Building RAG-based LLM Applications for Production
DeepLearning.AI
由LlamaIndex创始人Jerry Liu和Andrew Ng共同讲授的短期课程,介绍如何构建生产级RAG应用。
课程链接
LangChain: Chat with Your Data
DeepLearning.AI
由LangChain创始人Harrison Chase讲授,介绍如何使用LangChain构建RAG应用,与自己的数据进行对话。
课程链接
Advanced RAG Techniques: A Comprehensive Guide
Pinecone
详细介绍了高级RAG技术,包括多种索引策略、检索方法和优化技巧。
教程链接
视频资源
RAG Architecture Explained
AI Coffee Break with Letitia
通过简明易懂的动画解释RAG的基本架构和工作原理。
观看视频
Advanced RAG: Improving Retrieval for Chatbots
Stanford MLSys Seminar
斯坦福大学机器学习系统研讨会上关于高级RAG检索技术的讲座。
观看视频
Vector Databases and Embeddings for RAG
Weights & Biases
详细介绍向量数据库和嵌入技术在RAG系统中的应用。
观看视频
社区与讨论组
LlamaIndex Discord
LlamaIndex的官方Discord社区,有关于RAG和索引策略的活跃讨论。
加入社区
LangChain Discord
LangChain的官方Discord社区,包含丰富的RAG相关讨论和资源。
加入社区
r/LocalLLaMA
Reddit上关于本地部署LLM的社区,包含许多RAG实现的讨论。
访问社区
博客与文章
The RAG Stack: A Reference Architecture
Eugene Yan
详细介绍了RAG系统的参考架构,包括各种索引策略和组件选择。
阅读文章
Patterns for Building LLM-based Systems & Products
Lilian Weng
OpenAI的Lilian Weng撰写的关于LLM应用模式的文章,包含对RAG的深入讨论。
阅读文章
Retrieval Augmented Generation: Streamlining the Creation of Intelligent Natural Language Processing Models
Pinecone
全面介绍RAG技术的工作原理、优势和实现方法。
阅读文章