跳到主要内容

Week 5: RAG 核心组件

目标:理解 RAG 的每个组件,能跑通完整的 RAG pipeline

学习安排

文件内容时间
Day 1day1_langchain_setup.py安装 LangChain + Chroma,跑通 quickstart30min
Day 2day2_document_loader.py文档加载器:加载 Markdown 文件30min
Day 3day3_text_splitter.py文档切分:chunk_size 和 overlap30min
Day 4day4_embedding.pyEmbedding:用 Ollama 做向量化30min
Day 5day5_vector_search.py向量检索:用 Chroma 存储和检索30min
Day 6-7day67_rag_pipeline.py串联:加载 → 切分 → 向量化 → 检索60min

环境准备

cd docs/14-AI/week5-rag-basics
python -m venv .venv && source .venv/bin/activate
pip install langchain langchain-community langchain-chroma chromadb
pip install openai python-dotenv

# Ollama embedding model
ollama pull nomic-embed-text