课程简介
本课程全面聚焦于检索增强生成 (RAG) 的理论与实践,深入讲解如何结合主流的大语言模型 (LLMs) 来实现智能信息检索和生成。课程从项目环境配置开始,逐步剖析RAG的核心模块及其实现链路。你将学习不同类型检索器的应用,Embedding技术在召回、粗排、精排中的实际操作,以及AI模型性能和RAG评估的最佳实践方法。
【最近更新:24-09-22 具体更新内容请查看视频简介】
项目实战简介
在本课程中,你将学习如何构建和部署独立的Embedding模型服务,用于计算文本查询的向量嵌入;此外,我还将带你完成两个完整的Chatbot项目实战:FAQ-Chatbot(自研项目)和 LangChain-Chatchat(整合了自研Elasticsearch知识库功能),你将有机会亲手设计并实现这两个智能问答机器人。
通过系统化的学习,你不仅能深入理解LLM和RAG的先进技术,还能积累宝贵的项目实战经验,并在实际项目中灵活运用这些知识,从而提升模型的智能生成与检索能力。此外,我还为你精心准备了前沿论文解读和学习笔记分享,帮助你更高效地掌握核心技术与算法。
实战项目1 :Embedding模型服务独立部署
在本项目中,我们将深入探讨如何构建和部署独立的Embedding模型服务,用于计算文本查询的向量嵌入。项目内容分为两个方案进行实战演练,并通过对比分析找到更优的解决方案:
方案-1:基于FastAPI实现Embedding模型服务部署
通过使用FastAPI,我们将从零开始构建一个高效、灵活的Embedding模型服务,深入讲解服务端的开发、优化以及在生产环境中的应用技巧,帮助实现高效的模型推理和快速响应。
方案-2:基于Huggingface的Text-Embeddings-Inference(TEI)实现Embedding模型服务部署
利用TEI框架,我们将展示如何使用预训练模型和微调模型进行文本嵌入的高效计算,该方案侧重于快速集成与高性能推理。
实战项目2:FAQ Chatbot(自研项目)
本项目开发了一个高性能FAQ Chatbot机器人,基于FastAPI、Elasticsearch和Docker实现,能够高效处理高并发请求,实现精准问答。系统通过用户输入分词后,利用BM25算法在Elasticsearch中进行初步检索,并借助Embedding模型进行深度语义匹配,对结果进行精排,从Top-K候选中选出最佳答案。
整个服务采用Docker容器化和Docker-Compose管理,支持高并发环境下的无缝扩展。FastAPI确保低延迟和高吞吐,Elasticsearch与BM25算法结合,提升了检索效率和响应准确性,Embedding模型则优先选择最相关答案,实现了快速、稳定的问答体验。
项目实战3:Langchain-Chatchat
(自研Elasticsearch知识库功能)
本项目以Langchain-Chatchat为基础,进行了针对企业级需求的深度优化,实现了本地化部署的Chatbot系统。与传统的Faiss方案不同,自研了基于Elasticsearch的知识库功能,充分利用其高效的检索能力,更适合企业级场景中的大规模数据管理和问答系统部署。Elasticsearch在处理复杂查询和大数据集时具有更高的稳定性和扩展性,因此在企业知识库应用中表现更为优越。
项目内容详细涵盖了从环境配置、功能开发到服务部署的完整流程,逐步指导你如何构建一个能够支持Web UI交互的本地Chatbot系统。你将学会如何整合本地知识库,实现高效的QA问答功能,并掌握系统优化的关键技术。课程内容已更新至0.2.10和0.3.1版本,提供了关于最新版本功能的深入讲解和实操演示,确保你在学习过程中紧跟技术前沿。
课程内容概览
大语言模型(LLM)和检索增强生成(RAG)理论与实战。
课程目录
(可点击试看预览课程内容)
- Embedding相似性计算的四种主流框架 (23:04)
- BCE项目快速入门与实践 (18:11)
- 案例实践:基于BCE与LangChain文档召回 (9:57)
- 案例实践:基于BCE与llamaIndex文档召回 (15:35)
- FlagEmbedding 案例实践:排序模型应用与模型微调 (26:04)
- FlagEmbedding 案例实践:重排模型应用与模型微调 (17:50)
- FlagEmbedding:深入BGE-M3算法原理精讲-上集 (19:39)
- FlagEmbedding:深入BGE-M3算法原理精讲-下集 (11:44)
- FlagEmbedding 案例实践:BGE-M3应用与微调 (12:45)
- FlagEmbedding集成工具包C-Pack简述 (7:00)
- 生成式与生成密集检索算法概述 (9:47)
- ⽣成器模块优化 (7:46)
- RAGAS案例实践资料
- 探索RAGAS评估框架:核心指标原理精讲 (24:40)
- RAGAS评估框架案例实践:快速入门 (11:42)
- 案例实践 应用RAGAS评估框架:忠诚度指标 (7:23)
- 源码解析 深入RAGAS评估框架:忠诚度指标 (15:12)
- 案例实践 应用RAGAS评估框架:评估答案相关性指标 (4:32)
- 源码解析 深入RAGAS评估框架:评估答案相关性指标 (12:38)
- 案例实践 应用RAGAS评估框架:上下文精确度指标 (4:18)
- 源码解析 深入RAGAS评估框架:上下文精确度指标 (12:58)
- 案例实践 应用RAGAS评估框架:上下⽂召回率指标 (7:08)
- 源码解析 深入RAGAS评估框架:上下文召回率指标 (16:23)
- 案例实践 应用RAGAS评估框架:答案相似性与正确性指标 (7:29)
- 源码解析 深入RAGAS评估框架:答案相似性与正确性指标 (17:36)
- 案例实践 应用RAGAS评估框架:多维度评判指标 (2:54)
- 源码解析 深入RAGAS评估框架:多维度评判指标 (7:55)
- 案例实践 应用RAGAS评估框架:Prompt语⾔⾃适应 (7:47)
- 案例实践 应用RAGAS评估框架:基于⾃定义LLM进⾏评估 (6:15)
- Langchain-ChatChat 实战项目资料
- Langchain-Chatchat 0.2.0 智能问答机器人:项目介绍与运行演示 (15:22)
- Langchain-Chatchat 0.2.0 服务器环境配置与部署 (25:28)
- 启动Langchain-Chatchat 0.2.0 服务并通过Web界面交互 (20:04)
- 基于ElasticSearch和Kibana对Langchain-Chatchat 0.2.0 进行容器化部署 (37:01)
- 深入Langchain-Chatchat 0.2.0:Startup核心源码解析 (18:36)
- 深入Langchain-Chatchat 0.2.0:交互模块chat源码解析 (20:17)
- 深入Langchain-Chatchat 0.2.0:重排模块Reranker源码解析 (12:18)
- 深入Langchain-Chatchat 0.2.0:知识库模块knowledge_base源码解析(上) (23:13)
- 深入Langchain-Chatchat 0.2.0:知识库模块knowledge_base源码解析(下) (14:07)
- 深入Langchain-Chatchat 0.2.0:加载器模块loader源码解析 (11:58)
- Langchain-Chatchat 0.3.1 项目环境配置与依赖包安装 (15:15)
- Langchain-Chatchat 0.3.1 方案一 基于XInference进行大模型与RAG服务部署 (34:46)
- 方案二_基于Docker容器化部署Langchain-chatchat服务(上集-部署ElasticSearch和Kibana服务) (18:12)
- 方案二_基于Docker容器化部署Langchain-chatchat服务(下集-构建Dockerfile与镜像文件,全流程部署服务) (26:36)
前沿技术 适时更新
本课程适合对大语言模型(LLM)和检索增强生成(RAG)技术感兴趣的学习者,无论你是计算机科学、人工智能、数据科学等相关专业的学生,还是从事自然语言处理、信息检索、机器学习等领域的职场专业人士,亦或是渴望深入探索前沿技术的AI爱好者,本课程将为你提供系统的理论知识与实战技能,帮助你在技术道路上进一步提升。
课程内容会随着技术的发展进行适时更新,让你始终紧随前沿技术。你的购买价格既包含了当前所有课程内容,又免费享受后续课程的全部更新内容。你无需任何操作,课程更新后会在你的学习账号下自动显示。
一次购买 终身学习
本系列课程内容紧密结合算法理论与项目实战,助您全面掌握从零到一的 LLM 和 RAG 开发全流程,确保您在理论与实践中都能游刃有余。课程永久有效,你可以灵活安排学习进度。所有精品课程不会参与任何促销活动,课程的价格只会随着后续课程的更新有所上调。所以,如果你想加入学习,最好的时间就是现在!
IOS用户可使用Teachable APP下载课程到本地,实现离线学习(点此查看如何登陆网站以及下载使用APP)
学习目标
1. 深⼊理解NLP算法:
深⼊理解⾃然语⾔处理的基础算法,比如检索、排序、指标评估等,这些都是信息检索和问答系统中重要的组成部分。
2. 掌握实⽤⼯具和框架:
掌握如何使⽤ LangChain, LlamaIndex, FastAPI 和 Docker 等⼯具来部署和管理LLM,这些技能对于将理论应⽤于实践⾄关重要。
3. 构建智能ChatBot:
掌握构建ChatBot的技能,包括如何利⽤LLM来理解和响应⽤户的问题。
4. 知识库的构建与整合:
学习如何构建⼀个知识库,以及如何将其与RAG等算法整合,提⾼问答系统的性能。
5. 索引和检索技术:
学习如何为⼤规模数据集建⽴索引的知识,以及如何通过这些索引⾼效检索信息。
6. 部署和扩展模型:
理解并掌握如何基于Docker、Docker-Compose应用和优化你的LLM服务,以处理更⼤的数据集和更复杂的任务。
课程配套资料
为了帮助你在学习过程中更加深入地掌握课程内容,我精心准备了一系列配套资料。这些资料包括:课程相关笔记文档,案例实践的相关代码,实战项目的代码,5篇精讲论文的思维导图(jpg和PDF) 以及19篇与RAG相关的前沿论文精读文档。
这些资料将成为你学习过程中不可或缺的工具,帮助你更好地理解并应用课程中的核心技术与理念。课程配套资料请在课程页面自助下载,课程更新后资料会同步更新,敬请关注。
常见问题
一、无法使用美元支付怎么办?
如国内的同学因支付受限等原因无法直接完成支付,可以点击此处通过淘宝链接进行支付。
请在淘宝购买后发送订单号和用于注册学习账号的邮箱到我的公众号后台,我将在24小时内手动邀请你加入课程。(你可以提前注册账号,只需确保提供给我的邮箱与你的注册邮箱一致即可。
二、什么时候购买最优惠?
所有精品系列课程终身有效,并会进行适当更新,除了未来的粉丝回馈活动,课程本身不会参与任何优惠和促销,课程价格只会随着后续课程的更新有所上调。如果你想以一个比较低的价格加入课程,越早加入越好。如果你做过对比,能够透过花哨的宣传看清楚知识的本质,你应该会知道我的精品课程的性价比。你甚至可以通过学习我分享的开源课程,就可以学到很多在其他地方需要付费才能学到的知识。
三、课程是否提供一对一指导?
本课程的定价仅包含全部视频课程内容以及相关配套资料的终身学习权限,并不包含一对一指导服务,但我可以在时间允许时为大家进行课程相关问题的解答。所有课程内容的设计都经过反复的打磨,并配有十分详尽的课程资料,确保大家能够高效掌握。目前精品系列课程已通过数百名同学的真实学习反馈,获得高度好评。如果在学习过程中有任何疑问,请在对应课程视频下方给我留言,我会尽快回复。
四、我是转行过来的,听说大模型很火,学完这个课程能不能直接上手?
实事求是的说,我并不建议你直接学习我的课程。我的精品课程专为AI技术领域的专业人才设计,课程内容紧随前沿技术,具有一定深度,并不是仅凭一步步跟随操作就能学会的简单教学。非科班出身或转行学习者可能会感到吃力。如果你决心深入学习AI技术,我真诚的建议你花一些时间,将一些相关的基础知识先理解和掌握。很多基础知识无论是在B站还是中国大学慕课网,都有很多优秀的老师做免费分享,只有打好基础,一步步积累,才能真正与前沿技术接轨。
五、我可以每天问很多很多的问题吗?
我非常欢迎大家积极的学习和提问,但一定要问有价值的问题。对于那些通过搜索引擎即可找到答案的问题,以及可以在B站或中国大学慕课网等平台免费学习的基础知识,我建议你花些时间主动学习和理解,这比直接提问更为高效。主动解决问题是AI学习者的基本能力,要尽快摸索出一套适合自己的高效学习方法,这样你才能在技术这条路上越走越远。
六、听说课程永久有效、后续还会进行更新,什么时候会更新?
作为一个终身学习的技术爱好者,我的所有精品课程都会随着技术的发展以及我个人的技术积累为大家适时进行更新。由于时间精力有限,我会根据技术发展的成熟度以及个人工作安排来进行更新。大家可以关注我的网站课程页面,以及公众号、B站动态、YouTube动态、邮箱推送等我的个人官方账号通知。