Autoplay
Autocomplete
Previous Lesson
Complete and Continue
大模型公开课(持续更新)
大模型公开课(持续更新)
下载并使用Teachable APP(仅支持IOS)
微软Agent Lightning 理论与实战
微软Agent Lightning框架概览 (2:16)
统一数据接口:让AI Agent执行与强化学习训练无缝衔接 (6:54)
马尔可夫决策过程(MDP)详解:AI Agent与RL训练的理论基石 (8:22)
LightningRL详解:将多轮Agent训练转化为单轮RL任务 (8:18)
RL训练与Agent执行分离:AI Agent优化的新范式 (8:39)
Agent Lightning分布式训练架构设计模式 (7:17)
阿里多模态VRAG-RL 原理与实战
VRAG-RL研究背景详解 (7:14)
VRAG-RL方法论全拆解:多专家采样 × 细粒度奖励 (24:19)
VRAG项目全流程解析:构建视觉增强问答系统(Agent+RAG+Qwen2.5) (18:59)
RLT 教师强化学习 理论与实战
RLT教师强化学习 概念框架与训练逻辑 (17:33)
RLT稠密奖励机制深度分析 (17:47)
RLT项目实战:奖励模型+偏好优化全流程解析(SFT+GRPO) (20:39)
Qwen3 Embedding 原理与实战
Qwen3 Embedding 模型详解 (22:14)
Qwen3 Embedding+Reranker 本地推理与部署实战 (23:01)
【实战】Qwen3 Embedding 高效知识库检索系统Demo (15:24)
Qwen3 Embedding 模型微调教程(含LoRA与全参训练) (11:42)
Qwen3 Reranker 模型微调教程(LoRA高效微调+DeepSpeed训练加速) (7:00)
前沿论文与最新技术趋势洞察
Soft Thinking原理 离散Token局限+连续概念空间+Cold Stop机制解析 (21:18)
Soft Thinking与CoT对比实验分析 LLM推理效率优化实战|多路径推理+早停机制+参数配置全流程 (18:49)
微软首个多模态语言模型Phi-4 模型详解|模型架构|模型训练Pipeline (12:17)
微软多模态语言模型Phi-4 案例实战:8个Demo案例演示 (21:34)
月之暗面发布面向大模型的MoBA(混合块注意力)架构 结合MoE和稀疏注意力 算法原理详解 (18:56)
英伟达发布MM-Embed:融合文本和图像的跨模态信息检索新模型 (28:49)
北大发布多模态大模型LLaVA-o1(已更名为LLaVA-CoT)推理计算Scaling新思路 (21:55)
Google发表最新推理Scaling研究,从 DRAG 到 IterDRAG,大模型 RAG 性能更上一层楼 (33:30)
探索OpenAI o1模型系列:模型性能深度解析 (33:38)
Agentic RAG 原理与实战
课程简介及RAG背景概述|LLM面临的挑战|RAG的作用|LLM与RAG比较 (7:57)
RAG原理详解:如何用检索增强生成技术提升大模型问答能力|原理+挑战+解决方案全解析 (9:26)
Agentic RAG原理详解:智能体驱动的检索增强新范式|大模型+智能体融合应用 (6:36)
Agent核心架构全解:四大设计模式+五类工作流机制 (9:27)
Agentic RAG架构全解析:7种典型系统设计与实战应用 (11:16)
【原创案例】基于 Qwen3 + langchain + ollama + Faiss + agno 搭建完整RAG系统 (24:25)
【源码解析】原创案例 Agentic RAG 本地智能问答系统 项目实现思路及核心源码讲解 (21:17)
MCP 模型上下文协议 多场景应用实战
理论部分:MCP概述|MCP解决的核心问题|MCP技术架构与实现 (14:31)
理论部分:MCP的工作流程 基于 Cline + DeepSeek V3 + Cloudflare 演示 (16:13)
理论部分:MCP的关键优势|MCP与API对比|MCP的生态系统|挑战与限制|与现有解决方案的比较(附参考资料) (16:51)
实战:基于Claude和Cline进行MCP服务器配置 (16:19)
实战:MCP Inspector 调试 MCP Servers 的使用方法 (10:16)
实战:MCP Server 开发与应用 原创案例:待办事项助手 (16:53)
OpenAI Agents 多智能体框架
OpenAI Agents SDK 轻量级多智能体框架 项目概述|核心模块|主要特点|应用场景 (17:21)
原创项目 天气查询助手Agent 基于Ollama获取开源模型服务 (15:51)
常用代理模式一:确定性流程 (12:07)
常用代理模式二:交接与路由模式 (14:17)
常用代理模式三:代理作为工具 (10:47)
常用代理模式四:LLM作为评判者 (11:42)
常用代理模式五:并行模式 (6:23)
原创案例 本地浏览器自动化检索 基于Ollama Playwright MLFlow (17:11)
原创案例 本地浏览器自动化检索 源码讲解 (16:02)
AI Agent LLM智能体轻量级开发框架 lagent 项目
AI Agent全景解析 + Lagent 框架简介 (21:28)
lagent 项目实战 案例一:基础对话模型调用 (32:14)
lagent 项目实战 案例二:fewshot 示例增强 (19:18)
lagent 项目实战 案例三:Agent驱动的Python代码执行器 (26:52)
lagent 项目实战 案例四:高德天气API集成 (26:48)
lagent 项目实战 案例五:高德位置搜索和导航 (15:28)
DeepSeek 大模型实战
实战-1:DeepSeek R1 + Ollama + OpenWebUI本地RAG实战 (17:01)
实战-2(上)入门版:基于Langchain+Faiss+Ollama+Gradio+Docker 从0到1实现RAG私有化部署 简易版实现 (10:04)
实战-2(下)进阶版:整合DeepSeek R1 、Ollama、FAISS、Gradio 和 Docker 搭建智能问答系统 (17:59)
实战-3:基于unsloth微调框架与LoRA以及CoT问答数据集 DeepSeek R1大模型微调与推理全流程实战 (20:17)
实战-5:原创项目 基于PyTorch QLoRA PEFT vLLM 实现R1蒸馏版大模型微调与部署 单卡/多卡两种方法 (17:24)
实战-5 原创项目 源码讲解与实现思路 (23:57)
大模型LLM与RAG研究利器 FlashRAG
FlashRAG 项目简介 (8:00)
FlashRAG 核心组件原理精讲 (15:56)
FlashRAG 案例实践 快速入门 Demo (22:11)
FlashRAG 核心模块参数详细解析 (19:30)
FlashRAG 项目实战 基于Transformers和BM25构建密集索引和稀疏索引 (18:24)
FlashRAG 项目实战 论文实验流程复现 (33:44)
FlashRAG 案例实战 核心源码Debug深度剖析 (41:04)
LoRA大模型微调 原理与实战
LoRA 算法原理深入解析-上集 (21:24)
LoRA 算法原理深入解析-下集 (15:35)
LoRA 案例演示 LoRA的核心逻辑 (10:07)
基于 PEFT 进行 Llama3 模型微调实战 (18:30)
基于 GPT-2 进行 LoRA 微调实战-上集 (14:07)
基于 GPT-2 进行 LoRA 微调实战-下集 (10:42)
LoRA 核心算法实现 (14:50)
在 VS Code 中 Debug LoRA 微调细节 (15:13)
QLoRA大模型微调 原理与实践
QLoRA 课程简介 (3:32)
QLoRA 算法原理 深入解析 (23:01)
QLoRA 算法原理 案例实践 (22:49)
大模型Llama 原理与实战
Meta重磅发布Llama 3.2:推动轻量级AI模型与多模态模型的全面应用 (17:58)
Llama3 模型简介 (11:08)
Llama3 环境配置 基于vLLM推理 (17:08)
torchrun 推理与特殊标记的应用 (9:55)
使用 llama.cpp 进行 Llama3 模型的量化和部署 (16:31)
使用 Docker 部署 Llama3 量化模型API服务 (17:14)
基于 Llama-factory 和自定义数据集进行模型微调 (22:24)
基于 TensorRT-LLM 和 Triton 进行 Llama3 模型部署 (40:14)
Teach online with
lagent 项目实战 案例二:fewshot 示例增强
Lesson content locked
If you're already enrolled,
you'll need to login
.
Enroll in Course to Unlock