大模型前沿技术免费公开课(持续更新)


围绕当下主流大模型技术栈的关键问题展开:从代表性工作与核心假设出发,提炼方法的设计动机、适用边界与可复用的实现路径,帮助你快速跟进前沿进展并形成可迁移的方法框架。
课程内容按照不同的项目或技术点进行划分,每一章节都是一个独立的专题,涵盖了大模型、RAG 检索增强生成、多模态应用、Agent 智能体等核心方向,你可以根据自己的兴趣和学习需求自由选择章节进行学习。
课程配套资料已同步整理至对应的课程视频下方,点击下方按钮即刻开始学习。

本课程围绕通义实验室提出的 AgentEvolver 自进化 Agent 系统展开,带你系统理解 LLM Agent 如何在缺少高质量任务数据的冷启动环境中,自主生成任务、提升探索效率,并在长序列工具调用中实现细粒度信用分配的完整方法论。帮助你掌握从“任务构建→轨迹生成→奖励归因→策略迭代”的可复用范式,最终具备搭建高效、可持续演进的 Agent 系统的能力。


这门课程带你系统掌握 Agent Lightning 的核心思想:在几乎零代码改动的前提下,把任意现有 AgentLangChain / AutoGen / CrewAI 等)“接入”强化学习优化管线。你将深入 LightningRL 的关键设计:通过简洁有效的信用分配与问题分解,把多轮次、多工具调用的 Agent 优化转化为可直接套用 PPO / GRPO 等算法的训练样本。


本课程是一份面向实战的 GLM-TTS 全流程上手与进阶指南。GLM-TTS 的核心能力——3–10 秒提示音频的零样本语音克隆、流式推理的实时生成、以及通过 Phoneme-in 音素级控制解决多音字/生僻字发音歧义等关键问题;以及“两阶段级联架构(LLM 生成语音 Token + Flow /声码器还原音频)”与 GRPO 多奖励强化学习增强情感与韵律的设计思路。


本课程将带你深入理解蚂蚁 inclusionAI 团队打造的企业级多智能体框架 AWorld:它不仅支持 Workflow / Team / Handoff 等多 Agent 协作范式,还提供从运行时编排、MCP 工具标准化集成、记忆与上下文管理、可观测性到强化学习训练闭环(GRPO / PPO 等)的完整工程体系,面向高并发与云原生部署,适合将复杂任务自动化从“原型”真正推向“生产级系统”。


本课程将系统拆解 Kimi K2 & K2 Thinking 的完整技术路线:从 1TMoE 架构(384 专家、单 token 激活 32B)、256k 长上下文与 MLA 注意力的工程权衡,到预训练阶段为解决稳定性提出的 MuonClip / QK-Clip,以及后训练阶段“思考→行动→再思考”的 Agentic 训练范式(大规模工具数据合成 + RLVR + 自评 Rubric 奖励)。


本课程将带你从原理到落地完整掌握 DeepSeek-OCR:你会先理解其“把长文本渲染成图像,用视觉 token 做光学压缩”的核心思路,以及 DeepEncoder + DeepSeek-3B-MoE 解码器的端到端架构与多分辨率/动态分辨率策略,理解为什么能用更少的 token 取得高质量 OCR 效果。 课程会手把手实战:单图/批量 PDF OCR、结构化输出 Markdown、生成检测框可视化结果,并基于 vLLM + FastAPI完成服务化部署与并发参数调优,让你把 DeepSeek-OCR 直接接入生产业务。


本课程深入拆解 ThinkMorph 的多模态交错推理 Interleaved Reasoning 范式:让模型在同一次思考链中交替进行“文本推理 ↔ 视觉操作”,从而获得更强的复杂视觉推理与可解释性。你将系统理解其交错轨迹数据构建思路、训练/推理流程设计,以及论文中总结的关键能力涌现,并掌握将该范式迁移到你自己的多模态 Agent 与视觉推理任务中的方法。


本课程将带你系统掌握 UltraRAG 2.0 的核心价值:它以 MCP 为底座,把检索、生成、路由、评测等能力封装成标准化 MCP Server,再用 YAML 声明式 Pipeline 完成多轮推理、动态检索、loop/branch 条件控制的快速编排,让科研级 RAG 实验从“重工程实现”变成“可配置复现”。你将学会如何在统一评测体系下快速对比 17+ benchmark与多种 SOTA 基线,并掌握热插拔式扩展与工程化落地思路,把复杂 RAG 系统的迭代效率显著拉满。


本课程聚焦 VRAG-RL:面向图表、表格、复杂版式等“富视觉文档”的检索问答场景,系统讲清楚如何用 “思考-动作-观察” 的迭代推理范式,把“搜索 + 视觉感知动作”纳入统一动作空间,并通过 GRPO 强化学习 + 细粒度奖励设计同时优化检索效率与答案质量。 同时配套完整落地实战:从视觉搜索引擎、VLM 推理服务到 Web DemoStreamlit / FastAPI、vLLM 等)快速跑通与一键部署,让你真正具备构建可用、可训练、可迭代的视觉 RAG 系统能力。


本课程将带你从“平台原理”到“落地实战”系统掌握 Dify 大模型应用开发平台:不仅讲清楚它为何能用可视化工作流把复杂 AI 业务流程、RAG 知识库、Agent 工具调用、多模型管理与 LLMOps 监控统一到一套架构中,帮你快速搭建可上线的 LLM 应用;还会手把手带你完成 本地/服务器部署、关键环境变量配置、模型接入(含本地 Ollama)、以及从创建应用到知识库构建与调用的全流程跑通,真正做到“会用、会改、能交付”。


本课程将带你深入理解并上手实践 Soft Thinking 这一 training-free 推理范式:不再在每一步“硬选”单个离散 token,而是保留完整概率分布作为 concept token,在连续概念空间中推进推理,并通过基于熵的 Cold Stop 机制在模型“足够自信”时提前收束,从而在提升准确率的同时显著降低推理冗余与 token 成本。本课程还配套可直接运行的对比 Demo,量化展示 Soft Thinking 相比标准 CoT 在时间、token、回答长度等维度的收益,帮助你把该方法真正迁移到自己的推理任务与工程系统中。



本课程将系统讲透 Qwen3 Embedding / Qwen3 Reranker 这一代检索基础模型的“论文原理 + 工程落地 + 微调实战”全链路:从基于 Qwen3 基座构建的嵌入/重排架构、指令感知与 MRL 可变维度等关键特性出发,深入拆解其多阶段训练范式,并结合 MMTEB / MTEB 等基准结果理解其性能优势与适用场景。

同时课程配套可直接复现的实战教程:使用 Transformers / vLLM 完成推理接入与指令模板构造,并基于 ms-swift 完成 Embedding 的全参/LoRA 微调与权重合并,最后进一步上手 Qwen3-RerankerLoRA-SFT + DeepSpeed 训练流程,帮你把检索召回与重排序能力真正打磨到可用于 RAG/Agent 生产系统的水平。


本课程以“原理 + 可复现案例”的方式系统讲透 Agentic RAG:从传统 RAG 的局限与三段式机制(检索-增强-生成)出发,深入理解 Agentic RAG 如何引入 规划、反思、记忆与工具调用,实现多轮检索-推理-评估-再检索的闭环,从而显著降低幻觉、提升复杂任务处理能力。 同时配套原创项目 Qwen Agentic RAG 智能问答系统,带你用本地 Qwen3 + FAISS + Streamlit 跑通“文档问答(RAG)+ 普通对话 + 天气工具”三种模式,并掌握可扩展的工程结构与落地方法,让你真正具备搭建可上线 Agentic RAG 应用的能力。


本课程聚焦 RLTReinforcement Learning Teachers)这一前沿“教师-学生”强化学习范式:不再让模型从零解题,而是训练一个能基于已知正确答案生成高质量、可教学的推理解释的教师模型,通过 SFT 预热 + GRPO 强化学习的两阶段管线稳定提升推理轨迹质量,实现 Test-Time Scaling(推理时投入更多计算换取更强答案)。 同时配套完整项目实战,从环境与数据准备、训练配置(Hydra / DeepSpeed / vLLM)、到奖励函数与 KL 约束的核心实现、推理服务测试一条龙跑通,让你具备复现并落地“可训练的推理教师模型”能力。



本课程将系统讲透 MCPModel Context Protocol,模型上下文协议)的核心方法论与工程落地:你会先理解 MCP 作为 Anthropic 推出的开放协议,如何用“客户端-服务器”标准通信层,把大模型与外部工具/数据源连接起来,解决数据孤岛、集成低效与生态碎片化问题,实现类似“插 USB”般的即插即用体验。 再通过配套实战 Demo(待办事项 MCP Server),你将亲手跑通 Tools / Resources / Prompts 三类能力的实现与调用流程,掌握从开发调试(MCP Inspector)到 Claude Desktop 配置接入的完整链路,真正具备在自己的 Agent/RAG 系统中快速扩展外部能力的工程能力。 



本课程围绕 OpenAI Agents SDK 展开,从“如何用一个轻量但功能完整的框架搭建多智能体工作流”入手,系统讲清 多智能体协作、工具调用、安全护栏与全流程追踪/诊断等关键能力,并拆解其分层架构,帮助你建立可扩展的 Agent 工程化认知。同时配套实战案例:如基于高德天气 API + Ollama 本地模型的天气查询助手,以及使用 Agents SDK + Playwright 实现“规划-搜索-撰写”的多代理研究助手,覆盖从工具接入到多代理协作的完整链路。此外还会梳理常用代理模式(确定性流程、交接路由、代理作为工具、LLM 评判、并行化与护栏),让你能按场景快速选型与落地。



本课程将带你系统上手并深度理解开源 Agent 框架 Lagent:它借鉴 PyTorch 的“模块/层”式抽象,把 Agent 开发拆成清晰的消息结构与功能层组合,让你用更 Pythonic 的方式快速搭建从单体到多智能体协作的复杂应用。课程会先建立 Agent 的核心认知,再深入 Lagent 的关键设计(统一通信结构 AgentMessage、“模型即智能体”“记忆即状态”、同步/异步接口、多会话隔离等)以及 agents/actions/llms/memory/hooks/distributed 等核心模块,并通过一系列可复现案例(基础对话、few-shot 聚合器、Agent 控制代码执行、高德天气/导航 API 集成、异步博客生成等)实现“会用、会改、能扩展、可上线”的完整能力闭环。


本课程将以 FlashRAG 为核心框架,带你从零搭建一套“可复现、可评测、可扩展”的 RAG 实验与工程流水线:从环境配置与模型/数据集准备开始,快速跑通标准 RAG PipelineWeb 端交互 DemoStreamlit),再深入拆解 FlashRAG 的核心模块(检索器/生成器/重排序器/Refiner/Config 与多种 Pipeline 形态),掌握 BM25 与稠密检索、索引构建(Faiss / Lucene)、缓存与评测指标等关键工程细节;最后复现多篇经典 RAG 论文方法的实验流程,并进入核心源码调试与二次开发,让你真正具备用 FlashRAG 高效迭代 RAG/Agentic RAG 系统的能力。



本课程将以微软提出的 LoRALow-Rank Adaptation)为主线,带你从“为什么需要参数高效微调”出发,深入拆解 LoRA 的低秩分解原理(冻结预训练权重、仅训练低秩矩阵 A/B)、初始化与秩选择逻辑,以及在 TransformerQ/K/V/O 等关键矩阵上为何有效、应优先适配哪些层。随后通过配套 Notebook 实战,手把手跑通从环境配置、数据与预训练权重下载、LoRA 训练(含关键超参如 lora_dim/lora_alpha/dropout)、推理解码到指标评测与踩坑排错的完整链路,让你真正具备在有限算力下高质量微调大模型并完成部署交付的能力。


课程目录

  大模型公开课(持续更新)
Available in days
days after you enroll
  阿里 AgentEvolver
Available in days
days after you enroll
  AWorld 多智能体框架
Available in days
days after you enroll
  微软Agent Lightning 理论与实战
Available in days
days after you enroll
  前沿论文与最新技术趋势洞察
Available in days
days after you enroll
  DeepSeek-OCR 算法解析与部署实战
Available in days
days after you enroll
  DeepSeek 大模型实战
Available in days
days after you enroll
  Dify 大模型应用平台
Available in days
days after you enroll
  阿里多模态VRAG-RL 原理与实战
Available in days
days after you enroll
  清华UltraRAG 原理与实战
Available in days
days after you enroll
  RLT 教师强化学习 理论与实战
Available in days
days after you enroll
  Qwen3 Embedding 原理与实战
Available in days
days after you enroll
  Agentic RAG 原理与实战
Available in days
days after you enroll
  MCP 模型上下文协议 多场景应用实战
Available in days
days after you enroll
  OpenAI Agents 多智能体框架
Available in days
days after you enroll
  AI Agent LLM智能体轻量级开发框架 lagent 项目
Available in days
days after you enroll
  大模型LLM与RAG研究利器 FlashRAG
Available in days
days after you enroll
  LoRA大模型微调 原理与实战
Available in days
days after you enroll
  QLoRA大模型微调 原理与实践
Available in days
days after you enroll
  大模型Llama 原理与实战
Available in days
days after you enroll


解锁完整的大模型学习路径


如果你想系统性地构建大模型知识体系、并深入掌握其核心技术,推荐你学习我的精品课程。我的精品课程专为 AI 技术领域的专业人才设计,所有内容都是我经过反复实践、反复打磨,最终呈现给大家的。无论你是 AI 技术从业者、还是毕业后打算从事 AI 技术行业的学生,我强烈推荐你学习我的精品课程,与前沿技术接轨,这将拓宽你的 AI 技术之路。
与免费公开课相比,精品课程不仅在内容体系和知识深度方面更具优势、更能满足 AI 从业者进行系统专业的进阶学习,同时课程内容结合了实际应用场景和案例分析,通过理论与实践相结合,帮助大家全面高效的掌握相关知识。
所有课程终身有效,你可以跟随我的课程终身学习,欢迎你的加入。


一套系统化、生产级的 DeepSeek 大模型深度指南。


多模态大模型前沿算法及其应用,最新的研究成果与技术发展趋势。


大语言模型 LLM 和检索增强生成 RAG

理论与实战。


如果你在学习或购买课程的过程中遇到问题,请通过以下方式联系课程助理:

🔗 点此通过Discord 获取支持

💬 点此通过微信获取支持

常见问题


一、支持的付款方式有哪些?

本网站支持以下付款方式:

  • PayPal 付款
  • 双币种或全币种的信用卡付款
  • 通过淘宝店铺微信小店付款(淘宝与微信仅作为支付通道,课程仍在本网站学习)。

请参考《付款指南》,选择适合你的付款方式。

在淘宝店铺或微信小店支付后,请发送订单号和用于注册学习账号的邮箱到我的公众号、或通过微信Discord 联系课程助理,我们将尽快处理你的订单并邀请你加入对应课程。(你可以提前注册账号,只需确保提供给我的邮箱与注册邮箱一致即可。点此查看《注册登陆指引》

二、课程是否提供一对一指导?

本课程的定价仅包含:

  • 全部课程视频的终身观看权限
  • 配套资料的完整下载与后续更新

课程不包含一对一指导服务。但在时间允许的情况下,我会尽力为大家进行课程相关的问题的解答,帮助大家顺利学习。

精品课程内容经过反复打磨与完善,并配有详尽的资料,确保你高效掌握相关知识。目前已通过数百名同学的真实学习反馈,获得高度好评。

如果你在学习过程中有任何疑问,欢迎你:

  • 参与精品课程后,根据课程前面的提示,加入 Discord 或微信群,在群内提问
  • 在对应课程视频下方评论区留言提问;
  • 登录网站后,点击右上角头像 → 选择 Contact给我发送邮件。


三、与在B站学习有什么区别?

精品课程在本网站与B站课堂同步上线,课程内容本身完全一致,区别主要体现在以下几个方面:

1.功能与课程资料呈现方式不同:

官网课程资料与视频内容同步展示,可在对应章节中预览并下载使用。B站以视频播放为主,请购买后通过私信发送订单号(查看路径:B站右上角“信箱”→消息列表中课堂对话窗中的订单号),以便获取对应课程资料并邀请你加入我的AI学习圈。

2.发票开具说明:

本网站直接购买:将会自动收到一封收据邮件,请在你的注册邮箱中查看。

通过淘宝/微信小店支付:如需发票请直接联系在线客服即可开具。

B站购买:订单由B站平台统一管理,如需开具发票,请在B站后台订单中申请,或联系B站客服了解详细流程。

⚠️温馨提示(适用于 iOS 用户)

如果你使用 iPhoneiPad 访问 B站并购买课程,建议使用电脑端或手机浏览器访问我的B站课堂完成课程购买,避免额外支付 iOS 端加收的30%渠道费用。

四、什么时候购买最优惠?

答案是——如果你已经决定开始学习,现在就是最合适的时机。

精品课程一次购买,终身有效。除了偶尔的粉丝回馈活动,精品课程不会参与任何限时折扣或平台促销,价格始终保持公开透明。如果未来课程内容有更新和迭代,价格也会随之逐步上调。

我希望大家把有限的时间和精力花在真正有价值的学习上,而不是计算“活动价”上;我希望大家购买课程,不是因为打折,而是因为它真的能让你成长、进步、变得更强。

如果你做过对比,能够透过花哨的宣传看清楚知识的本质,你应该会知道我的精品课程的性价比。你甚至可以通过学习我分享的免费公开课,就可以学到很多在其他地方需要付费才能学到的知识。

五、我是转行过来的,听说大模型很火,学完这个课程能不能直接上手?

实事求是的说,我并不建议你直接学习我的课程。我的精品课程专为 AI 技术领域的专业人才设计,课程内容紧随前沿技术,具有一定深度,并不是仅凭一步步跟随操作就能学会的简单教学。非科班出身或转行学习者可能会感到吃力。如果你决心深入学习AI技术,我真诚的建议你花一些时间,好好梳理一下,将一些相关的基础知识先理解和掌握。只有打好基础,一步步积累,才能真正与前沿技术接轨。

六、我可以每天问很多很多的问题吗?

我非常欢迎大家积极的学习和提问,但一定要问有价值的问题。对于那些通过AI或搜索引擎即可找到答案的问题,以及可以在B站或 YouTube 等平台免费学习的基础知识,我建议你主动学习和理解,这比直接提问更为高效主动解决问题是 AI 技术学习者的基本能力,要尽快摸索出一套适合自己的高效学习方法,这样你才能在技术这条路上越走越远。


七、听说课程永久有效、后续还会进行更新,什么时候会更新?

作为一个终身学习的技术人,所有精品课程都会随着技术的发展以及我个人的技术积累为大家适时进行更新。由于时间精力有限,我会根据技术发展的成熟度以及个人工作安排来进行更新。大家可以关注网站课程页面,以及公众号、B站动态、YouTube 动态、邮箱推送等官方账号通知。