Featured Premium Course
大模型 Agent 强化学习实战
如果你正在关注大模型 Agent、强化学习后训练、RLHF、DPO、GRPO、RLVR 等前沿方向,欢迎学习我最新上线的精品课程:《大模型 Agent 强化学习实战》从奖励设计、信用分配到训练系统,全面掌握工业级 Agent RL 的判断与落地方法。
Agent RL 是当前大模型技术中非常关键的一条方向。它变化快、论文多、项目多,但也正因为如此,学习者更需要一套系统的学习框架。这门课程贯穿了当前大模型 Agent 强化学习的核心技术路线,围绕 Agent 架构、强化学习基础、Reward 设计、策略优化、工具调用、多轮任务执行、Agentic Workflow 以及前沿论文与实战案例展开,旨在帮助学习者少走弯路,建立完整框架,跟上大模型后训练与 Agent RL 的前沿发展。
More Premium Courses
在过去 10 多年里,我持续专注于 AI 前沿技术的学习、研究与课程体系建设。从 LLM 算法原理、模型微调与部署、RAG 产品化落地、AI Agent、多模态大模型、强化学习,到 Agent Harness 系统工程,我始终关注的不只是技术本身,而是如何把复杂、分散、快速变化的前沿知识,沉淀为一条真正清晰、系统、可持续的学习路径。
如果你希望不只是会用 AI 工具,而是能够理解底层原理、写出关键代码、并具备将技术落地到真实项目中的能力,那么下面这些精品课程,将帮助你更高效、更扎实地进入前沿 AI 技术体系,并逐步建立属于自己的长期技术竞争力。
———————————————————————————————————————————————————
DeepSeek 大模型
系统实战
如果你希望系统学习大模型,DeepSeek 是一个非常值得深入研究的技术样本。它不仅代表了当前推理模型、MoE 架构、MLA 注意力机制、GRPO 强化学习等方向的重要进展,也为我们理解大模型的训练、推理、部署和工程优化提供了一条非常清晰的学习主线。
《AI 大模型系统实战:架构·算法·工程·应用(DeepSeek 专题)》这门精品课程会从模型部署、微调、Agentic RAG,一直讲到 MLA、MoE、MTP、PPO、GRPO 和 DeepSeek-OCR 项目实战,帮助你真正建立大模型系统能力。
———————————————————————————————————————————————————
多模态大模型
前沿算法与实战应用
(图文与视频理解)
如果你想系统学习多模态大模型相关技术,推荐你学习这门精品课程:《多模态大模型 前沿算法与实战应用》
课程覆盖通用/领域多模态架构、多模态数据范式、训练流程、评估与幻觉分析,并配套多项目实战:LLaVA、LLaVA-NeXT、Qwen2/3-VL、InternLM-XComposer(IXC)、TimeSearch-R等,包含算法讲解、服务部署、核心源码解析。本课程近期正在更新中,欢迎加入学习。
———————————————————————————————————————————————————