Featured Premium Course
如果你正在关注大模型 Agent、强化学习后训练、RLHF、DPO、GRPO、RLVR 等前沿方向,欢迎学习我最新上线的精品课程:《大模型 Agent 强化学习实战》从奖励设计、信用分配到训练系统,全面掌握工业级 Agent RL 的判断与落地方法。
Agent RL 是当前大模型技术中非常关键的一条方向。它变化快、论文多、项目多,但也正因为如此,学习者更需要一套系统的学习框架。这门课程围绕当前大模型 Agent 强化学习的核心技术路线展开,旨在帮助学习者少走弯路,建立完整框架,跟上大模型后训练与 Agent RL 的前沿发展。
More Premium Courses
在过去 10 多年里,我持续专注于 AI 前沿技术的学习、研究与课程体系建设。从 LLM 算法原理、模型微调与部署、RAG 产品化落地、AI Agent、多模态大模型、强化学习,到 Agent Harness 系统工程,我始终关注的不只是技术本身,而是如何把复杂、分散、快速变化的前沿知识,沉淀为一条真正清晰、系统、可持续的学习路径。
如果你希望不只是会用 AI 工具,而是能够理解底层原理、写出关键代码、并具备将技术落地到真实项目中的能力,那么下面这些精品课程,将帮助你更高效、更扎实地进入前沿 AI 技术体系,并逐步建立属于自己的长期技术竞争力。
———————————————————————————————————————————————————
DeepSeek 大模型
系统实战
如果你希望系统掌握大模型核心技术、以及 Agent 应用开发,推荐你学习《AI 大模型系统实战:架构·算法·工程·应用(DeepSeek 专题)》这门精品课程。
这是一套从模型微调、部署,到强化学习训练的系统学习路线,课程以企业级落地为目标,你将掌握 LLM 核心原理、Agentic RAG、MoE / MLA / MTP 机制拆解、PPO / GRPO 强化学习与工业级 DeepSeek-OCR 多模态实战等,想系统掌握并落地这些能力,就从这门课开始。
———————————————————————————————————————————————————
多模态大模型
前沿算法与实战应用
(图文与视频理解)
如果你想系统学习多模态大模型相关技术,推荐你学习这门精品课程:《多模态大模型 前沿算法与实战应用》
课程覆盖通用/领域多模态架构、多模态数据范式、训练流程、评估与幻觉分析,并配套多项目实战:LLaVA、LLaVA-NeXT、Qwen2/3-VL、InternLM-XComposer(IXC)、TimeSearch-R等,包含算法讲解、服务部署、核心源码解析。本课程近期正在更新中,欢迎加入学习。
———————————————————————————————————————————————————