课程简介
课程分为模型架构与工程应用两大模块:模型部分深入解析 Llama2 架构设计(包括 RMSNorm、ROPE 位置编码等),手把手实现 LoRA/QLoRA 高效微调、PTuning 方法及幻觉处理;工程部分涵盖 DeepSpeed 分布式训练、ChatGLM3 全量微调、Int8/NF4 量化等优化技术,并延伸至 Prompt 工程、Function Calling 开发等应用实践。
通过股票分析等实战项目,学员可掌握从模型研发到产品落地的完整能力链,特别适合希望深入理解大模型底层原理并具备工业级开发能力的技术人员。
课程提供完整代码实现和优化文档,强调 "手写实现" 以加深理解。
课程下载
正文完