课程目录:
├── [2]-第二课:柏拉图表征假说与scaling law:KM缩放定律.mp4
├── [1]-第一课:人工智能介绍:迭代路径,大模型进化树,技术分类.mp4
├── [3]-第三课:AI开发环境(python、conda、vscode.mp4
├── [36]-第十课:Langgraph项目原理与实战_ev.mp4
├── [27]-第一课:Agent原理简介:planning、memory、_ev.mp4
├── [46]-第六课:LightRAG(二):示例代码,参数解读,grap_ev.mp4
├── [18]-第十课:Rerank技术原理与实践(一)交叉编码与双编码_ev.mp4
├── [43]-第三课:GraphRAG(二):索引原理,Leiden算法,_ev.mp4
├── [26]-第十八课:RAG行业落地:实践心得,落地经验,业务场景_ev.mp4
├── [24]-第十六课:向量数据库代码示例:chroma与qdrant代码_ev.mp4
├── [41]-第一课:知识图谱:RDF,RDFS,OWL,知识图谱架构,实_ev.mp4
├── [9]-第一课:RAG技术原理与RAGFlow项目实操_ev.mp4
├── [34]-第八课:Agent框架:Single Agent,Multi_ev.mp4
├── [19]-第十一课:Rerank模型微调与实践(二)rankGPT_ev.mp4
├── [21]-第十三课:相似性搜索算法:k-means,肘部法则_ev.mp4
├── [5]-第二课:微调数据集准备(SFT,继续预训练,偏好优化)_ev.mp4
├── [25]-第十七课:RAG评估:评估指标,RAGAs,TruLens_ev.mp4
├── [44]-第四课:GraphRAG(三):全局查询,局部查询,drif_ev.mp4
├── [47]-第七课:LightRAG(三):Neo4j使用,API Se_ev.mp4
├── [4]-第一课:大模型微调llama-factory环境准备_ev.mp4
├── [7]-第四课:模型评估(批量推理与自动评估benchmark)_ev.mp4
├── [33]-第七课:Agent设计模式(三):Reflexion,LAT_ev.mp4
├── [12]-第四课:高级RAG(二)提示词压缩,融合,llamainde_ev.mp4
├── [39]-第十三课:AutoGen项目原理与实战(二):代码执行,工具_ev.mp4
├── [17]-第九课:Embedding模型评估:MRR评测,MTEB评测_ev.mp4
├── [37]-第十一课:Langgraph 多Agent架构:协作多Age_ev.mp4
├── [13]-第五课:模块化RAG(一)顺序模式,条件模式,分支模式_ev.mp4
├── [20]-第十二课:向量数据库简介与相似性测量:欧式距离,余弦相似度_ev.mp4
├── [8]-第五课:模型部署(模型合并导出与量化,本地部署)_ev.mp4
├── [42]-第二课:GraphRAG(一):原理,部署使用,GraphR_ev.mp4
├── [40]-第十四课:CrewAI项目原理与实战:Crew,Task,A_ev.mp4
├── [38]-第十二课:AutoGen项目原理与实战(一):AutoGen_ev.mp4
├── [15]-第七课:Embedding原理:word2vec、CBOW_ev.mp4
├── [10]-第二课:Naive RAG与langchain实践_ev.mp4
├── [28]-第二课:提示词工程:软提示词,fewshot,COT,TOT_ev.mp4
├── [22]-第十四课:近似邻近算法与过滤向量:PQ量化,HNSW,LSH_ev.mp4
├── [30]-第四课:Agent工具使用与function call:MR_ev.mp4
├── [11]-第三课:高级RAG(一)层次索引,句子窗口,子查询,HyDE_ev.mp4
├── [29]-第三课:Agent平台:国内外主流平台,Coze搭建智能客服_ev.mp4
├── [6]-第三课:微调过程lora微调与Qlora微调_ev.mp4
├── [14]-第六课:模块化RAG(二)迭代,递归检索,FLARE,Toc_ev.mp4
├── [16]-第八课:Embedding模型训练:llamaindex微调_ev.mp4
├── [31]-第五课:Agent设计模式(一):Fewshot,ReAct_ev.mp4
├── [32]-第六课:Agent设计模式(二):REWOO,LLMComp_ev.mp4
大模型训练那些绕不开的坎儿
环境配置绝对是个磨人的活儿你得搞定python版本管理conda虚拟环境还得在vscode里调试脚本光是配环境就能卡住三天别问我怎么知道的;数据预处理阶段更头疼SFT数据集清洗偏好对齐标注规则制定全是体力活;lora微调参数调优简直玄学batch size和learning rate的组合能试到你怀疑人生;最后模型评估环节跑通benchmark测试集指标达标才算松口气。
RAG技术实战里的门道
Naive RAG实现起来简单粗暴但召回效果经常翻车query扩展策略没设计好返回结果就跑偏;向量数据库选型够纠结chroma轻量qdrant性能强具体业务场景得反复压测;embedding模型微调时MRR指标波动太大loss曲线忽上忽下看得人心惊肉跳;rerank环节用rankGPT优化排序结果那个阈值设定简直像在走钢丝;GraphRAG索引构建过程更复杂社区发现算法参数调整搞了整晚Leiden算法运行结果突然报错日志排查到凌晨三点。
Agent系统设计的魔鬼细节
单Agent任务拆解容易出问题planning模块逻辑混乱导致动作序列卡死;多Agent协作架构设计时消息路由机制没处理好智能体之间开始踢皮球;function call调用外部API遇到权限验证失败调试时候才发现传参格式多了个空格;Reflexion模式实现自我修正循环写了五版代码还是陷入死循环;LAT架构里的状态机转换漏了个边界条件测试用例跑出个诡异bug。
知识图谱融合实际部署踩的坑更多RDF三元组映射出错实体链接全部失效;GraphRAG全局查询响应超时分析半天发现是neo4j内存溢出;lightRAG的graphene参数调优文档写得模棱两可实验了二十多次才找到最佳组合;线上服务流量突增时候API Server并发锁机制失效用户请求堵成狗。
落地交付时的真实战场
客户给的业务数据脱敏不彻底训练时冒出堆隐私字段法务部门直接红牌警告;私有化部署遇到飞腾芯片兼容性问题arm架构编译whl包缺依赖项;知识库增量更新方案设计失误全量重建索引花了八小时业务停摆被投诉;Agent对话流程有个边缘场景没覆盖到用户连续发三个问号系统就崩溃了。
监控系统告警半夜响起生产环境显存泄漏docker容器自动重启七次;压力测试时发现langgraph消息队列积压线程阻塞把kafka挤爆了;truLens评估报告显示召回率骤降查出来是embedding模型版本被误覆盖;客户验收演示当天GPU集群突然掉电备用电源切换延迟了那九十秒像过了整个世纪。
评论0