更新时间:2025-02-10 15:45:04
封面
版权信息
内容简介
前言
第1章 大模型概述
1.1 大模型的概念
1.2 大模型的应用现状
1.2.1 国外的大模型
1.2.2 国内的大模型
1.2.3 大模型的应用情况
1.3 大模型存在的问题
1.3.1 机器幻觉
1.3.2 安全伦理
1.3.3 选择错误目标
1.3.4 难以监督
1.4 大模型的发展趋势
1.4.1 多模态能力
1.4.2 AI Agent
1.4.3 端侧应用
1.4.4 可信任性及可解释性
1.4.5 自我学习
1.5 本章小结
第2章 大模型核心技术
2.1 大模型构建流程
2.1.1 预训练语言模型
2.1.2 模型微调
2.1.3 对齐优化
2.2 Transformer模型
2.2.1 Transformer模型概述
2.2.2 编码器与解码器
2.2.3 注意力机制
2.2.4 词向量
2.2.5 位置编码
2.2.6 规范化
2.2.7 激活函数
2.2.8 优化器
2.2.9 基于Transformer的大模型架构选择
2.3 模型微调
2.3.1 指令微调数据集
2.3.2 调优策略
2.4 对齐优化
2.4.1 反馈
2.4.2 偏好模型
2.4.3 RLHF
2.5 提示工程
2.5.1 提示工程开发流程
2.5.2 提示设计开发
2.6 本章小结
第3章 大模型技术拓展
3.1 推理优化技术
3.1.1 解码优化算法
3.1.2 推理加速策略
3.2 大模型训练技术
3.2.1 并行训练
3.2.2 训练容错
3.2.3 混合精度训练
3.3 大模型评估
3.3.1 大模型评估概述
3.3.2 大模型评估任务
3.3.3 大模型评估数据集
3.3.4 大模型评估方法
3.4 大模型部署
3.4.1 模型环境搭建
3.4.2 模型运行测试
3.5 本章小结
第4章 插件应用开发实践
4.1 应用概述
4.1.1 ChatGPT插件
4.1.2 LangChain插件
4.1.3 通用插件调用流程
4.2 天气查询插件开发
4.2.1 基于ChatGPT的插件开发
4.2.2 基于AutoGen的插件开发
4.3 语音交互插件开发
4.4 本章小结
第5章 RAG实践
5.1 应用概述
5.2 RAG流程
5.3 环境构建
5.4 应用实践
5.4.1 知识解析
5.4.2 检索
5.4.3 增强
5.4.4 生成
5.5 本章小结
第6章 智能客服问答实践
6.1 应用概述
6.2 环境构建
6.2.1 开发环境搭建
6.2.2 开源模型下载
6.3 应用开发
6.3.1 实现多轮对话系统
6.3.2 提示优化
6.3.3 第三方工具调用
6.4 应用部署
6.5 本章小结
第7章 学科知识问答实践
7.1 应用概述
7.2 环境构建
7.2.1 开发环境搭建