更新时间:2025-06-26 18:01:15
封面
版权页
O'Reilly Media,Inc.介绍
本书赞誉
译者序
序
前言
第1章 引言
1.1 机器学习的生命周期
1.2 循环中的教训
第2章 数据管理原则
2.1 数据即责任
2.2 机器学习管道的数据敏感性
2.3 数据的阶段
2.4 数据可靠性
2.5 数据完整性
2.6 总结
第3章 模型的基本介绍
3.1 什么是模型
3.2 基本的模型创建工作流
3.3 模型架构、模型定义与训练过的模型
3.4 漏洞在哪里
3.5 基础设施及管道
3.6 对任何模型提出的一系列实用问题
3.7 一个机器学习系统示例
3.8 总结
第4章 特征与训练数据
4.1 特征
4.2 标签
4.3 人工生成的标签
4.4 元数据
4.5 数据隐私和公平性
4.6 总结
第5章 评估模型的有效性和质量
5.1 评估模型的有效性
5.2 评估模型质量
5.3 实施验证和评估
5.4 总结
第6章 机器学习系统中的公平性、隐私和道德
6.1 公平性
6.2 隐私
6.3 负责任的AI
6.4 机器学习管道中负责任的AI
6.5 总结
第7章 训练系统
7.1 需求
7.2 基本训练系统的实施
7.3 一般可靠性原则
7.4 常见的训练可靠性问题
7.5 结构可靠性
7.6 总结
第8章 服务
8.1 模型服务的关键问题
8.2 模型服务架构
8.3 模型API设计
8.4 服务于准确性还是弹性
8.5 扩展
8.6 灾难恢复
8.7 道德和公平性考虑
8.8 总结
第9章 模型的监控和可观测性
9.1 什么是生产环境监控以及为什么要这么做
9.2 机器学习生产监控中的问题
9.3 机器学习模型监控的最佳实践
9.4 总结
第10章 持续机器学习
10.1 剖析持续机器学习系统
10.2 对持续机器学习系统的观察
10.3 持续性组织
10.4 重新思考非持续机器学习系统
10.5 总结
第11章 事故响应
11.1 事故管理基础
11.2 剖析以机器学习为中心的故障
11.3 术语提醒:模型
11.4 故事时间
11.5 机器学习事故管理原则
11.6 特殊话题
11.7 总结
第12章 产品和机器学习如何交互
12.1 不同类型的产品
12.2 敏捷机器学习
12.3 机器学习产品开发阶段
12.4 构建还是购买
12.5 由机器学习提供支持的样例YarnIt商店功能
12.6 总结
第13章 将机器学习集成到你的组织中
13.1 本章假设
13.2 重大组织风险
13.3 实施模型
13.4 组织设计和激励
13.5 总结
第14章 实用的机器学习组织实施示例
14.1 场景1:一个新的集中式机器学习团队
14.2 场景2:分散式机器学习基础设施和专业知识
14.3 场景3:混合使用集中式基础设施/分散式建模
14.4 总结
第15章 案例研究:实践中的MLOps
15.1 在机器学习管道中适应隐私和数据保留政策
15.2 影响流量的持续机器学习模型