新書推薦:

《
汗青堂丛书148 波斯人:万王之王的时代
》
售價:HK$
107.8

《
西域四百年2:割据与融合(“西域四百年”系列重磅之作!)
》
售價:HK$
75.9

《
明代郎署官与文学权力
》
售價:HK$
107.8

《
人工智能与影视制作(影视制作全流程AI实战指南,深度结合DeepSeek等AI工具实操)
》
售價:HK$
97.9

《
俗得可爱 吃得痛快:蔡澜日记随笔精选
》
售價:HK$
53.9

《
十一种孤独(理查德·耶茨作品)
》
售價:HK$
85.8

《
玫瑰花园
》
售價:HK$
54.8

《
智能体时代
》
售價:HK$
86.9
|
編輯推薦: |
4大核心内容全覆盖本书全面涵盖AI训练师的4大核心知识点,内容包括“数据标注+分析整理+算法优化+模型训练”,从入门到精通,步步为营,助你轻松掌握AI训练的全流程。4大实战案例解析风光摄影模型+人物画风模型+AI助手模型+AI文本生成模型训练实战,助你轻松掌握Stable Diffusion(AI绘画)、ChatGPT(AI文案)等主流大模型的训练技巧,实现理论与实践的无缝对接。92集同步教学视频为了让你的学习之路更加轻松便捷,本书特别赠送了92集同步教学视频,手机扫码即可观看,让你随时随地都能跟随专家学习,深入理解每一个知识点,快速掌握AI训练师的核心技能。
|
內容簡介: |
想要成为AI训练师,掌握AI模型训练的核心技能,需要了解哪些关键要素?如何有效地进行数据标注和预处理?怎样选择合适的AI算法和模型架构?又如何进行模型的训练、调优和评估?本书为以上问题提供了一站式的解决方案。作者结合丰富的实战经验,系统讲解了AI训练师的核心工作内容和技能需求,并通过深入剖析和详细讲解,让读者能够全面了解并掌握AI训练的关键知识点。除了理论知识,本书还提供了丰富的实战资源,包括160分钟的教学视频、120页的PPT教学课件、70多个素材效果文件,以及40多组AI提示词,旨在帮助读者在实践中快速提升技能。书中还特别介绍了百度文心大模型训练平台的使用技巧,以及Stable Diffusion AI绘画模型和ChatGPT AI文案模型的训练实战,为读者提供了宝贵的操作步骤和技巧。本书不仅适合人工智能训练师、数据标注人员、人工智能研究员、数据工程师、AI产品经理等从业者,也适合所有对AI技术充满热情的读者。无论是希望提升技能水平,还是希望在职场中获得更好的发展,本书都将提供宝贵的参考和指导。
|
關於作者: |
杨霁琳 ●博士,副教授●硕士研究生导师●现就职于四川师范大学●中国人工智能学会粒计算与知识发现专委会委员●2021年被认定为”四川省海外高层次留学人才”●研究方向为数据挖掘、数据分析、智能信息处理、A人工智能●先后在国际国内期刊和会议发表40余篇学术论文,并先后参与了多部专著和教材的编著 ●主持和参与多项国家自然科学基金、人文社科研究规划基金、四川省自然科学基金和四川省教育厅项目
|
目錄:
|
第1章 认识人工智能训练师 1
1.1 什么是人工智能训练 2
1.1.1 AI训练注重数据分析和算法优化 2
1.1.2 AI训练致力于提高系统的智能化水平 3
1.1.3 AI训练注重模型的优化和创新 4
1.2 人工智能训练的3大基本要素 6
1.2.1 AI训练要素1:算法 6
1.2.2 AI训练要素2:算力 6
1.2.3 AI训练要素3:数据 8
1.3 AI训练师 9
1.3.1 AI训练师的定义和角色 9
1.3.2 AI训练师的工作内容和职责 10
1.3.3 AI训练师所需技能和知识 11
1.3.4 AI训练师的就业参考标准 12
1.3.5 AI训练师的发展前景和趋势 13
本章小结 14
课后习题 14
第2章 掌握数据标注的基础 15
2.1 数据标注的定义与重要性 16
2.1.1 什么是数据标注 16
2.1.2 数据标注的重要性 17
2.1.3 数据标注的挑战 17
2.2 数据标注的类型与应用场景 19
2.2.1 不同学习模式的标注需求 19
2.2.2 不同应用场景中的标注类型 21
2.2.3 选择合适标注类型的原则 25
2.3 数据标注的标准与流程 27
2.3.1 数据标注的质量标准 27
2.3.2 数据标注的基本流程 28
本章小结 30
课后习题 30
第3章 数据标注的工具与方法 31
3.1 VIA数据标注入门 32
3.1.1 认识VGG图像注释器 32
3.1.2 下载与安装VGG图像注释器 33
3.1.3 加载图像的方法 35
3.2 图像标注的3种方法 37
3.2.1 添加矩形标注 37
3.2.2 添加椭圆形标注 38
3.2.3 添加多边形标注 40
3.3 使用其他数据标注工具 42
3.3.1 添加视频标注 43
3.3.2 添加音频标注 46
3.3.3 添加字幕标注 48
本章小结 50
课后习题 50
第4章 数据整理与预处理技巧 51
4.1 数据清洗与转换 52
4.1.1 数据收集 52
4.1.2 数据清洗 53
4.1.3 数据转换 54
4.2 缺失值处理与异常值检测 56
4.2.1 出现缺失值的原因与影响 56
4.2.2 处理缺失值的方法 56
4.2.3 异常值的识别与处理 59
4.3 特征工程基础 61
4.3.1 特征工程的概念 61
4.3.2 特征选择技术 63
4.3.3 特征提取技术 65
本章小结 66
课后习题 66
第5章 AI算法的优化与调整 67
5.1 机器学习算法概览 68
5.1.1 监督学习 68
5.1.2 无监督学习 69
5.1.3 强化学习 71
5.2 神经网络与深度学习 73
5.2.1 神经网络基础 73
5.2.2 卷积神经网络与循环神经网络 74
5.2.3 深度学习优化技术 76
5.3 算法调优与验证 78
5.3.1 常见的超参数和模型调参 78
5.3.2 Holdout检验与交叉验证 80
5.3.3 算法选择与集成学习的策略 81
本章小结 82
课后习题 83
第6章 AI模型的训练与调优 84
6.1 模型训练的基本技巧 85
6.1.1 训练集、验证集与测试集的划分 85
6.1.2 损失函数与优化器的选择 86
6.1.3 模型训练的基本流程 87
6.1.4 使用GPU加速与分布式训练 89
6.1.5 部署AI模型的4种方式 90
6.2 模型的迭代与优化 91
6.2.1 模型的评估与选择 91
6.2.2 模型的迭代过程与持续改进 93
6.2.3 模型优化的实用技巧与案例分析 94
本章小结 95
课后习题 96
第7章 百度文心大模型训练平台 97
7.1 AI Studio新手指南 98
7.1.1 认识AI Studio 98
7.1.2 登录AI Studio控制台 100
7.1.3 熟悉AI Studio的工作界面 102
7.2 AI Studio大模型应用开发 105
7.2.1 AI对话大模型应用开发实例 106
7.2.2 AI绘画大模型应用开发实例 114
7.3 AI Studio模型开发技巧 124
7.3.1 创建模型产线 124
7.3.2 创建自己的模型 129
7.3.3 使用PaddleX开发AI模型 133
本章小结 135
课后习题 135
第8章 SD AI绘画模型训练实战 137
8.1 风光摄影模型训练实战 138
8.1.1 LoRA模型训练概述 138
8.1.2 安装训练器与整理数据集 139
8.1.3 图像预处理和打标优化 141
8.1.4 设置训练模型和数据集 144
8.1.5 评估模型的应用效果 147
8.2 人物画风模型训练实战 151
8.2.1 设置模型参数 151
8.2.2 处理图像数据集 155
8.2.3 开始训练模型 159
8.2.4 在线测试模型效果 162
8.2.5 下载训练好的模型 165
本章小结 166
课后习题 166
第9章 ChatGPT AI文案模型训练实战 167
9.1 AI助手模型训练实战 168
9.1.1 创建AI助手应用 168
9.1.2 编排提示词 171
9.1.3 使用专家模式 172
9.1.4 配置模型 175
9.1.5 调试与预览AI助手 179
9.1.6 发布AI助手应用 180
9.2 AI文本生成模型训练实战 183
9.2.1 创建应用并编排提示词 183
9.2.2 创建知识库并处理数据集 187
9.2.3 添加上下文数据集 194
9.2.4 添加文字转语音功能 196
9.2.5 审查敏感内容 197
9.2.6 发布AI文本生成应用 201
本章小结 205
课后习题 205
|
內容試閱:
|
◎ 写作驱动
在科技飞速发展的今天,人工智能已经成为推动社会进步的重要力量。作为AI技术的重要组成部分,AI训练师的角色愈发凸显出其不可或缺的地位。
2020年2月25日,人力资源和社会保障部与国家市场监督管理总局、国家统计局联合公布了16个新职业,其中人工智能训练师(Artificial Intelligence Trainer)被正式认定为新职业,并被纳入国家职业分类目录。
2021年12月,人力资源和社会保障部颁布了人工智能训练师的国家职业技能标准,为行业内的职业培训和人才技能评估提供了基本依据。
2023年10月,国家市场监督管理总局认证认可技术研究中心发布了《市场监管总局认研中心关于开展第5次“人员能力验证日”有关工作安排的通知》,正式启动了面向全社会的人员能力验证工作,其中就包括人工智能训练师的能力验证。
随着AI技术的广泛应用,AI训练师的需求呈现出爆发式增长。无论是智能语音、图像识别、自然语言处理还是自动驾驶等领域,都离不开高质量的AI训练数据。因此,掌握AI训练技能的人才在市场中具有极高的竞争力。
正是基于这样的市场需求,本书应运而生,旨在为广大读者提供一本全面、系统、实用的AI训练师指南。本书紧密结合市场需求,从理论到实践,全面解析AI训练师的核心知识和技能,帮助读者迅速成长为市场紧缺的AI人才。
◎ 本书特色
本书共分为9章,从认识人工智能训练师开始,逐步深入掌握数据标注的基础、工具与方法,以及数据整理与预处理技巧;接着本书将引导读者了解AI算法的优化与调整、AI模型的训练与调优,帮助读者掌握AI训练的核心技术;此外,本书还介绍了百度文心大模型训练平台的操作技巧,以及Stable Diffusion AI绘画模型训练和ChatGPT AI文案模型训练的实战案例,让读者在实际操作中提升技能水平。
本书主要特色如下。
(1)内容全面:本书涵盖了AI训练师所需掌握的各个方面知识和技能,从基础知识到实践技能,一应俱全。
(2)实战性强:本书注重实际操作,通过丰富的实战案例和课后习题,让读者在实践中掌握技能,提升能力。
(3)图文结合:本书结合文字、图片和表格,让读者对AI训练技能一目了然,让学习变得更加轻松有趣。
总之,本书旨在帮助读者全面了解AI训练师的职业特点和技能要求,掌握AI训练的核心技术,并能够在实际工作中灵活运用所学知识,提升AI训练师的职业素养和能力水平。让我们一起携手,共同迎接AI时代的挑战与机遇!
◎ 温馨提示
(1)版本更新:在编写本书时,是基于当前各种AI工具和网页平台的界面截取的实际操作图片,但本书从编辑到出版需要一段时间,这些工具的功能和界面可能会有变动,请在阅读时,根据书中的思路举一反三,进行学习。其中,VIA的版本为2.0.12和3.0.12,SD-Trainer的版本为v1.4.1,Stable Diffusion的版本为1.6.1和1.8.0。
(2)提示词:也称为提示、文本描述(或描述)、文本指令(或指令)、关键词等。需要注意的是,即使是相同的提示词,各种AI模型每次生成的文本、图像、视频等内容也会有差别,这是模型基于算法与算力得出的新结果,是正常的,所以大家看到书里的截图与视频有区别,包括大家用同样的提示词,自己再生成内容时,出来的效果也会有差异。
◎ 资源获取
如果读者需要获取书中案例的素材、效果、视频和其他资源,请使用微信“扫一扫”功能按需扫描下列对应的二维码即可。
◎ 作者服务
本书由杨霁琳著,参与编写的人员还有苏高、胡杨等人,在此表示感谢。由于编者知识水平有限,书中难免有疏漏之处,恳请广大读者批评、指正,沟通和交流请联系微信:2633228153。
|
|