一、培训简述
课程中通过细致讲解,使学员掌握该技术的本质。具体收益包括:
1.掌握OpenCV的使用;
2.理解卷积神经网络;
3.掌握Tensorflow的使用;
4.掌握keras的使用;
5.通过各个应用场景的实际经典项目案例,深入解读计算机视觉技术的应用。
二、培训特色
本次培训从实战的角度对计算机视觉技术进行了全面的剖析,并结合实际案例分析和探讨计算机视觉技术的应用场景,给计算机视觉技术相关从业人员以指导和启迪。
三、培训时长
共计3天,每天6课时
四、培训大纲
日程 |
培训模块 |
培训内容 |
第一天
上午 |
OpenCV使用 |
1.安装opencv
2.图像处理基础
3.图像运算和转换
4.图像平滑处理
5.图像梯度
6.图像边缘检测
7.图像金字塔
8.人脸检测和识别 |
第一天
下午 |
卷积神经网络介绍 |
1.CNN架构
2.卷积计算
3.卷积的步长
4.池化
5.Padding
6.MNIST网络结构介绍 |
第二天
上午 |
Tensorflow使用 |
1.深度学习框架介绍
2.Tensorflow安装
3.Tensorlfow基础知识
4.Tensorflow线性回归
5.Tensorflow非线性回归
6.Mnist数据集合Softmax讲解
7.使用BP神经网络搭建手写数字识别
8.交叉熵(cross-entropy)讲解和使用
9.过拟合,正则化,Dropout
10.各种优化器Optimizer
11.改进手写数字识别网络
12.卷积神经网络CNN的介绍
13.使用CNN解决手写数字识别 |
第二天
下午 |
keras使用 |
1.实现线性回归
2.实现非线性回归
3.MNIST数据集以及Softmax介绍
4.MNIST分类程序
5.交叉熵的应用
6.Dropout应用
7.正则化应用
8.优化器介绍及应用
9.CNN应用于手写数字识别
10.cifar-10图片分类
11.模型的保存和载入
12.绘制网络结构 |
第三天
上午 |
图像识别项目 |
1.介绍Google图像识别模型Inception-v3
2.使用Inception-v3做图像识别 |
猫狗分类项目 |
1.图像数据预处理
2.猫狗分类-简单CNN
3.猫狗分类-VGG16-bottleneck
4.猫狗分类-VGG16-Finetune |
验证码识别项目 |
1.多任务学习介绍
2.验证码识别项目 |
第三天
下午 |
目标检测项目 |
1.目标检测任务介绍
2.RCNN/Fast-RCNN/Faster-RCNN算法介绍
3.YOLO算法介绍
4.SSD算法介绍
5.目标检测项目实战 |
目标分割项目 |
1.目标分割任务介绍
2.全卷积网络
3.双线性上采样
4.特征金字塔
5.Mask RCNN算法介绍
6.目标分割项目实战 |
图像风格迁移项目 |
1.图像风格迁移介绍
2.图像风格迁移项目实战 |
GAN项目 |
1.生成式对抗网络GAN介绍
2.生成式对抗网络GAN项目实战 |
(注:大纲还可根据需求进行调整)
覃棅丰
创业公司技术负责人。机器学习,深度学习领域多年一线开发研究经验,精通算法原理与编程实践。曾使用Tensorflow,Caffe,Keras等深度学习框架完成过多项图像,语音,nlp,搜索相关的人工智能实际项目,研发经验丰富。拥有两项国家专利,同时具有多年授课培训经验,讲课通熟易懂,代码风格简洁清晰。
人工智能相关工作经历:
上海希格斯网络科技有限公司 数据挖掘工程师
1.负责深度学习NLP算法的研究和实现。
2.负责搜索引擎的实现和优化。
上海索洛信息技术有限公司 高级算法工程师
1.负责深度学习图像算法的研究和实现。
2.负责深度学习语音算法的研究和实现。
人工智能相关项目经验:
人岗匹配项目 负责算法实现
● 收集了10万份JD。
● 基于Tensorflow平台使用LSTM+Attention算法。
● 使用JD训练职位推荐模型。训练好的模型可用于分析简历描述,并根据简历描述推荐一个或多个适合的职位。
项目关键词提取项目 负责算法实现
● 收集了10万份项目描述,并标记好项目中的关键词。
● 基于Tensorflow平台使用seq2seq模型。
● 从简历的项目描述中提取出该项目中的重点词汇。可用于优化简历项目搜索结果。
人才搜索引擎项目 负责搜索引擎的实现和优化
● 搭建简历搜索引擎服务。
● 完成学校名,专业,公司,行业等模块的搜索策略
● 完成搜索结果高亮服务。
● 修改搜索bug优化搜索算法。
宠物脸识别项目 负责数据处理,算法实现
● 收集了5万张狗/猫的照片,并标记好它们脸部的区域。
● 在Linux下基于Caffe平台使用Faster-rcnn实现狗/猫脸检测算法。
● 推出了一款在线小游戏,用户上传自己家狗/猫的照片,服务器接收到照片之后用训练好的模型检测照片中狗/猫的脸,并把狗/猫的脸框出来,给它们的长相打一上个分数,再把处理后的照片反馈给用户。
宠物品种识别项目 负责数据处理,算法实现
● 收集了19种猫和27种狗的照片,共3万多张,并做好分类标签。
● 基于Caffe平台使用AlexNet,GoogleNet以及自己设计的网络实现宠物品种分类算法。
● 推出了一款在线小游戏,用户上传自己家狗/猫的照片,服务器接收到照片之后用训练好的模型检测照片中狗/猫的品种,不同宠物的品种会对应不同明星的脸,再把与宠物品种相似的明星脸反馈给用户。
宠物叫声情感分类项目 负责数据处理,算法实现
● 收集了1万6千条狗叫声,分成8个类别。
● 基于Tensorflow平台使用CNN,LSTM实现狗叫声情感分类算法。
● 将训练好的模型放到嵌入式设备中,实时判断当前场景是否有狗叫声,有狗叫声的话是属于什么分类。