人工智能

《深度学习与图像处理》

2022-04-27 09:19:59 | 来源:中培企业IT培训网
一、培训简述
强调动手操作:内容以代码落地为主,以理论讲解为根。课程讲解机器学习和深度学习的模型理论和代码实践,梳理机器学习、深度学习、计算机视觉的技术框架,从根本上解决如何使用模型、优化模型的问题。

二、培训特色
通过课程学习,可以理解机器学习和深度学习的思维方式和关键技术;了解深度学习和机器学习在当前工业界的落地应用;能够根据数据分布选择合适的算法模型并书写代码,初步胜任使用Python进行数据挖掘、机器学习、深度学习等工作。
课程重视代码实践,使用金融、气象、农业、交通、安防等工业界实际数据(数据已脱敏)进行机器学习和深度学习的模型落地应用,将实际工作中遇到的行业应用和痛点做最直观切实的展示;重视算法模型的同时,更强调实际问题中应该如何模型选择、特征选择和调参。

三、培训时长
共计5天,每天6课时

四、培训大纲
《深度学习与图像处理》



Python数据分析
  解释器Python3.7与IDE:Anaconda/Pycharm
  列表/元组/字典/类/文件
  numpy/scipy/matplotlib/pandas的介绍和典型使用
  scikit-learn的介绍和典型使用
  TensorFlow典型应用
  典型图像处理
  多种数学曲线
  多项式拟合
  快速傅里叶变换FFT
  奇异值分解SVD
  Soble/Prewitt/Laplacian算子与卷积网络
代码和案例实践:
  卷积与(指数)移动平均线
  股票数据分析
  缺失数据的处理
  环境数据异常检测和分析


卷积神经网络:
神经网络结构,滤波器,卷积
池化,激活函数,反向传播
目标分类与识别、目标检测与追踪
AlexNet、VGGNet、GoogleLeNet
Inception-V3/V4
ResNet、DenseNet
代码和案例实践:
数字图片分类
卷积核与特征提取
以图搜图
人证合一
卷积神经网络调参经验分享


卷积神经网络高级应用、迁移学习:
使用迁移学习实现蒙古文识别
Keras的使用
获取中间隐层的特征及可视化
隐层特征的意义和使用
迁移学习的trick
学习率、衰减、冻结等问题
代码和案例实践:
猫狗大战详解
海量蒙古文识别
隐特征可视化及其应用


OpenCV图像处理
Skimage/OpenCV来源、简介与安装
将视频转换为图像序列
图像可视化与几何作图
HSV、RGB与图像颜色空间的转换
图像增强与(局部)直方图均衡化
给予边缘和区域的图像分割
gamma矫正和对数矫正
亮度区域检测与前景提取
图像边缘检测/特征提取与图像算子
Gabor/Laplace/Prewitt/Roberts
Scharr/Sobel/Niblack/Wiener
图像形态学:开/闭/凸包/膨胀/腐蚀
双边滤波器/小波降噪/wiener滤波
角点检:Harris,Shi-Tomasi
SIFT、SURF算法
视频分析:Meanshift 和 Camshift 算法
代码和案例实践:
不同算子下的图像卷积
图像边缘检测与提取
前景分割与图像融合
regional maxima检测与应用
HAAR/HOG/LBP等特征应用
视频前景背景分析与异物检测
图像形态学与海报生成的应用
光流跟踪与车辆跟踪


图像分割与定位
视频关键帧处理
卷积的位置不变形与图像定位的关系
物体检测与定位
RCNN,Fast-RCNN,Faster-RCNN,MaskRCNN
YOLOv4、SSD
UNet及其与残差网络的结合
FaceNet与特征
EfficientNet、EfficientDet
代码和案例实践:
人脸检测
OCR字体定位和识别
睿客识云
气象识别


生成对抗网络GAN
生成与判别
生成模型:贝叶斯、HMM到深度生成模型
GAN对抗生成神经网络
DCGAN
Conditional GAN
InfoGan
Wasserstein GAN
代码和案例实践:
图片生成
看图说话
对抗生成神经网络调参经验分享


视频分类模型实例
视频帧的目标定位
YOLOv4、SSD
时空卷积网络
SlowFast
代码和案例实践:
视频分类的trick
政务大厅视频监控的真实系统


RNN循环神经网络
RNN基本原理
LSTM、GRU
Attention
CNN+LSTM模型
Bi-LSTM双向循环神经网络结构
编码器与解码器结构
特征提取:word2vec
Seq2seq模型
代码和案例实践:
看图说话
藏头诗生成
问答对话系统
OCR
循环神经网络调参经验分享
 
(注:大纲还可根据需求进行调整)