中培企业IT培训
AI大模型全栈工程师实战训练营

什么是AI大模型

AI大模型的全称是"Artificial Intelligence Large-scale Model",即"人工智能大规模模型"。这个术语通常用来描述具有巨大规模参数和训练数据的机器学习模型,如Transformer、GPT、BERT等。大模型通常由深度神经网络构建,通过在大规模数据上进行预训练(Pre-training)和微调(Fine-tuning),学习到丰富的特征表示和知识。

AI大模型的三大优势

抓住AI的风口,给自己一个升职加薪的机会

AI大模型,引领未来市场趋势

带你掌握硬核技能,成为更懂AI大模型的人

四大课程优势,学起来事半功倍

热门大模型深度解析与上手实践

适合人群

AI大模型全栈工程师实战训练营课程大纲

第一天 第二天 第三天
  • 预备知识第一节:大模型理论知识

    1、初探大模型:起源与发展
    2、GPT模型家族:从始至今
    3、大模型_GPT_ChatGPT的对比介绍
    4、大模型实战-大模型2种学习路线的讲解
    5、 大模型最核心的三项技术:模型、微调和开发框架
    6、 0penAl GPT系列在线大模型技术生态
    7、0penAl文本模型A、B、C、D四大模型引擎简介
    8、0penAl语音模型Whisper与图像型DALL·E模型介绍
    9、最强Embedding大模型text-embedding-ada模型介绍
    10、全球开源大模型性能评估榜单
    11、中文大模型生态介绍与GLM 130B模型介绍
    12、ChatGLM模型介绍与部署门槛
    13、ChatGLM开源生态:微调、多模态,WebUI等项目简介

  • 预备知识第二节:自注意力机制、Transformer模型、BERT模型

    RNN-LSTM-GRU等基本概念
    编码器、解码器
    自注意力机制详解
    Transformer
    Mask Multi-Head Attention
    位置编码
    特定于任务的输入转换
    无监督预训练、有监督 Fine-tuning
    BERT思路的理解
    BERT模型下游任务的网络层设计
    BERT的训练
    HuggingFace中BERT模型的推断
    基于上下文的学习
    代码和案例实践:
    基本问答系统的代码实现
    深入阅读理解的代码实现
    段落相关性代码实现

  • 第三节:Embedding模型实战

    大模型技术浪潮下的Embedding技术定位
    Embedding技术入门介绍
    从Ono-hot到Embedding
    Embedding文本衡量与相似度计算
    OpenAl Embedding模型与开源Embedding框架
    两代OpenAl Embedding模型介绍
    text-embedding-ada-002模型调用方法详解
    text-embedding-ada-002模型参数详解与优化策略
    借助Embedding进行特征编码
    Embedding结果的可视化展示与结果分析
    【实战】借助Embedding特征编码完成有监督预测
    【实战】借助Embedding进行推荐系统冷启动
    【实战】借助Embedding进行零样本分类与文本搜索
    Embedding模型结构微调优化
    借助CNN进行Embedding结果优化
    【企业级实战】海量文本的Embedding高效匹配

  • 第四节:LLM应用程序技术栈和提示词工程Prompt Enginerring

    设计模式:上下文学习
    数据预处理/嵌入
    提示构建/检索
    提示执行/推理
    数据预处理/嵌入
    Weaviate、Vespa 和 Qdrant等开源系统
    Chroma 和 Faiss 等本地向量管理库
    pgvector 等OLTP 扩展
    提示构建/检索
    提示执行/推理
    新兴的大语言(LLM)技术栈
    数据预处理管道(data preprocessing pipeline)
    嵌入终端(embeddings endpoint )+向量存储(vector store)
    LLM 终端(LLM endpoints)
    LLM 编程框架(LLM programming framework)
    LangChain的主要功能及模块
    Prompts: 这包括提示管理、提示优化和提示序列化。
    LLMs: 这包括所有LLMs的通用接口,以及常用的LLMs工具。
    Document Loaders: 这包括加载文档的标准接口,以及与各种文本数据源的集成。
    Utils: 语言模型在与其他知识或计算源的交互
    Python REPLs、嵌入、搜索引擎等
    LangChain提供的常用工具
    Indexes:语言模型结合自定义文本数据
    Agents:动作执行、观测结果
    LangChain的代理标准接口、可供选择的代理、端到端代理示例
    Chat:Chat模型处理消息
    代码和案例实践:
    LLM大模型的使用
    Prompts的设计和使用

  • 第五节:国产大模型DeepSeek

    新一代DeepSeek模型API调用
    DeepSeek开放平台使用方法与APIKey申请
    DeepSeek-V3、DeepSeek-R1、DeepEP介绍
    DeepSeek在线知识库使用及模型计费说明
    DeepSeek模型SDK调用与三种运行方法
    DeepSeek调用函数全参数详解
    DeepSeek Message消息格式与身份设置方法
    DeepSeek tools外部工具调用方法
    DeepSeek Function calling函数封装12GLM4接入在线知识库retrieval流程
    DeepSeek接入互联网web_search方法
    【实战】基于DeepSeek打造自动数据分析Agent
    【实战】基于DeepSeek的自然语言编程实战
    【实战】基于DeepSeek Function call的用户意图识别
    【实战】基于GLM4的长文本读取与优化

  • 第六节:LangChain大模型框架构建

    构建垂直领域大模型的通用思路和方法
    (1) 大模型+知识库
    (2) PEFT(参数高效的微调)
    (3) 全量微调
    (4) 从预训练开始定制
    LangChain介绍
    LangChain模块学习-LLMs 和 Prompts
    LangChain之Chains模块
    LangChain之Agents模块
    LangChain之Callback模块
    Embedding嵌入
    自定义知识库
    知识冲突的处理方式
    向量化计算可采用的方式
    文档加载器模块
    向量数据库问答的设计
    Lanchain竞品调研和分析
    Dust.tt/Semantic-kernel/Fixie.ai/Cognosis/GPT-Index
    LlamaIndex介绍
    LlamaIndex索引
    动手实现知识问答系统
    代码和案例实践:
    动手实现知识问答机器人
    LangChain文本摘要
    PDF文本阅读问答

  • 第七节使用LangGraph构建工作流

    LangGraph 构建自适应RAG
    1.LangGraph 应用场景、核心功能、特点
    2.基础概念:节点、边、图等
    3.LangGraph 的系统架构
    4.数据模型和存储机制
    5.基本数据查询与操作
    6.高级查询:路径查询、模式匹配
    7.使用本地LLM自适应RAG
    8.代理RAG与纠正(CRAG)

  • 第八节LLM模型的私有化部署与调用

    1. 各种模型文件介绍
    2. 模型的推理、量化介绍与实现
    3. Modelscope、Hugging Face简单介绍与使用
    4. 大模型管理底座Ollama介绍
    5. Ollama + lLama 部署开源大模型
    6. Open WebUI发布与调用大模型
    7. API Key获取与 Llama微调实现

  • 第九节:开源大模型微调实现

    Llama_Factory 微调实战
    1. 提升模型性能方式介绍:Prompt、知识库、微调
    2. 如何科学构建训练数据(基础与专业数据混合训练)
    3. 微调常见方式介绍:微调、偏好对齐、蒸馏、奖励模型
    4. Llama3 模型架构与调用申请
    5. 数据上传与任务创建(job)
    6. 训练集与测试集拆分与模型评估
    7. Unsloth微调平台介绍
    8. Llama3开源大模型的微调与使用
    9. 模型的评估策略

  • 第十节:大模型企业商用项目实战

    AI-Agent 构建可发布的智能客服系统
    1. 智能体介绍与AutoGPT基本原理
    2. AutoGPT安装与环境配置
    3. 实战体验:AutoGPT实现数据爬取、清洗、保存
    4. 创建各种场景的AutoGPT
    5. 内容创建
    6. 客服服务
    7. 数据分析
    8. 代码编写
    9. 创建应用程序

授课场景一 授课场景二 授课场景三 授课场景四 授课场景五 授课场景六 授课场景七