人工智能培训_AI培训_大模型培训-尚硅谷

全球人工智能浪潮正劲
时代红利，先到先得！

人工智能技术人才缺口越来越大
更高起点，等你挑战!

过去3年以来，人工智能（AI）领域的多个岗位持续面临人才短缺的问题

AI相关岗位在互联网、电商、智能硬件、游戏等多个行业的头部公司中显著紧缺，以阿里巴巴为例，人才紧缺度前10岗位中，6个均为AI相关岗位。小红书紧缺度前10的岗位中，9个与AI相关。而SHEN的8个高紧缺度岗位中，4个均与AI相关。

项目实战贯穿全程
讲透电商，举一反三覆盖多行业

硅谷大咖讲师+企业技术专家组团授课，深入
讲透大模型关键技术应用

01 智能发布
分类02 商户运营管家03 市场罗盘04 掌柜智库05 好医智库06 伴学智库07 掌柜问数08 智医问数09 学情问数10 文摘引擎11 智能评论12 电商小二13 尚医助手14 知学助手15 万应助手16 智能检索17 智能发布
标题18 智能发布
详情

项目介绍

在企业内容管理场景中，传统分类模型往往面临多级分类逻辑复杂、数据分布不均、难以与下游生成任务协同等挑战。本项目旨在构建一个服务于智能发布流程的、具备深度理解能力的分类引擎。系统采用创新的层级化分类设计，通过预测最细粒度的三级分类并智能反推其上级类别。针对现实世界中常见的长尾数据分布问题，系统创造性融合了热门类别的下采样与冷门类别的大模型数据增强策略。

项目成果与应用

1.层级化分类设计：通过预测三级分类并反推上级类别，简化多级分类任务。2.数据均衡化处理：采用热门类别下采样与冷门类别大模型数据增强策略。3.预训练模型微调：选用bert-base-chinese模型，基于Huggingface Transformers库进行高效训练。4.高效训练与评估：在单张V100显卡上约一小时完成训练，F1分数近70%。5.模块化功能集成：与图片生成标题、视频简介复刻模块协同工作。

技术栈

Python, Transformers, PyTorch, BERT, 下采样, 数据增强

项目介绍

本项目致力于打破僵局，构建一套“能思考、会执行”的电商智能运营中台。我们摒弃了单一的工具拼接，而是采用 Coze 和 Dify 编排复杂的业务流。在营销端，系统不仅能通过知识库实时捕捉抖音/微博热点，更能结合通用性、独特性、保障性三大维度智能提炼卖点。在服务端，系统化身为“金牌店长”，利用 LLM 强大的语义理解能力，对客服对话进行毫秒级的情感分析与意图识别。

项目成果与应用

1.一个项目两个平台：采用 Coze 与 Dify 两种方式实现，通过 Agent 与 Workflow 编排实现全链路自动化。2.闭环营销：首创“热点-卖点-买点-文案-海报”自动化营销流。3.智能风控：集成钉钉机器人投诉分类助手，实时预警售后风险。4.数据洞察：精准提取用户画像与产品缺陷。5.视觉生产：工作流内嵌绘图与叠图插件，一键生成营销海报。6.竞品雷达：自动化生成竞品分析与行业调研报告。

技术栈

Coze, Dify, Python, AIGC, LLM(DeepSeek/GPT), Google_Search_API, DingTalk, RAG

项目介绍

面对“某行业未来五年发展趋势”这类模糊且庞大的需求，传统的单轮问答系统往往显得力不从心。本项目致力于构建一套具备自主规划能力的全智深度研究系统。我们采用先进的多智能体协作架构（Multi-Agent Collaboration）。对于复杂课题，基于 SOP（标准作业程序）动态生成执行计划。系统能够像人类分析师一样，自主调用工具对海量信息进行清洗、交叉验证与深度挖掘。

项目成果与应用

1.SOP 动态编排：实现复杂任务的自动拆解、路径规划与动态调整。2.双模态引擎：自适应切换 ReAct 单任务极速处理与 PlanSolve 多任务深度研判模式。3.全域工具集成：整合 DeepSearch、Python 代码解释器、专业报表生成及 NL2SQL。4.多智能体协同：基于 PlanningAgent 全局统筹与 ExecutorAgents 并行执行。5.开放生态互联：连接云端 MCP 服务。6.过程可视化：SSE 技术全链路展示“思考-检索-分析-写作”心流。

技术栈

Java, Python, FastAPI, SmolAgents, LiteLLM, Qdrant, ElasticSearch, React, MCP, SSE

项目介绍

随着电商行业的数字化升级，商家面临着海量的智能硬件设备管理挑战。这些设备往往配有冗长晦涩的操作手册，传统的关键词搜索无法精准匹配用户语义化问题。本项目致力于解决这一痛点，构建一套基于大模型的高级 RAG（检索增强生成）系统。采用最前沿的 LangGraph 框架编排复杂的业务逻辑，结合多模态模型解析复杂 PDF，并创新性地融合了向量检索与知识图谱。

项目成果与应用

1.前沿架构：基于 LangGraph 构建企业级可插拔 RAG 工作流。2.多模态处理：集成 MinerU 与 OCR，精准解析图文混排 PDF。3.多路召回：向量检索 + 稀疏检索 + Neo4j 知识图谱多路混合召回。4.智能切片：支持滑动窗口、Small-to-Big 及语义切分策略。5.深度优化：引入 HyDE 假设性嵌入与 BGE-Rerank 重排序技术。6.全链路评估：集成 RAGAS 框架自动化评估。

技术栈

Python, LangChain, LangGraph, OCR, MinerU, Milvus, HyDE, BGE-Rerank, RAGAS, Neo4j

项目介绍

医院、医生与科研人员每天处理大量医学文献、电子病历及影像报告。传统检索难以理解临床语义差异。本项目打造面向医疗行业的企业级高级 RAG 解决方案。基于 LangGraph 框架构建可溯源工作流。在数据解析端，融合 MinerU 与 OCR 攻克医学图文混排资料。在检索端，创新整合向量检索、稀疏检索与临床知识图谱，实现多路召回机制；搭配 HyDE 与 BGE-Rerank 技术提升匹配精准度。

项目成果与应用

1.前沿架构：基于 LangGraph 构建可审计的企业级 RAG 工作流。2.多模态处理：精准解析医学影像报告、EMR 及文献。3.多路召回：向量+稀疏+临床知识图谱混合召回。4.智能切片：支持基于病例结构、滑动窗口等策略。5.深度优化：引入 HyDE 与 BGE-Rerank 优化症状诊断匹配。6.全链路评估：集成 RAGAS 与临床知识正确性校验。

技术栈

Python, LangChain, LangGraph, OCR, MinerU, Milvus, HyDE, BGE-Rerank, RAGAS, Neo4j

项目介绍

在线教育平台需处理海量教材与多版本题库。传统搜索难以理解“这个函数题为什么要换元”等教育语义。本项目打造面向在线教育的企业级高级 RAG 系统。基于 LangGraph 构建可插拔工作流，覆盖课程构建、教辅生成等任务。集成 MinerU 与 OCR 处理复杂教学材料。创新性融合向量检索、稀疏检索与教育知识图谱，支撑题目解析与知识点推送。

项目成果与应用

1.前沿架构：基于 LangGraph 构建教育可插拔 RAG 工作流。2.多模态处理：精准解析教材、板书截图、课件 PDF。3.多路召回：向量+稀疏+知识图谱（课程体系/题库）混合召回。4.智能切片：支持教育语义切分策略。5.深度优化：引入 HyDE 与 BGE-Rerank 增强知识点匹配。6.全链路评估：集成 RAGAS 框架，结合题目正确率评估。

技术栈

Python, LangChain, LangGraph, OCR, MinerU, Milvus, HyDE, BGE-Rerank, RAGAS, Neo4j

项目介绍

面对数以千计的数据表，传统 BI 难以满足即时分析需求。本项目构建基于大模型的企业级 Text-to-SQL 智能问答系统。采用“多阶段推理（Multi-stage Reasoning）”架构。在数据处理端，利用混合检索精准定位关键表；在生成端，强制模型执行 CoT（思维链）——先拆解问题，再推导逻辑，最后生成 SQL。这不仅是 SQL 生成工具，更是会思考的虚拟数据分析师。

项目成果与应用

1.大厂开源内核：基于京东 DataAgent 深度定制。2.思维链驱动 NL2SQL：引入 Deep-Thinking 推理层，采用“重写-思考-生成”架构。3.混合多路召回：Qdrant 向量检索 + Elasticsearch 倒排索引。4.动态 Schema 剪枝：ColumnFilterModule 智能剔除无关字段。5.高并发异步架构：基于 AsyncIO 构建。6.精准语义对齐：集成 Jieba 分词与 HyDE 策略。

技术栈

Python, FastAPI, Qdrant, Elasticsearch, LiteLLM, Jieba, AsyncIO, React, SSE, Agentic-Workflow

项目介绍

医疗数据系统繁多且结构复杂，临床人员面临“找不到、看不懂、不会查”的痛点。本项目构建基于大模型的医疗行业 Text-to-SQL 智能问答系统。系统采用“多阶段推理”架构，在数据处理端通过混合检索实现医学术语与检验指标的双通道检索；在生成端强制执行 CoT 思维链。使系统在面对跨系统、跨科室的复杂临床提问时，仍能生成可执行、可审计的 SQL。

项目成果与应用

1.大厂开源内核：基于 DataAgent 定制，强化医疗数据合规。2.思维链驱动 NL2SQL：确保复杂医疗查询逻辑准确性。3.混合多路召回：医学术语语义 + 检验指标数值混合召回。4.动态 Schema 剪枝：基于临床语义自动剔除无关字段。5.高并发异步架构：满足 HIS/LIS 高并发场景。6.精准语义对齐：解决医疗专业名词与数据库字段的语义鸿沟。

技术栈

Python, FastAPI, Qdrant, Elasticsearch, LiteLLM, Jieba, AsyncIO, React, SSE, Agentic-Workflow

项目介绍

面对海量课程与学习轨迹，传统报表无法满足实时洞察需求。本项目构建基于大模型的教育领域 Text-to-SQL 智能问答系统。采用“多阶段推理”架构，创新融合向量检索与倒排索引实现教学概念与行为数据的混合召回。系统强制执行 Deep-Thinking 思维链，先重写教学问题，再推导查询逻辑，最后生成符合合规要求的标准 SQL，帮助实现个性化干预与教学决策闭环。

项目成果与应用

1.大厂开源内核：基于 DataAgent 定制，强化教学质量监控。2.思维链驱动 NL2SQL：确保学习轨迹、多维效果分析等 SQL 逻辑准确。3.混合多路召回：教学概念 + 学生行为精准混合召回。4.动态 Schema 剪枝：降低 LLM 对多维数据的上下文负载。5.高并发异步架构：满足在线课堂高并发访问。6.精准语义对齐：集成教育行业词库与 HyDE 策略。

技术栈

Python, FastAPI, Qdrant, Elasticsearch, LiteLLM, Jieba, AsyncIO, React, SSE, Agentic-Workflow

项目介绍

企业级数据应用中，传统报表生成依赖人工，效率低且易遗漏。本项目旨在构建一套智能文摘引擎。采用轻量化大模型技术路线，基于 Qwen3-4B + LoRA 微调。系统深度理解运营、供应链等岗位需求，自动完成数据抽取与报告生成。通过强化对异常数据的智能诊断与核心信息的规则校验，大幅压缩报表制作时间，并支持长文本逻辑连贯分析，推动从被动汇报向主动决策升级。

项目成果与应用

1.轻量化大模型落地：Qwen3-4B + LoRA 微调，数据抽取准确率升至 96%。2.全岗位报表效率提升：日报/周报生成时间压缩 70%-90%。3.复杂逻辑与长文本处理：支持趋势分析与问题复盘。4.异常数据智能归因：确保核心信息零遗漏。5.安全合规：加密传输与脱敏处理。6.闭环迭代：通过员工反馈持续优化，支持智能问答。

技术栈

Qwen3-4B, LoRA微调, Python, 加密传输与脱敏, 规则校验引擎, 闭环反馈机制

项目介绍

在电商内容生成场景中，通用大模型难以稳定输出符合情感倾向与风格要求的文本。本项目通过完整复刻并实施 RLHF（基于人类反馈的强化学习）全流程，将基础大模型塑造成能够精准理解并执行“生成积极正向商品评价”指令的专用智能体。我们严格遵循 RLHF 三阶段范式：监督微调 (SFT) 奠定基础，奖励模型 (RM) 量化偏好，PPO 强化学习进行策略优化，实现模型行为的精准对齐。

项目成果与应用

1.严格遵循标准 RLHF 流程：SFT、RM、PPO 三阶段精准对齐。2.监督微调奠基：基于电商评论数据集对 Qwen2.5-3B 进行 SFT。3.奖励模型提供偏好信号：构建奖励头，量化文本情感偏好。4.PPO 强化学习对齐：以 SFT 模型为行动者，集成价值头，驱动策略优化。5.稳定训练技术集成：引入 KL 散度惩罚与 PPO-Clip。6.业务目标达成：稳定输出积极正向商品评价。

技术栈

Python, PyTorch, Transformers, TRL, DeepSpeed, Qwen2.5, PPO, KL散度惩罚, GAE

项目介绍

传统客服机器人常因用户表达含糊或需要多轮交互而陷入死循环。本项目基于 Rasa 框架深度二次开发，构建具备深度感知能力的任务型客服系统。在 NLU 端，利用特征融合技术确保模型既懂“专业术语”也懂“口语表达”。在对话管理端，引入 TED Policy 利用注意力机制捕捉长距离上下文，让机器人具备记忆能力，成为能理解情绪、主动服务的“金牌数字员工”。

项目成果与应用

1.行标级开源项目深度二开：深入 Rasa 源码层定制。2.深度语义融合：Sparse + Dense 双路特征提取。3.DIET 多任务学习：意图分类与实体提取一体化。4.混合对话策略：Rule + ML (TED) 双引擎驱动，拒绝“人工智障”。5.全链路特征工程：解决中文电商语境识别难题。6.动态动作执行：支持自定义 Action 调用 API 查询订单。7.可视化故事建模：基于 Stories 建模多轮对话。

技术栈

Python, Rasa, Pytorch, Jieba, BERT/ChineseBERT, DIET Classifier, TED Policy, Docker

项目介绍

医疗问诊场景下，传统机器人难以应对含糊表达或多轮问诊。本项目构建具备深度语义感知能力的任务型医疗助手。基于 Rasa 进行深度二次开发，严格遵循工业级 NLP 流水线。在 NLU 端，将关键词特征与 BERT 语义向量融合，确保读懂口语化症状。在对话管理端，利用 RulePolicy 处理硬性流程，利用 TED Policy 捕捉长距离上下文，实现病情描述、用药咨询等复杂交互的记忆与处理。

项目成果与应用

1.开源项目深度二开：针对医疗场景定制 Rasa。2.深度语义融合：精准理解医疗术语与口语。3.DIET 多任务学习：提升训练效率与识别准确率。4.混合对话策略：Rule 处理挂号，TED 处理问诊。5.全链路特征工程：针对中文医疗语境优化。6.动态动作执行：实时查询检验报告、预约检查。7.可视化故事建模：将非线性问诊转化为可控训练样本。

技术栈

Python, Rasa, Pytorch, Jieba, BERT/ChineseBERT, DIET Classifier, TED Policy, Docker

项目介绍

在线教育场景中，传统机器人常在跳跃式提问时卡壳。本项目构建具备深度理解与教学协同能力的任务型教育智能助手。基于 Rasa 深度定制，在 NLU 端融合 EduBERT 向量，精准解析课程名与学生口语。在对话管理端，应用 DIET 模型实现意图与实体一体化解析，并利用 Rule+TED Policy 捕捉上下文，成为能记忆学习历史、主动调用教务接口的“金牌数字教师助手”。

项目成果与应用

1.开源项目深度二开：支持课程咨询、学习路径推荐。2.深度语义融合：结合 EduBERT 理解教育术语。3.DIET 多任务学习：意图分类与课程实体识别一体化。4.混合对话策略：处理自由问答与跳跃式咨询。5.全链路特征工程：解决课程简称解析困难。6.动态动作执行：调用 LMS 接口查询进度、提醒作业。7.可视化故事建模：提高学习交互可解释性。

技术栈

Python, Rasa, Pytorch, Jieba, BERT/ChineseBERT, DIET Classifier, TED Policy, Docker

项目介绍

传统售后场景需求高度异构，单一系统难以应对。本项目构建具备自主决策能力的百应智能售后系统。采用 Multi-Agent Orchestration（多智能体编排）架构。核心中枢如“分诊台”般调度专业子智能体。利用 Text-to-SQL 直连数据库查询维修资源；通过 MCP 协议接入百度地图打通线下服务。配合持久化记忆，实现集诊断、查询、导航、导购于一体的售后服务智能总台。

项目成果与应用

1.中控调度架构：基于 Orchestrator 的分诊模式动态路由。2.Text-to-SQL：自然语言转 SQL，精准查询维修信息。3.时空智能集成：引入 MCP 协议对接百度地图。4.领域知识 RAG：集成垂直知识库处理硬件故障诊断。5.全生命周期记忆：基于 JSON 的持久化 Session 管理。6.全栈交互体验：Python 异步后端 + Vue3 前端。

技术栈

Python, Vue3, OpenAI-SDK, Orchestrator-Pattern, Text-to-SQL, MCP, BaiduMap-API, AsyncIO

项目介绍

针对中文互联网图文信息精准检索的“语义鸿沟”问题，本项目打造专为中文场景设计的高效图文检索系统。采用部分参数冻结策略，仅解冻 CLIP 模型文本与视觉编码器的末端层进行微调，高效注入中文语义理解。结合 AdamW 分组学习率等精细化训练策略，确保稳定收敛。最终将优化后的模型与 Chroma 向量数据库结合，构建端到端、低延迟的“文搜图”闭环。

项目成果与应用

1.模型微调优化：基于 CLIP Chinese 模型续训，采用部分参数冻结策略。2.训练策略定制：使用 AdamW 分组学习率与早停机制。3.高效向量检索：利用 HNSW 索引的 Chroma 数据库实现快速搜索。4.端到端检索流程：完成“文搜图”完整闭环。5.资源与性能平衡：单张 V100 GPU 约 5 小时完成训练，显著提升检索效果。

技术栈

Python, CLIP-Chinese, PyTorch, Transformers, AdamW, Chroma, HNSW

项目介绍

本项目构建一套以预计算和高效融合为核心的多模态内容生成系统。采用创新的图像表征预计算架构，训练前通过冻结的 CLIP 模型提取图像特征，大幅降低开销。通过精心设计的提示词模板与投影层，将图像特征映射为提示词序列，无缝嵌入语言模型输入流。推理阶段实时处理图像，自动完成特征提取与标题生成，实现了高效、可控的多模态内容创作。

项目成果与应用

1.图像表征预计算：提取并存储特征，显著提升训练效率。2.数据集构建与提示工程：构建关联数据集，利用模板指导学习。3.多模态特征融合：图像特征映射为提示词序列深度融合。4.高效训练策略：采用带预热的 AdamW 与早停机制。5.推理流程自动化：实时编码投影，自回归生成标题。6.资源优化配置：单张 GPU 完成训练，资源利用最大化。

技术栈

Python, PyTorch, CLIP, Transformers, AdamW, 梯度裁剪, 自回归采样

项目介绍

本项目旨在构建一个能够深度融合商品原图结构、品牌专属风格与营销文案的高保真商品详情页智能生成系统。采用“数据精炼-分模块微调-多条件融合-工程增强”方案。基于 Stable Diffusion，通过 LoRA 学习风格，微调 ControlNet 控制结构。推理时构建级联管道，融合结构、文本与风格条件。引入 IP-Adapter 等技术作为保底，确保生成结果的可用性与一致性。

项目成果与应用

1.多条件数据集构建：构建“商品-详情”与“商品-结构”对齐数据。2.条件生成模型与分模块微调：LoRA 学习风格，ControlNet 提取结构。3.多模态控制信号融合推理：一次前向传播融合所有条件。4.面向一致性的工程化增强：引入 IP-Adapter 还原细节。5.资源高效化训练：单张 GPU 完成，利用 8 位优化器降低开销。

技术栈

Stable Diffusion, LoRA, ControlNet, IP-Adapter, 数据预处理, 多模态融合, 8位优化器

培养大模型人才
需要这样的课程

9大阶段，系统掌握
人工智能（大模型方向）实用新技术

大型企业级实战项目
贯穿全程，学员亲自上手实操

硅谷名师+企业大牛
组团全程面授

课程大纲

01 Python&数据结构&算法 --
人工智能语言基础展开

核心技能

掌握 Python 语言基础，包括语法、数据类型、运算符、输入输出函数等核心内容。
熟练运用 PyCharm 开发工具，掌握其安装、设置及调试相关操作。
精通 Python 中分支、循环结构以及各类数据结构（字符串、列表、字典、元组等）的操作与运用。
深入理解面向对象编程，涵盖类和对象、封装、继承、多态及设计模式等方面知识。
具备 Python 文件操作、异常处理以及模块制作、安装与使用的能力。
了解 Python 的高级特性，像深拷贝、浅拷贝、生成器、迭代器、闭包、装饰器等内容。
掌握 Python 进程与线程相关概念及操作，包括并发、通信、互斥锁等要点。
熟悉 Python 网络编程以及正则表达式相关知识，用于对应场景的实践应用。
掌握链表、栈、队列的基本操作及应用。
熟练运用快速排序、二分查找等算法。
解决数组、字符串、查找等各类问题。
掌握递归、动态规划、贪心、回溯等算法思想及应用。

课程设计特色

本阶段 Python 课程特色鲜明，一方面全面培养学生的编程基础，深入讲解数据结构与控制结构，强调面向对象编程思想，重视文件操作、异常处理和模块使用等实用技能，同时通过综合案例提升实际问题解决能力，帮助学生熟练掌握 PyCharm 开发工具，还会介绍高级特性拓宽编程视野，深入讲解进程与线程、网络编程及正则表达式，注重理论与实践结合，以丰富案例和实践项目巩固知识；另一方面会深入讲解基础数据结构与高效算法，针对各类问题分类教学，引入高级算法思想，为学生夯实基础、提升程序效率，开拓编程思路，助力其提升解决复杂问题的能力，整体为学生未来发展打下坚实基础。

关键技术清单

Python核心

1、Python入门：Python发展史、Python应用场景、Python开发环境搭建
2、PyCharm：PyCharm的安装、设置字体、设置快捷键、PyCharm常用设置、调试
3、Python基础知识：注释、变量以及数据类型、标识符和关键字、输入函数、输出函数、运算符、程序类型转换
4、分支和循环：if判断语句、运算符、if-else语句、while循环、for循环、break、continue
5、字符串和列表：字符串输入、字符串输出、下标和切片、字符串常见函数、列表(list)、列表的循环遍历、列表的增删改查、列表的嵌套、列表的切片
6、字典和元组：字典的增删改查、字典遍历、访问元组、修改元组、集合（set）
7、函数：函数定义、函数的类型、函数参数、函数返回值、函数嵌套、局部变量、全局变量、递归函数、匿名函数
8、文件操作：文件的打开与关闭、文件的读写、文件读写应用
9、面向对象（类和对象）：定义类、类的构成、类的__init__()方法、创建对象、理解self
10、面向对象（封装、继承、多态）：封装、私有方法、私有属性、__del__()方法、继承、多继承、多态、类属性、实例属性、静态方法和类方法
11、面向对象（设计模式）：单例模式、工厂模式、__new__方法
12、综合案例：愤怒的小鸟
13、异常：捕获异常、异常的传递
14、模块：模块中的__all__、模块制作、打包模块、模块安装与使用
15、深拷贝、浅拷贝、私有化：深拷贝案例、浅拷贝案例、进制、位运算、作用域、私有化、属性property
16、生成器、迭代器、闭包、装饰器、元类、垃圾回收、内建函数
17、网络编程：进程池、进程间通信、多线程、进程和线程区别、协程、网络通信、端口、IP地址、socket、UDP、TCP、http
18、网络编程综合案例：企业级web框架starlette介绍及使用
19、正则表达：表示字符、表示数量、原始字符串、表示边界、匹配分组
20、综合案例：客户信息管理系统综合案例

数据结构&算法

1、什么是数据结构、数据结构分类、什么是算法、算法的分类、时间复杂度、空间复杂度
2、常用数据结构：数组、链表、栈、队列、哈希表、树、图
3、常用算法：查找算法、排序算法、分治算法、动态规划算法、回溯算法、贪心算法
4、力扣刷题及阶段考试

02 数据分析 --
这是数据驱动的时代展开

核心技能

熟练安装配置 Linux 环境并掌握常用命令。
精通 MySQL 安装使用及 SQL 操作。
熟悉 Numpy 的属性、函数及运算。
掌握 Pandas 的数据处理方法。
会用多种工具进行数据可视化。
具备在 Linux 环境下进行数据分析和可视化的综合能力。

课程设计特色

本阶段课程从 Linux 环境搭建入手，为后续学习奠定基础。深入讲解 MySQL 数据库及数据处理工具 Numpy、Pandas，提升数据处理能力。通过多种可视化工具进行数据展示，注重理论与实践结合，培养学生在 Linux 环境下的数据分析和可视化综合能力。

关键技术清单

Linux与数据库基础

1、Linux环境准备：WSL/Linux安装、VI编辑器、软件包安装、常用命令（vim, cd, grep, tail等）
2、Shell编程：变量、流程控制、自定义函数、正则工具
3、Docker：安装、镜像管理、容器启动与常用命令
4、MySQL：SQL语句、多表操作、开窗函数、数据库约束、远程连接实战
5、前后端基础：FastAPI、SQLAlchemy、Uvicorn入门

数据分析核心库

1、Numpy：环境搭建、张量属性、切片索引、统计/排序函数、矩阵运算
2、Pandas核心：Series与DataFrame创建、布尔索引、数据导入导出、缺失值处理、日期处理
3、Pandas进阶：数据组合(concat/merge)、apply函数、数据聚合转换、透视表
4、时间序列：日期索引、生成时间序列、重采样
5、可视化：Matplotlib、Pandas可视化、Seaborn可视化
6、综合案例：房地产市场洞察与价值评估、员工薪资统计、睡眠质量分析

03 机器学习 --
智能时代的核心引擎展开

核心技能

熟悉线性代数、概率、高数等数学基础。
熟悉 KNN 算法的思想、流程及不同距离计算方法，能进行特征预处理。
理解线性回归的概念、分类、损失函数及梯度下降算法，掌握模型评估指标。
掌握逻辑回归的数学基础、原理及分类评估指标，能进行案例实践。

课程设计特色

紧密结合数学基础，涵盖线性代数、概率、高数等知识，为算法学习筑牢根基。深入讲解多种经典算法（KNN、线性回归、逻辑回归）的原理和实现。通过丰富的案例实践（如混淆矩阵、ROC曲线、正则化），培养学生解决实际问题的能力。

关键技术清单

数学基础与概述

1、高等数学：导数、求导法则、极值计算、偏导数、梯度
2、线性代数：标量/向量/矩阵运算、范数、逆矩阵
3、概率论：常见分布（正态/伯努利）、贝叶斯定理、极大似然估计
4、机器学习概述：发展历程、算法分类、建模流程、特征工程

经典模型算法

1、KNN：算法思想、距离度量方法、特征归一化/标准化、参数调优
2、线性回归：损失函数、正规方程、梯度下降、模型评估(MAE/MSE/RMSE)、正则化
3、逻辑回归：原理、混淆矩阵、精确率/召回率/F1、AUC/ROC曲线
4、无监督学习：聚类算法简介、Kmeans原理、模型评估、DBSCAN
5、感知机：基本概念、激活函数、逻辑电路局限性

04 深度学习 --
让AI像人类一样思考展开

核心技能

理解深度学习的概念、应用场景及优缺点。
掌握 Pytorch 的安装及张量的各种操作（创建、转换、计算等）。
熟悉神经网络的结构组成（输入层、输出层、隐藏层等）及激活/损失函数。
掌握卷积神经网络 CNN，理解图像基础、卷积层和池化层。
掌握循环网络 RNN 原理及词嵌入层、文本生成案例。
具备深度学习项目实战能力，如房价预测和服装分类。

课程设计特色

从深度学习基础入手，深入讲解 Pytorch 工具。在神经网络方面，详细介绍各层结构及关键要素。对于 CNN 和 RNN，分别从图像基础和文本处理角度剖析。结合房价预测、服装分类等案例，让学生将知识转化为实际应用能力。

关键技术清单

Pytorch与神经网络

1、Pytorch基础：张量创建、类型转换、数值计算、自动微分、线性回归案例
2、神经网络基础：多层感知机、激活函数、初始化方式、神经网络搭建
3、神经网络学习：数据驱动、损失函数、梯度下降法、学习算法实现
4、反向传播（核心）：计算图、链式法则、算法原理与实现
5、优化与进阶：参数更新优化、权重初始值、正则化、梯度消失/爆炸

进阶架构与项目

1、CNN：图像基础、卷积层计算、池化层、全连接层、服装分类案例
2、项目实战：房价预测、多层感知机应用

05 NLP自然语言处理 --
人工智能皇冠上的明珠展开

核心技能

理解 NLP 的概念、发展历史和应用场景。
掌握文本预处理方法，包括文本张量表示、特征处理和数据增强。
熟悉 RNN、LSTM、GRU 模型的结构特点及 API。
掌握 Seq2Seq 结构及添加注意力机制（Attention）的方法。
理解 Transformer 架构，包括各层结构和编码器-解码器实现。
掌握 fastText 工具及预训练模型（BERT、GPT、T5）的微调与应用。

课程设计特色

从分词、词表示到前沿预训练模型全面覆盖。对经典模型进行详细剖析，并引入注意力机制与 Transformer 架构。通过“智能发布”等项目实战，将 BERT 微调、Huggingface 工具与实际业务（标题分类、数据均衡化）结合。

关键技术清单

NLP核心技术

1、预处理与词表示：中英文分词（jieba）、One-hot、Word2Vec原理及实战
2、经典序列模型：RNN、LSTM、GRU 的多层双向结构及 API（智能输入法、AI智评案例）
3、Seq2Seq与Attention：编码器-解码器、注意力评分函数（点积/拼接）、中英翻译案例
4、Transformer：核心思想、整体结构实现、中英翻译3.0实战
5、预训练模型：GPT、BERT、T5 结构与微调方式、AI智评3.0实战

NLP项目实战

1、项目：智能发布（标题分类）- 层级化分类设计、数据均衡化（下采样/大模型增强）、BERT微调、高效评估

06 大模型智能体 --
智能时代的场景重构引擎展开

核心技能

掌握大模型智能体（LLM Agent）的核心概念与范式。
熟练运用主流低代码/无代码智能体开发平台（Coze、Dify）。
精通 LangChain 框架核心模块与 LangGraph 图状编排。
深入理解并工程化实现检索增强生成（RAG）技术。
具备构建领域知识图谱、多步规划与工具调用的能力。
掌握私有化模型部署（Ollama、Xinference）与企业级应用集成。

课程设计特色

采用“概念→平台→框架→架构→项目”渐进路径。涵盖全栈实战，从 Dify/Coze 快速原型到代码级深度开发。聚焦高价值商业场景（电商、医疗、教育），引入 LangGraph 先进范式和 RAG 深度优化技术，确保契合企业生产环境。

关键技术清单

Agent应用开发与平台

1、核心理论：提示词入门、Agent构成要素、工具配备、规划执行、记忆机制
2、项目：商户运营管家 - 私有知识库搭建、电商/自媒体多场景AI助手搭建、Python调用工作流
3、本地化：Coze/Dify部署、Ollama/Xinference大模型部署

LangChain/LangGraph框架

1、LangChain模块：Model I/O、Chains、Memory、Agents抽象、Retrieval(向量数据库)
2、LangGraph进阶：图状思维、State管理、节点/边构建、流式输出、内部文档查询助手案例

高阶项目实战

1、项目：市场罗盘 - 场景化任务拆解、自主架构设计、多维度过程检查
2、项目：掌柜智库 - 基于LangGraph的可插拔RAG、多模态处理(MinerU)、多路召回、RAGAS评估
3、行业实战：好医智库/伴学智库（医疗报告解析/教辅生成）、掌柜问数（DataAgent/NL2SQL）

07 大模型 --
AI能力跃迁的核心基座展开

核心技能

理解 LLaMA 和 Qwen 系列模型的核心原理。
掌握大模型微调技术（SFT、PEFT、LoRA、QLoRA）。
掌握强化学习微调（RLHF、PPO、DPO、GRPO）与对齐流程。
具备分布式训练（DeepSpeed）与高性能部署（vllm）能力。
熟悉大模型在对话、文摘、内容生成等任务的方案设计与实现。

课程设计特色

深度剖析 LLaMA/Qwen 原理，全面覆盖微调全流程。特色引入强化学习与 DeepSeek-R1 思维链复刻技术。通过“文摘引擎”、“智能评论”、“电商小二”等项目，结合 Rasa 源码定制与 DIET 架构，提升处理复杂多轮对话与业务决策的能力。

关键技术清单

大模型微调与部署

1、模型原理：GPT、LLaMA、Qwen 系列核心架构详解
2、微调技术：PEFT、LoRA、QLoRA、DeepSpeed 分布式训练、数据集处理（Alpaca/ShareGPT）
3、工程实践：训练环境搭建、代码详解、模型合并打包、vllm 高性能部署、评估指标分析
4、项目：文摘引擎 - 基于 Qwen3-4B + LoRA 报表效率提升、异常归因与安全合规

强化学习与对话系统

1、RL理论：PPO、DPO、GRPO、RLHF 流程、复刻 DeepSeek-R1 思维链
2、项目：智能评论 - 奖励模型训练、PPO 强化学习对齐、人类偏好对齐实战
3、对话机器人：Rasa 源码定制、DIET 多任务学习、双引擎驱动策略、Action 调用外部 API
4、行业案例：尚医助手/知学助手/万应助手 - 医疗语境优化、Text-to-SQL、地理位置集成

08 多模态 --
打通跨域感知的AI新范式展开

核心技能

掌握指令模型和推理模型提示词规则。
掌握 Vision Transformer (ViT) 及 CLIP/ClipCap 核心原理与实现。
掌握扩散模型 (Diffusion Model) 与文生图技术 (Dall-E2)。
熟悉大模型结合办公软件、AI Agent 及工作流搭建方式提升效率。
能够实现“文搜图”、“图生文”及受控的“详情页生成”等复杂多模态任务。

课程设计特色

以“实战驱动+分层进阶”为核心，覆盖跨模态对齐（CLIP）与图像生成。通过“智能检索”与“智能发布（标题/详情页生成）”项目，应用 LoRA、ControlNet、IP-Adapter 等前沿技术，解决品牌视觉风格一致性与结构精准提取等工业挑战。

关键技术清单

多模态核心理论

1、视觉架构：ViT原理、从零实现图像分类
2、跨模态对齐：CLIP 文搜图、ClipCap 图生文原理与实现
3、图像生成：扩散模型 (Diffusion)、条件扩散模型、Dall-E2 核心原理

多模态项目实战

1、项目：智能检索 - CLIP模型续训、AdamW分组学习率、Chroma向量数据库检索闭环
2、项目：智能发布（标题生成）- 图像表征预计算、投影层映射、自回归采样生成
3、项目：智能发布（详情页生成）- Stable Diffusion + LoRA 风格微调、ControlNet 结构控制、IP-Adapter 细节还原

09 就业冲刺 --
大牛引路，冲击大厂展开

核心技能

从技术和项目两个角度按照企业面试要求复习。
掌握简历指导、职业规划、书写与投递技巧。
提升面试应答与模拟面试实战表现。

课程设计特色

围绕学员就业需求，多维度复习巩固技术点与项目。串讲经典高频面试题，总结项目经验，提供手把手简历指导与职业规划，解决就业过程中的全方位难题。

关键技术清单

面试强化与指导

1、技术点与项目串讲：全阶段技术复盘、学过项目亮点拆解
2、模拟考试：针对面试题库与项目实操进行考核
3、就业服务：简历书写指导（Word/网络）、模拟面试复盘、职业规划建议

本课程适学人群

希望转型
人工智能
大模型行业的
从事相关开发工作，
希望进一步
提升的
对新一代
AI大大模型开发
感兴趣的大学生
对人工智能AI
感兴趣，
希望系统学习的

全程护航
你们只管乘风破浪

从入学到就业，一站式陪跑服务，
助力职业生涯持续提升

入学测验 多方面考察适不适合学、适合学什么技术方向。

个性化预习方案 根据学员具体情况制定，帮你提前进入状态。

技术学习期 技术老师、辅导老师、班主任全程贯穿。

面试求职 就业老师1v1面试指导，职业素养课，简历指导，面试推荐。

毕业后免费充电 毕业后仍可按需学习,免费充电，持续提升。

职后护航 扶上马，再送一程，帮助学员解决工作中的问题。

全球人工智能浪潮正劲时代红利，先到先得！

人工智能技术人才缺口越来越大更高起点，等你挑战!

过去3年以来，人工智能（AI）领域的多个岗位持续面临人才短缺的问题

项目实战贯穿全程讲透电商，举一反三覆盖多行业

培养大模型人才需要这样的课程

核心技能

课程设计特色

关键技术清单

Python核心

数据结构&算法

核心技能

课程设计特色

关键技术清单

Linux与数据库基础

数据分析核心库

核心技能

课程设计特色

关键技术清单

数学基础与概述

经典模型算法

核心技能

课程设计特色

关键技术清单

Pytorch与神经网络

进阶架构与项目

核心技能

课程设计特色

关键技术清单

NLP核心技术

NLP项目实战

核心技能

课程设计特色

关键技术清单

Agent应用开发与平台

LangChain/LangGraph框架

高阶项目实战

核心技能

课程设计特色

关键技术清单

大模型微调与部署

强化学习与对话系统

核心技能

课程设计特色

关键技术清单

多模态核心理论

多模态项目实战

核心技能

课程设计特色

关键技术清单

面试强化与指导

本课程适学人群

全程护航你们只管乘风破浪

全国中心

北京基地

深圳基地

武汉基地

全球人工智能浪潮正劲
时代红利，先到先得！

人工智能技术人才缺口越来越大
更高起点，等你挑战!

项目实战贯穿全程
讲透电商，举一反三覆盖多行业

培养大模型人才
需要这样的课程

全程护航
你们只管乘风破浪