人工智能Agent智能体从科研教学到产业赋能高峰论坛-会议
AI辅助程序设计、软件研发、数据处理、图文/视频生成等全方位支持
各高校与企事业单位:
人工智能正经历以大模型(Large Language Models)与智能代理(AI Agent)为核心的技术范式跃迁,其理论突破与工程实践深度重塑科研方法与产业图景。为响应国家新一代人工智能发展规划,推动高水平AI人才培养与交叉学科建设,本课程体系深度融合理论基础、技术前沿与行业实践,系统构建从大模型原理到智能代理落地的知识图谱。官网:www.shengshiyuanhong.com.cn
课程以Transformer 架构演进为起点,溯源符号主义、连接主义与行为主义哲学思想,解析预训练、微调与强化学习(RLHF)的技术脉络;聚焦 DeepSeek-R1 等国产先进模型的推理优化、蒸馏部署与多模态扩展,揭示 Scaling Law 对智能涌现的驱动机制。同时,结合 LangChain、Coze、Dify 三大开发平台,通过模块化实验设计覆盖智能代理的感知-决策-执行全流程(记忆管理、工具调用、多步规划),并提供政务、医疗、金融等八大领域案例库,赋能科研选题与产教融合。
本大纲由高校人工智能教研团队联合产业技术专家共同编撰,既可作为研究生高阶课程教材,亦为教师提供跨学科教学改革范本,助力培养兼具理论洞见与工程能力的新质生产力人才。
一、时间安排及地点
2025年9月5日—9月7日 线上:腾讯会议直播,线下:北京工业大学
您 注:线上参加使用腾讯会议直播,提供三天全程回放视频,不限次数回看学习。
二、课程收获及优势:
1、加入Agent研学交流群,获得学习共同体的帮助与支持;
2、参加本次会议后,后期同一位老师的 Agent 会议本人均可免费参加,不限次数;
3.掌握AI技术演进:从符号主义到Transformer,深入理解LLM预训练、微调(SFT/RLHF)及三大流派思想,夯实理论基础。
4.精通企业级AI应用:熟练运用提示工程(PE)、检索增强(RAG)与AGILE框架,解决实际业务与学术研究中的挑战。
5.提升模型交互能力:通过角色扮演、思维链(CoT)等高级技巧,精准驱动模型完成分析、代码生成等任务。
6.掌握多模态技术:理解CLIP、Stable Diffusion原理,实现文生图/视频创作,助力科研与产品设计。
7.优化推理与部署:掌握DeepSeek R1推理能力,学习模型蒸馏与本地化部署满足隐私与效率需求
8.开发智能体工具:基于LangChain/Coze/Dify平台,构建文献助手、客服工具等,实现自动化研究与业务流程增强。
三、主讲专家:
现任高校教授,人工智能领域一线专家,多个国际杂志的评审专家,完成多项图像、语音,nlp等相关领域的人工智能企业项目,研发经验丰富,拥有30多项授权国家发明专利,100余篇人工智能及其他领域的国际主流期刊及顶级会议论文发表,出版人工智能书籍2部。
四、联系方式
联系人:刘老师 手机/微信:18311050656 邮箱:1549935216@qq.com
课程安排 | 学习内容 |
一、 大模型演进与AI Agent概览
| 1. AI 演进简史:从规则系统到大规模预训练 (1) 1930s -1950s 人工智能的理论奠基 (2)1956-1970s 符号主义与专家系统的兴衰 (3)1980s-1990s 神经网络与连接主义的复兴 (4)2000s-2012 从特征工程到端到端的沉默十年 (5)2012 -2020 深度学习架构从 CNN、 RNN 到 Transformer (6)2020-2022 预训练范式到 GPT-3的智能涌现 2. AI的三大核心要素:数据、算法、算力 3. AI三大流派及其哲学思想 (1)符号主义:让 AI 像“哲学家 ”一样思考 (2)连接主义:神经网络背后的学习魔法 (3)行为主义:没有思考,只有本能的反应 3.AI 2.0五个阶段:对话者到组织者 L1|对话者: AI 学会了“说话 ”(Transformer + RLHF) L2|推理者: AI 开始“像人一样思考 ”( CoT + RL) L3|智能体:能干活的 AI,算力即劳动力(Planning + Tool Use) L4|创新者:从知识应用走向知识创造(AI4Science + AlphaFold) L5|组织者:迈向通用人工智能 AGI (多智能体 + 空间智能) 4. Transformer与LLM核心技术 (1)Transformer诞生背景 (2)Transformer 技术解读《Attention is All You Need》:输入与输出、编码器、解码器、多头注意力机制、位置编码 (2)ChatGPT 的诞生:预训练和模型微调 Fine-Tuning 与强化学习 RLHF 5.AI Agent 概念解读与最新进展 (1)AI Agent 基本概念 (2)Manus的介绍 (2)AI Agent 主流开发平台: Coze、 Dify、 langchain介绍 |
二、 大模型应用与落地实践 | 1. 大模型落地挑战三视角:企业、供应商、行业 2.大模型企业落地方法论: AGILE 3.大模型企业落地最佳实践: PE、 Rag 与数据工程 4.大模型企业落地常见应用场景解读 (1)政府服务:公文写作、政策解读、舆情分析、 12345 客服、城市治理、 智能问数 (2)法律服务:司法审判、公证文书、合同审查、法律研究等 (3)金融行业:智能投顾、智能投研、智能理财、投研报告等 (4)电商行业:客户洞察、模特试衣、智能选品、文案生成、智能客服等 (5)制造业:辅助 CAD、辅助 CAE、多模态质检、预测性维护等 (6)能源电力:时序预测、多模态知识问答、设备巡检、 CAD 解析等 (7)医疗健康:辅助诊断、合力用药、医学研究、患者管理等 (8)教育培训:作业批改、课件设计、口语陪练、作文测评、智能阅卷、 AI 硬件等 (9)软件研发:代码补全、代码调试、单元测试、 UI 设计等 |
三、 提示词设计与提示工程
| 1.提示词工程基本概念 2.提示词常用结构和要素 (1)上下文和背景信息 (2)具体问题或任务 (3)目标和期望结果 (4)限制条件和要求 (5)示例和参考资料 3.提示词设计技巧与策略 (1)框选和分割信息 (2)指定输出格式 (3)确定立场(角色) (4)Few-shot (5)Step by Step 4.常用提示词模板 5.大模型输入和输出长度的控制 (1)使用修饰语 (2)限定回答的范围 (3)通过上下文限定 (4)限定数量 (5)使用组合策略 6.langGPT提示词介绍与应用 (1)LangGPT平台提示词设计理念 (2)Role模板 (3)模板使用步骤 (4)LangGPT典型提示词模板 |
四、 多模态大模型与应用
| 1.多模态大模型的概念、分类及原理 (1)多模态大模型能力演化路线图: -图文联合 -多模态生成 -多模态智能体 (2)多模态大模型核心原理: -统一嵌入与解码器架构 -跨模态注意力机制及融合策略 (3)典型多模态模型介绍 -CLIP:理解图像和文本之间的关系 -ViT :用 Transformer 架构统一视觉任务 -Stable Diffusion:文生图开源大模型 2. 多模态生成大模型使用技巧及实操 (1)多模态大模型的概念与进展 -文生图 -图生图 -文生视频 -3D生成 -统一多模态大模型 (2)图像生成大模型应用与提示词设计技巧 -正面提示词构建:主体、风格、细节、光影 -负面提示词运用:去除不需要的元素与瑕疵 -提示词微调技巧:权重调整、风格混合、结构控制 (3)视频生成大模型应用与提示词设计技巧 -主体与动作描述 -场景设定与光线控制 -视觉细节与情感氛围 -摄影技巧(镜头类型、运动方式) (4)3D生成提示词应用与提示词设计技巧 -视角一致性与多视图生成 -几何结构与纹理细节 -使用参考图与草图引导 (5)应用 -基于通义万相的图片生成 -万相视频制作 |
五、 推理模型关键技术分析及使用技巧(DeepSeekR1) | 1.推理模型的基本概念与核心目标 (1)思维链与推理模型 (2)思维链与推理模型的诞生 (3)推理模型o1 重新定义 scaling law (4)从training 到 Inference ,scaling law 持续生效 2.推理模型的架构与工作原理 (1)问题拆解与表示 (2)证据检索与知识激活 (3)多步推理与验证 (4)综合决策与输出生成 3.DeepSeek R1 的发展与能力提升 (1)R1-Zero与R1 (2)监督微调+ 强化学习(SFT + RL) (3)MOE机制的理解 (4)DeepSeek 重塑全球大模型生态 (5)DeepSeek-V3、R1和联网搜索 4. 推理模型提示词技巧及实操 (1)指令模型与推理模型策略差异 (2)推理模型使用技巧与思维链CoT (3)指令模型与推理模型策略差异 (4)模型的选择和综合利用 4.DeepSeek R1蒸馏小模型及本地化部署 (1)AI蒸馏的理解 (2)R1的本地化配置与部署 (3)R1与第三方应用结合 (4)基于DeepSeek 的本地知识库增强 |
六、 Agent原理与架构
| 1. Agent特征与核心架构 (1)关键特征 (2)核心架构 -感知模块 -状态表示模块 -决策模块 -执行模块 -记忆与知识模块 -目标与反馈机制 2.Agent工作模式 (1)感知–决策–执行循环:Agent 基本流程 (2)多种驱动模式: -目标导向 -事件触发 -用户交互 -多Agent 协作 3.Planning: 多步计划与任务分解 (1)Reflection(反思) (2)Self-critics(自我批判) (3)Chain of thoughts(思维链) (4)Subgoal decomposition(子目标分解) 4. Agent工具使用: ReAct + Function Calling + MCP (1)工具在 Agent 中的角色:连接虚拟与现实的“手”和“脚” (2)OpenAI Function Calling 使用最佳实践 (3)常见Agent Tools:联网、绘图、代码解释器等 (4)ReAct(Reason + Act)机制:推理与行动的结合 (5)MCP(Model Context Protocol):Agent 时代的“HTTP 协议” (6)Function Calling 与 MCP 的对比与适用场景 5.Memory:记忆管理与知识检索增强 RAG (1)记忆分类:短期记忆 vs 长期记忆(对话 & 用户上下文持续性) (2)实现方式:向量数据库+ RAG 检索机制增强生成质量 6.Agent 开发步骤与工作流程 (1)明确目标与应用场景 (2)设计 Agent 的核心能力模块 (3)准备数据资源与工具接口 (4)构建提示词与任务链条(Prompt Flow) (5)测试、评估与优化迭代 (6)部署与集成 (7)维护与迭代运营 7.AI Agent 主流开发平台对比:Coze、Dify、langchain |
七、 基于Coze的AI Agent 开发实践
| 1.COZE 平台功能讲解及关键组件介绍 (1)平台定位及适用场景 (2)核心组件详解 -模型引擎(文本& 多模态) -记忆管理机制(短期vs 长期) -知识库与RAG框架 -工具调用接口 -ChatUI 交互卡片模块 2.初版 ChatBot: 构建初版知识文档助手 (1)提示工程搭建 (2)模型选择与能力解读 (3)知识库+RAG (4)记忆管理 (5)基础工具调用技能 3.进阶ChatFlow:打造基于意图识别的电商客服 (1)工作流与对话流构建 (2)工作流中的节点 (3)节点的变量设置 (4)流程编排和分支路由构建 (5)分支路由的知识检索增强 (6)多模态数据的理解与设置 4.进阶WorkFlow:论文理解与总结助手 (1)单论文理解助手 -pdf文件的上传 -文件文本的获取 -大模型的解读和信息提取 -文本的写入 (2)批量文件的读取 -批量文件上传 -批量文件读取 -批量文件解析 -变量聚合 -批量信息的提取和写入 5.进阶WorkFlow文献搜索:知网文献洞察助手 (1)知网插件的配置和应用 (2)信息和论文题目的提取 (3)大模型的总结和提炼 (4)提取信息的写入 |
八、 基于Dify的智能体开发实践
| 1.Dify 功能定位 (1)Dify 平台概述与定位与发展历程 (2)Dify 产品功能介绍及关键组件详解 (3)Dify 开发优势 2.Dify环境搭建 (1)部署方式:本地部署与云端部署 (2)Dify 教育版特点与适用场景 (3)主流LLM 接入与 API 配置 (4)案例实操:低代码/ 无代码构建首个应用 3.工作流节点与变量机制详解 (1)节点类型与作用 -开始节点/ LLM 节点 -知识检索、问题分类、条件分支 -代码执行、模板转换、文档提取器 -变量聚合与赋值、迭代、参数提取 -HTTP 请求、Agent 节点 (2)变量类型与使用场景 -系统变量/ 环境变量 / 会话变量 4.Chatflow设计实操:智能问答助手 (1)知识库管理:数据准备、清洗、索引构建 (2)节点编排与参数设置 (3)节点测试与整体流程调试 (4)发布与调用 (5)案例实操:分类检索型智能文档助手实现 5.Chatflow设计实操:基于dify的文章理解助手搭建 (1)单篇文章助手 -文件上传、文本提取 -大模型理解与参数设置 -输出格式与多轮交互优化 (2)批量文章助手 -批量文件上传与管理 -迭代器节点的使用 -批量文档提取与批处理输出 6.WorkFlow设计实操: 长文生成自动化 (1)关键词输入与主题定位 (2)标题与大纲生成 (3)正文分段迭代生成与优化 (4)结果合并与最终输出 7.WorkFlow设计实操: 基于谷歌搜索的论文总结 (1)插件与API 集成(搜索、数据库、第三方服务) (2)MCP 协议与扩展能力 (3)流式交互配置(SSE / HTTP) (4)基于谷歌搜索的论文摘要助手实现 8.Agent 工作流设计与多智能体 (1)Agent 机制介绍 (2)多Agent 协作开发 (3)流程可视化与监控 (4)Agent实操案例:股票分析助手 |
九、基于langchain的AI Agent 开发实践
| 1.LangChain 核心组件与设计模式 (1)LLMs:大语言模型调用与配置 (2)Prompt Templates:系统化提示词模板设计 (3)Chains:串联多个处理步骤 (4)Agents:自主决策与动态工具调用 (5)Tools:API / 函数 / 数据库 / 搜索引擎 / 计算器等 (6)Memory:上下文维持与知识增强(ConversationBufferMemory、VectorStoreRetrieverMemory 等) 2.LangChain Agent分类与使用场景 (1)Zero-shot ReAct Agent (2)Conversational Agent (3)Plan-and-Execute Agent(PlanAndReact) (4)Self-Ask-with-Search Agent 3.LangChain 记忆管理与检索增强 RAG (1)短期记忆vs 长期记忆 (2)短期记忆实现方式实操 (3)长期记忆:向量数据库操作(存储、检索、更新) (4)案例实操:基于RAG 的科研助手(知识库构建 + 智能问答) 4.LangChain的推理与工具使用 (1)工具调用最佳实践:OpenAI function calling (2)Agent Tools:联网、绘画、代码解释器等 (3)ReAct(Reason + Act)模式:结合推理与工具调用 (4)MCP 协议设置与调用方式(stdio / sse / streamable_http) (5)案例实操 -基于MCP 的 Agent 工具调用 -智能邮件助手(联网搜索+ 自动邮件发送) 5.LangGraph中的流程图构建实操 (1)状态机思维:节点、边、停机条件与错误恢复 (2)状态机:状态建模、节点与边、条件分支、循环与中断、错误恢复与持久化、以及流程图导出 (3)流程图结构:串行/并行/路由/循环 (4)案例实操:使用LangGraph 编排“规划—执行—校对—汇总”的四步流。 6.LangGraph 的多智能体编排 (1)从单体Agent → Workflow → 多 Agent 的迁移路径 (2)设计理念与常见模式 -Supervisor(监督者)模式:由一个“调度/仲裁”节点决定下一个执行的 Agent(推荐入门) -Router(路由)模式 -Peer-to-Peer(点对点)模式 -Map–Reduce(并行—汇总) (3)案例实操:多种模式下的多智能体构建与运行 |
十、课程总结与答疑讨论 | 1.课程总结与现场答疑 2.关键问题解析 3.相关学习资料分享与拷贝 4.学后交流、微信群建立等 |
五、 参会对象
教育工作者:助力教师减负增效,打造智慧教育新范式。
软件与IT行业:显著提升开发效率,优化软件开发生命周期。
金融行业(银行/证券/保险):实现金融风控与决策的智能化升级。
医疗健康领域:缩短科研周期,推动医疗智能化发展。
制造业与工业:实现生产流程优化与质量管控升级。
能源与电力行业:实现智慧能源管理,提升运维效率。
法律行业:大幅提升法律工作效率,降低人工处理成本。
政府与公共服务:行政流程自动化优化,全面提升服务效率与决策智能化水平。
六、收费标准及证书
A类:统一收费3980元/人(会议费、资料费、指导费、证书认证费、发票费)中职人才评测中心颁发:AIGC人工智能应用工程师”高级证书。
B类:统一收费5580元/人 (会议费、资料费、指导费、工信部证书认证费、发票费) 由工业和信息化部教育与考试中心颁发:“人工智能应用工程师”高级证书,官网可查,该证书可作为有关单位专业技术人员能力评价、以及求职应聘和从业人员加薪、晋升、考核等任职的重要依据。申报资料:请准备两寸蓝底照片、身份证电子版即可。
七、优惠政策(以下优惠不可同时享有)
一、在校学生报名可优惠300元
二、2 人报名每人可优惠200 元 三、3 人报名每人可优惠300 元
四、4 人报名每人可优惠400 元 五、5 人以上报名可免费赠送一个名额(第6人免费)
报 名 微 信: