培训对象:证券行业战略规划、技术研发、投资研究、风控合规、客户服务等业务部门的管理及技术人员;
课程背景:
本课程结合AI大模型技术革命与证券行业数字化转型的双重背景,聚焦DeepSeek的核心技术突破及其在证券行业的应用潜力,解析指令模型与推理模型的技术差异,探讨低成本、高性能AI对证券业务模式的重构逻辑,帮助学员从技术认知、应用场景到战略布局全面掌握AI驱动的行业变革趋势。
课程收益:
培训完结后,学员能够:
1. **理解DeepSeek的技术特性**:掌握其低成本、高效率的核心优势及技术实现路径。
2. **区分指令模型与推理模型**:明确两类模型的技术差异及在证券业务中的应用场景。
3. **预判AI技术趋势**:分析推理模型未来可能具备的复杂决策、动态交互能力及其对金融智能化的推动。
4. **评估行业影响**:识别DeepSeek对投资研究、客户服务、风险管理等核心业务的效率提升路径。
5. **规划成本与算力策略**:掌握AI大模型成本优化方法及算力需求变化趋势。
6. **制定应对策略**:结合开源生态与行业竞争格局,设计证券机构的AI技术应用路线图。
两天培训课程大纲:
单元 | 大纲 | 内容 |
单元一 | DeepSeek的核心技术突破与行业意义 | 1. DeepSeek的技术架构解析* 1.1) MOE(专家混合模型)与MLA(多头潜在注意力)算法的创新。 1.2) 参数规模与算力效率:V3模型6710亿参数中仅激活370亿,训练成本557万美元的颠覆性意义。 **案例**:对比Meta Llama3与DeepSeek-V3的算力需求差异(H800 GPU数量减少87.5%)。 **讨论课题**:证券机构如何通过低成本AI模型降低技术投入门槛? 2. 性能评测与商业化潜力 2.1) 在MMLU、DROP等评测中超越GPT-4o的关键表现。 2.2) 开源模式对OpenAI闭源垄断的挑战:技术民主化与生态共建。 |
单元二 | 指令模型与推理模型的差异 | 1. 指令模型的核心逻辑 1.1) 基于用户指令生成结果,强调任务执行的准确性(如传统GPT系列)。 1.2) 局限性:缺乏动态推理过程,依赖大量监督微调数据。 2. 推理模型的范式革新 2.1) DeepSeek-R1的强化学习训练:跳过监督微调,直接通过逻辑链生成解决方案。 2.2) 关键能力:文档分析、数学推理、代码生成(AIME2024测试成绩79.8% vs. OpenAI-o1的96.7%)。 **案例**:某券商测试中利用DeepSeek-R1优化量化交易策略的回测效率。 |
单元三 | 证券行业的AI应用场景重构 | 1. 投资研究与资产管理 1.1) 自动化研报生成与多因子模型优化。 1.2) 实时市场情绪分析与事件驱动策略。 2. 客户服务与合规风控 2.1) 智能投顾的交互式决策支持(如“思考过程”可视化)。 2.2) 反洗钱与异常交易识别的动态推理能力提升。 **案例**:奇安信利用DeepSeek-R1实现安全威胁研判效率提升30%。 |
单元四 | AI成本优化与算力需求演变 | 1. DeepSeek对算力生态的影响 1.1) 训练成本降低20%-40%对资本支出的释放效应。 1.2) 推理算力需求增长:从训练密集型向应用密集型的转变。 2. 证券行业的算力策略 2.1) 混合云部署与国产算力替代(如海光信息、浪潮信息)。 **讨论课题**:如何平衡推理算力需求与GPU供应链风险? |
单元五 | 行业竞争格局与开源生态的机遇 | 1. OpenAI与DeepSeek的路线之争 1.1) 闭源收费 vs. 开源生态:技术壁垒与商业化闭环的博弈。 2. 证券机构的开源策略** 2.1) 参与社区共建 vs. 自主模型微调的路径选择。 **案例**:阿里云、腾讯云快速集成DeepSeek模型的开源实践。 3、企业部署模型和使用模型的成本将大大降低。 |
单元六 | 推理模型的未来趋势与高阶能力预测 | 1. 复杂决策与动态交互能力 1.1) 多模态融合:文本、数据、图表联动的投资决策支持。 1.2) 实时自适应学习:基于市场波动的策略动态调整。 2. 伦理与风险挑战 2.1) 模型幻觉的进一步降低与可解释性提升。 2.2) 监管科技(RegTech)与AI合规框架的协同演进。 |
单元七 | AI的这种变化下,企业和职员该如何应对 | AI大模型的时代下复合型人才需求的持续攀升 要求学习能力越来越强,尤其是对技术逻辑、 业务理解和技术工具的使用能力。 3、某些工作流程的重塑可能性 |
公司核心业务包括旅行式团建、培训式团建、主题式团建、策划式团建、体育式团建、户外式团建。起赢培训不断追求团建产品创新与服务超越,致力于打造成为中国最具影响力与创新力的团队建设品牌。
查看更多