
多模态 AI 应用开发
课程介绍
融合视觉、语音、文本,构建全能 AI 系统
适合人群
- 对 AI 技术感兴趣的开发者
- 希望提升 AI 应用能力的产品经理
- 想要了解行业前沿的技术爱好者
课程详情
课程大纲
共 9 节课程
1. 第一章:多模态基础
- 1.1 1.1 多模态 AI 概述
- 1.2 1.2 GPT-4V 视觉理解
- 1.3 1.3 图文理解与生成
2. 第二章:语音交互
- 2.1 2.1 语音识别 ASR
- 2.2 2.2 语音合成 TTS
- 2.3 2.3 实时语音对话
3. 第三章:综合应用
- 3.1 3.1 智能视频分析
- 3.2 3.2 文档理解系统
- 3.3 3.3 多模态 Agent
¥699
请在微信中扫码购买课程
使用微信扫一扫