多模态 AI 应用开发

多模态 AI 应用开发

课程介绍

融合视觉、语音、文本,构建全能 AI 系统

适合人群

  • 对 AI 技术感兴趣的开发者
  • 希望提升 AI 应用能力的产品经理
  • 想要了解行业前沿的技术爱好者
课程详情
多模态 AI 应用开发 详情图 1
课程大纲
9 节课程

1. 第一章:多模态基础

  • 1.1 1.1 多模态 AI 概述
  • 1.2 1.2 GPT-4V 视觉理解
  • 1.3 1.3 图文理解与生成

2. 第二章:语音交互

  • 2.1 2.1 语音识别 ASR
  • 2.2 2.2 语音合成 TTS
  • 2.3 2.3 实时语音对话

3. 第三章:综合应用

  • 3.1 3.1 智能视频分析
  • 3.2 3.2 文档理解系统
  • 3.3 3.3 多模态 Agent
¥699

请在微信中扫码购买课程

使用微信扫一扫