声网发布aPaaS灵动会议 AI成为下一代视频会议的新方向

邮箱网 0条评论 1211次浏览 2024年09月25日星期三 09:42

9月24日消息，声网正式发布aPaaS “灵动会议”，该产品采用RTE Core 和 AI Core 的双引擎深度融合，能够灵活适配多种会议场景业务需求。

基于声网自研的AI Agent 框架，“灵动会议”能够兼容市场上主流的 ASR（自动语音识别）、LLM（大语言模型）和 TTS（文本转语音）技术，具备Workflow编排能力。尤其是声网的 AI 框架支持多模态大模型的集成，这意味着企业不仅可以使用单一模型（如语音识别模型），还可以将多模态的大模型能力（如图像、音频、文本处理等）融合到一起，满足更复杂的会议场景需求。

同时，通过“灵动会议”产品底层的AI框架，开发者可以高效地集成会前、会中、会后场景的多种 AI 功能，如AI会议纪要、实时翻译、AI助手等，满足实时互动和会议场景的需求。

开发者还能通过“灵动会议”的产品架构将这些 AI 功能独立对外赋能其他产品，这意味着企业不仅能在会议场景中实现智能化升级，还可以通过灵动会议的 RTC 与 SIP 网关互通功能，应用于如 AI 电话客服等场景，大幅降低客服成本，提升运营效率。

在集成方式上，“灵动会议”采用aPaaS低代码设计，通过提供模块化的API、UI组件和即插即用的集成功能，使得开发者可以在较短的时间内完成集成，无需进行大量的底层开发。如果UI不能满足，“灵动会议”可提供多层次API接口与插件机制，支持基于SDK Core层和 RTE PaaS 层的定制，满足多场景需求。

“灵动会议”支持 SFU+MCU 混合架构。“MCU 模块与 SFU 模块直接集成，抛弃了传统的网关架构，通过裸流通信技术，实现终端设备与云端的直接互通，解决了网关集成时的画质损失问题，并且混合架构支持 MCU 上的多个硬件终端与云端 SFU 的软终端之间的多画面灵活组合，用户可以自主选择多个视频流进行合成，不再局限于画中画模式。

此外，在部署方式上，“灵动会议”支持多种部署模式，包括私有化、混合云、公有云等，能够灵活适应企业的不同安全和合规要求。同时，“灵动会议”还支持混合云和公有云的无缝备份与切换，确保业务的连续性和数据的安全性。

会议系统正在经历从“信息通道”向“智能决策引擎”的转变，过去的会议系统只承担信息传递的功能，而如今，AI 赋能为会议提供了更多智能化的支持。那么，AI浪潮下，应该如何重塑会议与协作体验？

在谈到AI为视频会议带来的改变时，会畅通讯产品总监王晖提到，利用 AI 为企业客户提供定制化的功能，在会前、会中、会后都加入AI，让会议沟通更加有效率，开会体验更佳。科达-摩云视讯销售总监俞中则认为，随着底层音视频能力与AI自身学习能力的提升，视频会议的整体效果会演变得更加优秀，比如沉浸式的3D场景将会是 AI 大显身手的方向。

声网数字化会议解决方案负责人尚敬超认为，“AI 技术会让视频会议脱离工具属性，真正融入生活，例如原本成本较高的同声传译场景，通过 AI 也可以让多语言视频会议的成本进一步压缩，降低所有人的使用门槛。”

关于会议AI 的想象空间，京东科技协同办公业务部产品经理曾冠认为，“通过 AI 和穿戴设备，未来的沟通方式将从信息沟通变为“所见即所得”，帮助用户快速获取想得到的内容，从而更好的服务于工作。”尚敬超认为，“未来的会议主要是AI参与，人只需要最终下一个指令做决策，从而摆脱无穷无尽低效会议的束缚。而这背后，实时性和辅助决策也是最重要的两点。”（周小白）

声网发布aPaaS灵动会议 AI成为下一代视频会议的新方向

热门文章

推荐阅读