能实现说话人分离和内容摘要，音视频转文字软件「魔音助手」要深耕会议场景

魔音助手不止能完成对语音内容的速记。

「魔音助手」是一款音视频转文字的效率工具，可以帮助企业做语音、视频会议记录，有会议内容检索，自动会议摘要和音视频编辑等功能。适合学习、会议、采访等场景。

魔音助手不止能完成对语音内容的速记。在魔音助手软件中，用户可以录制会议声音或视频，软件能自动生成文字内容并分辨不同的说话人。被提到的文字用光标显示，用户可以根据文字的时间点做简单的剪辑工作。此外，魔音助手有文本搜索功能和自动摘要功能，方便用户选取录音核心内容，进行会议复盘。

据前瞻研究院数据，2018年我国的智能语音产业市场规模为48.6亿元，之后每年市场规模增长率都超过25%，预测2021年将突破100亿元的市场规模。这一产业拥有较好的市场前景。而且，由于疫情爆发，人们逐渐适应智能办公学习。魔音助手团队认为语音、视频会议是新的市场机会，从今年2月开始开发针对工作学习场景的转录软件。

在语音识别准确率方面，魔音助手搭建了云端自训练模型，训练数据大多是公开会议、学习课程、语音会议等特定场景，专门为工作和学习场景定制，识别率高。市面上的录音转文字记录工具大多使用通用模型，需要适应各种场景，缺少针对性。此外，魔音助手运用个性化语音识别引擎（PASR），能为每个账号能形成不同的语音模型结构，自适应学习用户常用的专业术语和口音，在用户校对的过程中变得更智能。随着用户的不断使用，识别准确度会越来越高。

魔音助手的转录可以实现说话人分离的功能。采用的声纹技术能将每个声音转换为固定维度的声纹向量，实现声纹比对。在行业中，人声识别是一个交叉学科，需要声纹识别、语义识别等算法共同实现，技术壁垒高，因此市场上拥有这一功能的语音转文字工具较少。魔音助手将声纹识别与语义内容结合，对说话人的识别正确率可以到达70%-80%。另外，魔音助手采用的自然语言处理模型可以理解语义并对文本纠错，自动修改病句和口误，提高文本可读性。

在辅助功能方面，魔音助手可以实现语义提取，通过分析上下文关联信息自动提取会议摘要。另外，魔音助手支持转录文本搜索功能，可以搜索文本内容定位语音位置。魔音助手还能实现视频语音转录，为视频生成字幕。用户可以根据字幕内容编辑对应视频。

目前，魔音助手的收入主要来自于企业付费。产品目前为个人用户免费。未来，魔音助手可能推出个人付费会员版本，为个人会员用户提供实时转录等专属功能。目前团队技术人员有十几人左右。创始团队成员来自于豌豆荚、快手、会小二等互联网企业，均拥有产品与企业服务经验。AI技术骨干来自于科大讯飞、中科院、百度、字节跳动等一线机构。

各大互联网公司也发现了这一市场机遇，在线上会议记录功能上发力。11月18日，飞书在“2020飞书未来无限大会”上推出了“飞书妙记”功能，能够生成会议语音文字稿、区分说话人、拥有搜索和摘要提取功能。

面对线上会议的市场热度，魔音助手表示自己是一个开放式软件，愿意与在线办公、在线学习平台成为合作伙伴。

Source: 36Kr

能实现说话人分离和内容摘要，音视频转文字软件「魔音助手」要深耕会议场景

Join Newsletter

Written by Moyin (魔音助手)