news,

能实现说话人分离和内容摘要,音视频转文字软件「魔音助手」要深耕会议场景

Moyin (魔音助手) Moyin (魔音助手) Follow Nov 25, 2020 · 1 min read
能实现说话人分离和内容摘要,音视频转文字软件「魔音助手」要深耕会议场景

魔音助手不止能完成对语音内容的速记。

「魔音助手」是一款音视频转文字的效率工具,可以帮助企业做语音、视频会议记录,有会议内容检索,自动会议摘要和音视频编辑等功能。适合学习、会议、采访等场景。

魔音助手不止能完成对语音内容的速记。在魔音助手软件中,用户可以录制会议声音或视频,软件能自动生成文字内容并分辨不同的说话人。被提到的文字用光标显示,用户可以根据文字的时间点做简单的剪辑工作。此外,魔音助手有文本搜索功能和自动摘要功能,方便用户选取录音核心内容,进行会议复盘。

据前瞻研究院数据,2018年我国的智能语音产业市场规模为48.6亿元,之后每年市场规模增长率都超过25%,预测2021年将突破100亿元的市场规模。这一产业拥有较好的市场前景。而且,由于疫情爆发,人们逐渐适应智能办公学习。魔音助手团队认为语音、视频会议是新的市场机会,从今年2月开始开发针对工作学习场景的转录软件。

在语音识别准确率方面,魔音助手搭建了云端自训练模型,训练数据大多是公开会议、学习课程、语音会议等特定场景,专门为工作和学习场景定制,识别率高。市面上的录音转文字记录工具大多使用通用模型,需要适应各种场景,缺少针对性。此外,魔音助手运用个性化语音识别引擎(PASR),能为每个账号能形成不同的语音模型结构,自适应学习用户常用的专业术语和口音,在用户校对的过程中变得更智能。随着用户的不断使用,识别准确度会越来越高。

魔音助手的转录可以实现说话人分离的功能。采用的声纹技术能将每个声音转换为固定维度的声纹向量,实现声纹比对。在行业中,人声识别是一个交叉学科,需要声纹识别、语义识别等算法共同实现,技术壁垒高,因此市场上拥有这一功能的语音转文字工具较少。魔音助手将声纹识别与语义内容结合,对说话人的识别正确率可以到达70%-80%。另外,魔音助手采用的自然语言处理模型可以理解语义并对文本纠错,自动修改病句和口误,提高文本可读性。

在辅助功能方面,魔音助手可以实现语义提取,通过分析上下文关联信息自动提取会议摘要。另外,魔音助手支持转录文本搜索功能,可以搜索文本内容定位语音位置。魔音助手还能实现视频语音转录,为视频生成字幕。用户可以根据字幕内容编辑对应视频。

目前,魔音助手的收入主要来自于企业付费。产品目前为个人用户免费。未来,魔音助手可能推出个人付费会员版本,为个人会员用户提供实时转录等专属功能。目前团队技术人员有十几人左右。创始团队成员来自于豌豆荚、快手、会小二等互联网企业,均拥有产品与企业服务经验。AI技术骨干来自于科大讯飞、中科院、百度、字节跳动等一线机构。

各大互联网公司也发现了这一市场机遇,在线上会议记录功能上发力。11月18日,飞书在“2020飞书未来无限大会”上推出了“飞书妙记”功能,能够生成会议语音文字稿、区分说话人、拥有搜索和摘要提取功能。

面对线上会议的市场热度,魔音助手表示自己是一个开放式软件,愿意与在线办公、在线学习平台成为合作伙伴。

Source: 36Kr

ai
Join Newsletter
Get the latest news right in your inbox. We never spam!
Written by Moyin (魔音助手)
智能会议记录、课程笔记工具