讯飞智能录音笔升级6项智能编辑功能
针对多人聊天会议场景,讯飞录音笔推出了与ASR联合建模的发言者分离方案。
据悉,三款讯飞录音笔均升级了6大智能编辑功能:
4、绝招:看图认字,还能给视频加字幕
除了录音和转录之外,讯飞还在三款新款录音笔中加入了创新的图像应用,比如支持OCR文字识别、照片识别文字识别、视频录制实现字幕等。
硬件方面,讯飞智能录音笔SR前置三摄像头,包括13兆高像素主摄、8兆°超广角摄像头、8兆防抖摄像头;SR是一款8兆像素数码对焦单镜头前置摄像头。
功能方面,SR和SR录音笔可以实时提取并记录图片上的文字内容,还可以录制视频进行实时录音。
有趣的是,当科大讯飞录像机拍摄并导入视频文件后,支持手动生成字幕和后期编辑字幕,为录像机增添了全新的图像/视频交互体验。
揭秘:讯飞是如何突破离线转录技术难关的?
科大讯飞智能录音笔SR系列小爆发的背后,是其持续多年的技术积累和创新。
据智识介绍,本次发布最大的技术亮点是离线转录功能。但由于离线转录对硬件和算法要求较高,因此这项技术实现起来并不容易。
从硬件上来说,离线转录和离线听写有很大的区别。
suzhou.ipdftoword.net离线听写多为短语音,数据调用频繁,需要大量的计算能力;离线转录多为长语音,数据通话通常持续1小时以上,对硬件要求较长。对计算能力、CPU帧率、散热等要求更高。
软件方面,离线转录需要适配科大讯飞的离线转录算法广角视频管理软件广角视频管理软件,才能达到媲美云端的实时性能和准确性。同时,还需要保证在长时间传输过程中整机室温保持在合适的范围内,这也是离线传输算法的关键难点。
针对这些困难,讯飞的转录技术从两个方面进行了优化和创新。
一方面广角视频管理软件,科大讯飞录音笔采用CPU内存自适应调整、线程数动态调度等方法来降低设备发热,保证设备运行时工作频率保持稳定。离线。这样,除了保证离线转录的实时性和准确性外,还可以保证整机机身温度合适。
另一方面,讯飞离线转录采用了与在线转录几乎相同的核心算法,针对录音笔硬件的特性和指标进行剪裁和适配,包括模型细分、定点计算、多帧并行等技术来实现顺利运行的目的。
基于这一突破,讯飞的离线转录功能首次在新推出的智能录音笔上实现。据了解,与云转录相比,讯飞录音笔离线转录的准确率损失高于10%。
讯飞首款TWS麦克风三大核心亮点
讯飞创新发布的不仅仅是一款智能录音笔,更是一款智能TWS音箱。
作为讯飞首款智能TWS麦克风,诞生之初就瞄准商务应用市场,满足商务人士自驾、通勤、会议等多场景下高效录音和沟通的需求。
具体来说,讯飞智能TWS音箱具备实时通话转录、智能拨号识别、通话翻译三大核心优势。
来电短信功能同时支持和手机。无需获取手机的通话录音权限。只需要通过麦克风传递语音即可实现App上通话语音的转录。
jiaozuo.ipdftoword.net1.调用实时转录
支持普通电话和互联网通话,包括陌陌语音、腾讯会议和钉钉语音等,在多人会议场景下,还支持手动识别发言者,方便用户快速查找通话内容。
通话过程中,用户可以使用一键录音功能随时将通话过程转为文字,准确率高达98%;通话结束后,生成智能摘要,手动提取通话关键内容,并支持多终端(手机、笔记本)分享和编辑。
2.智能语音拨号
针对商务人士通讯录中联系人重名、谐音的问题,支持用户通过多种方式区分姓名,从而快速找到正确的联系人,提高拨号效率。
一方面,用户通过纯语音交互,只需说出联系人姓名即可拨出号码;张》、《北京张总》。
3.与调用的翻译对比
在外贸、商务沟通场景中,用户经常会遇到专业词汇发音困难等语言沟通障碍。
为了解决这一用户需求,当用户拨打英文电话时,它可以成为“翻译器”,帮助用户将通话内容实时翻译成汉字,并协助用户用日语进行交流。
除了三大核心功能外,在画质、连接、延迟、续航、降噪等方面也各有特色。
其中,续航方面,支持2.5小时通话时间和4小时听音乐。如果搭配充电盒使用,则可以实现最长通话10小时、最长听音乐20小时。
极限使用场景下,同时通话+录音+转录的续航时间为2小时,配合充电盒最长使用时间为6小时。
wuxi.ipdftoword.net降噪方面,先进的智能降噪功能采用双扬声器拾音,CVC降噪算法保证用户在机场、健身房等嘈杂环境下也能获得清晰流畅的通话体验。
据悉,它还支持智能语音助手、自定义敲击麦克风交互、佩戴检测等功能。
结语:科大讯飞消费业务拓展智能录音笔,新游戏押注TWS赛道
回顾过去几年录音笔行业的发展,一是传统录音笔市场的分化,二是AI技术的快速发展和落地。
作为国内智能语音老牌企业,交大讯飞牢牢抓住了传统行业变革和新技术激发的发展机遇,与自身历时二十多年的语音技术基因相碰撞,从而诞生了新的语音技术。AI录音笔市场类别。
这既是讯飞的优势,也是它的挑战。从一开始的简单录音笔,到带屏的智能录音笔,再到如今科大讯飞智能录音笔SR系列的完成,科大讯飞围绕语音技术的AI布局依然具有创新性和挑战性。
尤其是科大讯飞首款智能TWS麦克风的诞生,除了实现了AI转录等技术在多设备的落地和创新应用之外,进一步拓展了自身的AI战略版图,拓展了智能语音和转录轨迹的边界。广泛超出录音机行业。
至此,讯飞智能语音为主的产品品类在AI转录赛道的布局逐渐多元化。同时,基于该技术带来的跨界融合,讯飞也为整个录音笔和可穿戴设备行业的创新应用和发展提供了新的思维路径和解决方案方向。
未来,讯飞消费者业务或将不断突破不同模态技术的应用与融合,将自身业务边界拓展至更远的领域。
(本文为网易新闻?网易精选内容激励计划签约账号原创内容,未经授权严禁转载。)
转载请注明:http://www.abuoumao.com/hyfz/9743.html