新智元报道
编辑:Q
【新智元导读】图像与人工智能的结合已经擦出了很多火花,而对于「声音」来说,AI能做的还有很多。
关于「声音」和「科技」的碰撞,大家最先想到的一定是1875年时贝尔发明了电话,而电话只能实时的传送声音信号,并不能把声音存储起来。
而爱迪生对于存储声音很感兴趣,他很想证明「要把人的声音完整地储存起来,需要的时候再放出来,是完全可以做到的」,经过多次的实验以后,终于在1877年诞生了「留声机」。
此后,人们对于声音与科技结合的探索一直在继续,录音的相关技术和设备也在快速的发展当中。
时至今日,我们的智能手机当中早已实现了录音功能,但是拾音的范围很窄,清晰度不高,录音文件容易丢失,对于专业用户来说,功能和体验还有所欠缺。根据调研,81%的用户有语音转文字的需求,在人工智能时代,精度和效率已经成为不可以忽视的两大要素,而传统的数码录音设备,对于不同场景下产生的不同需求,并没有个性化的满足,因此,面向人工智能时代的智能录音设备应运而生。
全离线转写,多变场景也应对自如
科大讯飞智能录音笔SR302 Pro是全球首款支持「全离线转写」(Full-Offline Transcription)的智能录音设备,通过物理通讯隔绝方式,实现所有的录音、转写得到的音频文件均存储在本地,并且录音的文字实时可见,相当于大脑的延展,让你随时随地记录重要信息。
这款录音笔不与其他外部设备或云端联网,在硬件方面也未搭载Wi-Fi及蓝牙通讯模块,从物理层隔绝了信息联网分享,让信息安全得到更高级别的保障。
「全离线转写」功能主要面对户外、机场等地区或公安、检察院、医疗等对保密有特殊要求的场景,录音及转写文件只能通过USB连接电脑进行传输,既阻止信息通过联网方式分享,同时也进一步保障内网与外网的隔绝;也适合记者采访,律师取证,商务谈判,会议速记等主流使用场景,它的功能分类很多,比如有演讲录音、会议录音、采访录音、标准录音的选项,可以看出,整个录音笔的专业度很高。
对于录音笔来说,最基础和重要的功能当然还是录音。
平时大家最苦恼的问题就在于:在大型的会议室、报告厅、演播厅或者阶梯教室的后排,经常会听到周围人的窃窃私语、空调的声音和人员走动的环境噪音,导致无法清晰的听到主讲人的声音,对讲话的内容无法判断,在回听录音时,需要放大声音进行确认演讲信息。
而讯飞智能录音笔SR302 Pro具备专业级的录音效果,2颗10mm定向麦克风和4颗全向麦克风组成2+4麦克风阵列,可360°全方位覆盖声源,最远可达15米的拾音距离。讯飞自研的降噪技术,在不同场景下可以匹配相应的场景算法进行智能降噪,有效剔除噪音,从而达到更佳的录音效果。
除了录音更智能和拾音更清晰,讯飞智能录音笔SR302 Pro更大的看点还在于「智能编辑」功能:
支持中英文混读识别,能够实现非人声和语气词、叹词、重复词的自动过滤;
智能分析语义可以实现自动分段,书签标记和重点标记等功能,让后期整理变得轻松、简单,效率事半功倍;
还有数字规整功能,智能区分中文一二三和数字123,转写时不杂乱,获得更好的使用体验。
此外,该机型离线转写除了支持中文的12种方言转写以外,还支持将英、日、韩、俄的语音转写成文字,可以一边收音,一边实时转写,方便与外籍人士开会时的内容理解与记录。
SR302 Pro搭载的全新八核高性能处理器让AI算力大幅度提升,转写的速度快上加快,效率十分给力。
考虑到高频使用录音笔的用户,讯飞智能录音笔SR302 Pro还搭载了一颗2000mAh的电池,得益于整机对于UI和运算的优化,可以满足大部分使用场景下的持续录音需求。机身底部采用主流的Type-C接口,实现快速充电与数据传输。
这款录音笔更配备了32GB大容量存储空间,可以存储大约190小时的录音,满足更长的无网络环境下的录音时长需求。不管你的客户要提出多少的需求,还是老板在开会时讲多长的故事,基本都不用担心这款录音电量不足的问题。
此外,讯飞智能录音笔SR302 Pro小巧的机身还配置了一块2.0英寸触摸屏,大约是主流手机一半的尺寸,易于单手掌握,可轻松放置于衣服口袋或背包夹层中。
外观依旧是经典的商务风格,机身正面采用55道金属工艺制成,背面3层手感漆雾化喷涂,拥有着舒适的手感和颜值,也显得机器更加高端。
屏幕下方,讯飞智能录音笔SR302 Pro还提供了经典的圆盘方向键、确认键及录音的实体按键,在各类场景下用户可以选择更优、更便捷的操作方式。用户通过屏幕或实体按键都可以实现对录音笔的快捷操控和切换。同时,点击录音开始,转写文字可以实时在屏幕显示,便于进行随时标记。
想象一下,如果使用手机的录音功能,需要先在大部分用户不常用的文件夹中找到录音APP,再点击录音按钮开启录音;而使用SR302 Pro,直接按一下机身上的红点按键,录音就启动了,在录音的时候还会自动熄屏来优化续航,操作一步直达,省去很多麻烦。
最后让我们用一张图来总结下讯飞智能录音笔SR302 Pro的核心特点:
深耕语音技术,只为更好的用户体验
过去的十几年当中,科大讯飞推出了多款面向消费者的智能硬件产品,涵盖了家庭、学习、会议、办公等多个不同领域的应用场景。
在今年7月举办的「全国政法智能化建设技术装备及成果展」上,科大讯飞在展会上更是展示了多款不同定位的讯飞智能录音笔,比如讯飞腕式录音笔R1、讯飞智能录音笔SR101、SR302、SR502、SR702和SR901,向大众展现了AI在记录语音体验上的创新,完美诠释了录音笔的智能所在,带来了颠覆式的创新:
而这些不断迭代升级的产品,背后往往都离不开顶尖技术的支持。
科大讯飞作为AI语音领域的领军企业,深耕语音技术21年。能够将如此多的先进技术集于一身,源自于科大讯飞多年来在语音和人工智能技术上的一步步积累。自2018年来,科大讯飞累计夺得30余项国际人工智能大赛冠军:
2018年9月,国际权威英文语音识别大赛「CHiME-5」中,科大讯飞包揽全部四个项目的第一名;
2019年8月,在国际语音合成大赛Blizzard Challenge 2019中,科大讯飞与中科大语音及语言信息处理国家工程实验室联合提交的系统再度摘下自然度、相似度两项关键指标第一,这也是讯飞在该比赛中的十四连冠;
2020年7月,科大讯飞A.I.研究院联合中科大语音及语言信息处理国家工程实验室,在声音事件定位与检测(Sound Event Localization and Detection,Task 3)任务中摘得桂冠。其中,在声音事件检测F-score、检测错误率、定位错误率三项指标中均取得较大优势;
2020年,科大讯飞再次参加「CHiME-6」大赛斩获两项冠军,语音识别错误率从2018年CHiME-5的46.1%降到30.5%,刷新该项目最好成绩。
AI加持下,录音笔也有大颠覆
从2019年起,科大讯飞仅仅用了两年的时间就攻占了智能录音笔市场,通过其背后的核心技术,对传统的录音笔市场进行了颠覆式的革新,不断的为更加专业的应用场景进行赋能,满足了学习、办公、商务、政法等多种专业需求,为更多用户的工作和生活带来的便捷,真正实现从「能理解」到「会思考」的飞跃。
随着人工智能技术的迅猛发展,录音笔行业正在经历从传统数码录音笔到智能录音笔的演变,而真正解决市场需求的同时,智能录音笔也为文字记录提供全链条解决方案。相信凭借硬核技术实力、用心服务用户的初衷,科大讯飞将迎来更大的市场空间。