网友提问:
科大讯飞(002230)科大讯飞又发布新产品了!!!
发条是科大讯飞自主研发的一款基于车载场景的语音操作工具,目前主要为音乐、导航、微信、打电话(待上线)四个功能提供便捷化的安卓手机操控,主张“简单发声,拒绝条框”。突破性优势有:(1)说法口语化,无需说固定句式就能触发功能。如音乐可以直接说歌手名、歌曲名、专辑名等;导航可以直接说建筑物、小区、加油站、麦当劳名称等;微信直接说内容和发送的内容即可直接发送微信消息。(2)轻量化工具,对接行业内优质的服务:发条自身不提供音乐播放、地图导航和微信收发功能,仅做语音命令处理,所有内容和终端功能呈现均由第三方服务商直接提供。发条会自动判断用户的应用偏好自动匹配。(3)音乐内容库,摆脱音乐版权的困扰:发条在每一次用户请求听某首歌曲时,会向所有对接的音乐平台发起请求,若用户偏好APP内没有对应曲目的版权,可自动跳转至有版权的音乐APP进行播放,保证每一首歌、每一位歌手的内容都能让用户听到。(4)花样唤醒方式
网友回复
下选上:
科大讯飞在人机语音交互方向的尝试由来已久。2012年,讯飞联合中国移动做的灵犀语音助手,累计获得过亿用户量,积累了丰富的语义底层数据。谈到做发条的初衷,产品总监达达说,01年到现在,很多语音助手厂商转型做智能音箱等硬件,因为语音助手基于APP端的场景很局限。现在大部分助手是为了查询信息,但是很少用手机做事儿。实际生活中,人们在说话时候,不一定是按照逻辑的,所以要让机器理解也有难度。语音交互不够开放的时候,语音助手做到拟人化很难。要实现突破,首先需要缩小到一个话术体系里。讯飞团队分析发现,用户在语音助手上搜索音乐方面的数据占比最高,因此决定聚焦在音乐这个场景。
下选上:
AI终局是无限接近于人,但是离人的距离还很远,需要基于场景,定点突破。在功能层面,发条通过语义处理引擎垂直在音乐场景,做到准确识别。比如用户说晴天,产品会找相关歌曲,而不是报天气。技术方面,使用讯飞的语音引擎技术,全双工语音交互,整合语音唤醒(成功率达到95%)、语音识别、自然语言理解和语音合成。
下选上:
在搜索方面,发条通过与4家音乐平台合作,采用AI搜索引擎,实现全网搜歌,自动播放,并自动判断版权归属。因各家音乐平台分别持有不同音乐人和唱片公司的版权,发条在每一次用户请求时,会向所有对接的音乐平台发起请求,若用户偏好APP内没有对应曲目的版权,可自动跳转至有版权的音乐APP进行播放,保证每一首歌、每一位歌手的内容都能让用户听到。
下选上:
关于后续的产品规划,发条第一阶段的目标是,做到更符合用户直觉的说话响应,听懂书面化、口语化的表达;再往后,将继续做好音乐内容的优先识别模型和混合语种识别模型,最终实现个性化的识别和响应。
下选上:
语音助手与垂直场景的结合是智能语音未来的发展方向。但是,如何选择好场景,如果做到智能化、生活化的理解,是摆在各个厂商面前的难题。音乐是最佳领域吗?欢迎关注智能语音助手行业的创业者、投资人与我们分享、交流观点,
下选上:
目前,发条团队共有20多人,主要是产品和技术人员。谈到未来发展,达达表示将会继续做好面向用户的APP,优化在音乐垂直领域的模型,同时把能力连接到耳机、音箱等硬件上,通过与厂商合作,逐步探索商业化。
下选上:
万一火了呢!
契合123:
谁用谁知道
下选上:
9月底上线后,在没有推广的情况下,用户量已经达到4万多。目前,产品可以在四种场景下使用: 音乐、导航、微信、电话。打开APP之后,默认是音乐场景,
aqhuangfei:
科大app多于牛毛,没有一个火的。
韭菜遥2:
没有一个火的吗?讯飞阅读下载量3000万了。讯飞输入法几亿下载量了。
北京地主2:
耕音乐场景的语音助手,科大讯飞推出一款“发条”APP
36氪
北京地主2:
发条真的!好用
wwhhvv:
炒股别当韭菜
佛山佬2438:
目前为止,搜狗输入法的下载量是1.8亿,讯飞输入法的下载量是3.7亿。