您现在的位置是:首页» windows系统» ai智能音箱开发方案,生成式ai智能音箱

ai智能音箱开发方案,生成式ai智能音箱

2023-10-14 21:42:38
今天小编为大家分享Windows系统下载、Windows系统教程、windows相关应用程序的文章,希望能够帮助到大家!关注股民纪要:#智能音箱#时间:2023年03月26日市场表现:上周智能音箱板块表现活跃,国光电器上涨幅度超20%,另外包括漫步者、共达电声的表现也不错。市场热点:ChatGPT为代表的生成式AI模型

今天小编为大家分享Windows系统下载、Windows系统教程、windows相关应用程序的文章,希望能够帮助到大家!

关注股民纪要:

#智能音箱#

时间:2023年03月26日

市场表现:上周智能音箱板块表现活跃,国光电器上涨幅度超20%,另外包括漫步者、共达电声的表现也不错。

市场热点:ChatGPT为代表的生成式AI模型与智能音箱的结合,会有何应用前景?今、明年可能推出哪些新品?给市场竞争格局和整个市场的β带来怎样的变化?

智能音箱:2014年Amazon推出了Echo后,其销量迎来迅速增长,但在2019年,全球智能音箱年销量基本稳定在1.7~1.8亿台,国内销量稳定在3,700万台左右。2022年,国内销量同比下滑20%左右,进入增长的瓶颈期。

问:智能音箱领域现在存在哪些问题使得其不能实现渗透率持续提升?

答:Echo推出后,国内国际市场很快跟进:京东、讯飞推出叮咚音箱,哈曼卡顿和微软推出了Invoke、天猫精灵、百度、小米等也都推出了智能音箱。产品推出后销量迅速上升,与国内的补贴政策相关。当时(供应商)的目的是希望智能音箱能够占领智能家居的入口,或者通过智能音箱和商城形成联接。但产品在实际场景中,(智能音箱)存在较多问题 :

1、交互体验不好(根本性问题):前期,受制于远场交互,远距离让交互失效、噪音让交流失效。后期,受制于交互能力,如没有提供“免唤醒”、“多轮对话”。总体来说就是太傻了,也是主要不足。

2、应用场景单一:主要在报天气、讲故事、听歌曲等简单应用场景,不够深入。

3、个性化能力较弱:无法识别人的情绪、或针对性对话。最后用户将智能音箱当作普通音箱使用,未实现智能音箱用作智能家居入口或形成商务链接。阻碍了智能音箱产品的继续发展。更多调研关注:深圳财富club

wWw.517338.Com

问:以ChatGPT、文心一言为代表的生成式AI模型,未来对于智能音箱存在的交互体验不好,功能单一,个性化比较弱的传统痛点有哪些提升?

答:ChatGPT最大的亮点和突破是通用模型的提升、交互能力上的显著提升。ChatGPT4发布后又有了多模态(已经存在多年)的能力,除语音以外,还有视觉等多种交互形式,融进多模态技术后的ChatGPT4更为强大。

生成式AI对智能音箱的提升点:

1、交互体验提升,如理解上下文、多轮对话。因为其模型非常大,所以它已经远远超出了之前几代的智能音箱,在对话体验上一定是非常大的升级;

2、生成内容质量提升满足在真实场景中服务客户,如使用音箱做家庭旅游规划,或者协助办公。未来有可能会逐步的实现个性化和情感。但目前还不具备此能力,随着未来技术进一步提升,结合数字人概念,可能在这方面也会有提升。

问:生成式AI模型应用到生活当中,可能拓展哪些应用场景?产品形态是不是会发生一些变化?

答:把通用语言大模型看作一个平台,可添加的要素很多。传统语音智能音箱形态受输入端和输出端使用语音决定。但ChatGPT4的技术平台是多模态的,不限于语音。可能很多人会把机器人与其做结合,以前是智能音箱,现在更愿意用机器人称呼其产品,如陪护型机器人、办公机器人,学习机等。此时,有如下形态变化:

1、 传感器数量变多,以感知周围的环境,同时在个性化上,对人的身份进行识别;

2、 输出端可能不局限于声音,可能有图像和文档:因为声音输出有局限性,不适合做生产效率提升。另,智能音箱不一定局限于家居场景,机器人也可以是一个数字人的形态,打通智能驾驶、家居场景等。

问:多模态底层技术成熟但距语音视觉真正融合仍差距较大,就现在市场参与者(软件、硬件)而言,短期内的改变有哪些?是否只要在硬件上加一个api接口就能大概实现这些功能?

答:还没有到一接入马上就能产生效果、立刻产生新品的阶段。传统硬件厂商做出产品的形态有区别。虽然接入ChatGPT能提升交互体验,同时也会带来几个问题:

1、 算力分布设计的问题:如情绪识别是放在本地处理还是传到后端ChatGPT上处理;

2、 时延控制:平台有大量api接口的访问可能会带来较长时延,影响交互体验;

3、 成本的问题:考虑用户调用api的付费模式;

4、 数据安全性的问题:仅调用ChatGPT没有问题,一旦涉及到用户数据,需要依据国家规定;

5、 突破使用场景的问题:聊天场景可能很快就能有一些明显的改善,但对场景的设计和理解(的改善)没有那么快。如果不深度挖掘使用场景,直接调用ChatGPT而不做设计,产品可能无法有质的突破。这就回到了产品形态,它也许会变成一些细分的机器人的形态来出现,而不是以一个真的完全的智能音箱的形态来出现,在目前还没有做到真正的这种全功能的人工智能的情况下,这些细分场景上的设计反而能真正解决用户的问题。

问:能否跳过智能音箱,直接用手机完成智能、智慧家居的这样一些服务?

答:不会以一个手机或一个智能音箱作为单独的入口。业界共识:以后的智能硬件终端有很多种,不可能有一个智能硬件是通识天下的,未来的智能硬件是齐头并进的:学习机、智能手表、电脑、iPad、手机等。

例如:汽车中手机不会取代车机,你的手机跟你的车机之间是可以完全联通的,信息是共享的,APP都是绑定或者是同步的。我们当然可以拿手机去控制所有的东西,但智能音箱形态比较稳定,仍会作为一个智慧家居场景的入口而存在,通过语音控制家里所有的东西。

问:语音交互的优势、劣势?语音交互的技术成熟度?

答:语音交互这种形式一定是最自然最方便的;其情感表达比较直接,能负载人的情绪信息。语音交互还存在如下问题影响其普及:

1、 隐私性问题:比如公共场合的语音沟通;

2、 交流效率:不如图表数据直接和迅速;

3、 语音识别率有待提升:方言、嘈杂的环境、不同声音识别……,这些问题不能通过ChatGPT解决。

引入ChatGPT后:

1、情感交互目前还没有在ChatGPT的基础上完整实现。语音交互技术从四个维度实现情感交流:情感识别(较成熟)、情感模拟(逐步完善)、情绪反应(ChatGPT还不具备这种能力)、交流内容(ChatGPT无法较好取舍可交流的内容)

2、语音交互的智能化提升代表交流具开使具有建设性意义,有利于语音交互普及。

从技术角度,语音交互包括识别语音(ASR)、语言的处理(NLP)、输出语音(TTS)。其中ASR部分整体成熟度较高、NLP有很大的突破、TTS最早开始成熟,但在情感交互上比较难突破。

问:关于ASR,中文成熟度?竞争格局?

答:ASR国内主要的是科大讯飞、百度做得比较好,国外谷歌应该是做的最好的。现在国内国外基本上是属于同一水准了,中文国内好,英文国外好,谷歌在小语种有一些优势,但差距都不大。

问:相比智能音箱,电视机融合了视听交互是不是更适合作为一个交互的平台?智能音箱短期的市场推广?

答:电视机的智能交互一直存在,一种是在电视机上做,一种是拿遥控器交互,但电视机场景受限,很多人不看电视,所以只拿电视机来做这个事情是不够的。

智能音箱短期的市场推广,作为国光或者漫步者这样的音响厂商,因为它本身并不是一个专门的AI的公司,所以他们依然会以智能音箱形态为主去推,更多的是在场景化上还再多做工作;百度、讯飞、阿里、腾讯这种人工智能企业的选择比较多,比如在原有的产品形态上做升级:讯飞升级学习机、小米和百度升级智能音箱,它能实现的生产力效率的提升以及生活的便利程度,可能超过音响厂商。所以不同公司,因为大家的基础能力和着眼的场景完全不一样,在智能音箱领域短期内的打法会不一样,智能音箱往后发展可能反而会形成一些分化。

问:目前各家产品的时间线?国内互联网厂商未来的一个竞争格局?

答:公开信息:讯飞5月份发布新的学习机、百度文心一言会有后续产品。虽然文心一言发布了,但他的能力和ChatGPT本身还存在差距的,但这些差距很快就会缩小。因为在机器学习领域,有一个所谓的 Teacher的方法,可以把ChatGPT作为老师互相训练,能赶上老师的水平,再加上国内本来就不缺数据、用户、应用场景,所以说其实它赶上ChatGPT甚至在某些领域超过它都是非常有可能的。

未来一定会产生两种类型的公司:构建AI平台的公司,比如百度的文心一言、Moss;和做平台应用的公司,百花齐放。

技术侧:百度和讯飞的技术相对比较扎实,但从应用侧:腾讯、阿里、小米的应用场景或者接触的客户群体反而更多。

问:从技术角度介绍一下,真的能够快速赶上国外水平?

答:NLP这个技术前几年是遇到很大瓶颈的,直到ChatGPT3.5之后发现他的智商水平确实提升了。这种提升有两个原因:

1、 模型特别大,包含万亿级参数,训练成本当然也非常高;

2、 高质量的数据。

大家担心一旦现在ChatGPT联网,可以去网上搜索信息自己学习,他学的东西是否可信,会不会开始一本正经地胡说八道都非常有可能。中国各大公司已经知道这个问题一定能够做出来,只是需要时间问题,因为别人也做出来了。只是需要一个训练的过程和数据准备的时间。

问:传统的硬件厂商转型的努力方向?

答:这些传统公司反而比之前更有优势。ChatGPT的开放程度,可能会让传统公司介入人工智能更加容易;传统公司有比较固定的用户群体,具有一定的品牌号召力;他们的产品设计能力其实是强于很多互联网公司的,具备global的设计能力,他们的产品经理对自己客户群体发掘非常深入,对场景的理解分析得非常透彻。

问:一些更加综合性的消费电器或消费电子集团(比如美的、TCL、创维)的机会?

答:个人观点就是他们的启动会稍微晚一点。虽然白电是刚需,人工智能的普及率很高,但是应用很少,在接入ChatGPT之后,挖掘用户价值的链条更长,会慢慢启动,享受AI的红利或者带来的益处可能会晚一点,但最终一定会实现智能化。

小结:

ChatGPT在自然语言处理方面取得重大突破,带来了文字交互体验的提升,结合此类生成式AI模型的新一代智能音箱产品有望一改之前单一的场景功能,重新定义产品形态,在更多细分场景下为用户带来更好的体验、提供有价值的服务。

一方面国内生成式AI模型的发展赶上国外水平就是时间问题,国内各厂商可能会形成两种类型的公司:搭建生成式AI模型平台的公司及基于平台开发新应用的公司。另一方面,在新一代智能音箱的推广过程中,不同类型的公司发展路径各异,传统的硬件厂商也存在竞争优势,智能音箱领域短期内将百花齐放,未来可能形成分化。

传音控股(SH688036)科大讯飞(SZ002230)漫步者(SZ002351)

若兰兮:

今天又领涨掌阅科技(SH603533)最后居然成为最强的。。不起眼的悄悄每天涨不停,一旦涨停就是加速//@若兰兮: 百度集团-SW(09888 百度 肯定快速接入 小爱同学。。。干阿里巴巴的 天猫精灵 //@若兰兮: 创业板指 上证指数我擦 。。。一直说的chatpdf福昕软件(SH688095) 宁夏建材 立方数科 金山办公(SH688111)全面爆发了但是到今天为止。。。柚子 居然还没发现 chatbox 才是大应用。、智能音箱没有一个走出来的。 佳禾智能。共达电声//@若兰兮: 漫步者(SZ002351)共达电声(SZ002655) 惠威科技(SZ002888) 互联网大佬几年前 纷纷抢占家庭入口。出来了很多智能音箱 天猫精灵,小爱同学 包括小米的小度的华为的。gpt最大的应用就是通过智能对话的入口,把所有的东西给控制在一起,这一个应用是一个超大级别的应用带来一个巨大的一个增量最晚到6月份 市场就会出现大量的智能语音结合chatpgt的作品, 看好 有新龙头像漫步者19年当年10倍带领板块向上创业板指 上证指数广告创意 蓝色光标视频运营 捷成股份电商 光云科技 值得买写作阅读 chatpdf 福昕软件 小说 掌阅科技万兴科技 ai作画昆仑礼物 浏览器 三六零游戏汤姆猫智能音箱✅✅✅

乐天子:

做好板块轮动与中期持股策略,牛市10倍不是梦

原创 行中衡 行中衡 2019-09-20 12:23

一、普通投资者在牛市赚10倍的可能性分析

牛市开头三个月,一般是指数涨30%,个股普涨50%左右,这时候市值涨50%。

牛市中间阶段,一般为一年半到两年,指数涨幅一般为30%-50%左右。个股平均涨幅50%-100%,市值需上涨100%-200%。这个阶段重在主流板块与个股选择,体现投资水平的时间点。

牛市最后阶段,一般是半年左右,指数与所有个股以45度角上行,已经是泡沫阶段,但确实是最容易赚钱的阶段。指数涨100%,个股普涨300%-500%。市值需增长500%。

所以算下来,如果完整的满仓从低点到高点,象前面满打满算的话,基本是15倍最少。难度在于在低位时是否满仓,高位时能及时离场。所以打个折扣,就是10倍,包括底部未能满仓,顶部提早提场。

当然这里指的是牛市的盈利可能。熊市来了,普通投资者亏损是很难避免的,只能追求少亏。牛市赚得足了,才能度过一轮熊市的煎熬。

根据A股历史,牛市时间一般是两年半到三年。

所以牛市开头和末尾重在仓位与持股耐心,中间阶段重在风格转换与板块轮动。

牛市中间阶段,要会看主流板块,并且持股一直在主流板块,而且避免频繁换股。

做到了这几条,牛市10倍的梦想是可以有的。

比如说现阶段的主流板块是华为产业链,手机产业链,智能穿戴,VR/AR等。

牛市第二阶段,投资者如何选择投资策略,判断主流板块

关于牛市的判断,2018年10月,2019年7月牛市二阶段,基本都是正确的。如下文:

回顾A股历史上的5轮牛市,哪些经验值得普通投资者借鉴?

A股历史时刻的预判20181020

二、普通投资者为什么在牛市中频繁换股

普通投资者经常在投资中频繁换股,买卖与换股往往是冲动型,一轮牛市下来,回头一看,还不如一直持股。

频繁换股有哪些问题?长期持有,期望手中个股几年10倍,还是适当的板块轮动换股,到底哪个投资方式更适合普通投资者呢?我们可以从A股历史来寻找答案。

根据我的理解,普通投资者在牛市中老换股,是因为别人的股票涨得多,自己的股票不涨或者涨得少,别人家的孩子比自家的好。

这种换股思路是有问题的,因为牛市中板块有轮动,大盘股与小盘股,成长股与价值股,传统蓝筹股与科技股,重组股与绩优股等,在不同阶段都会有突出的表现。

牛市的最后阶段,涨幅都是5倍甚至10倍以上。没涨过的个股,牛市后期都会由于各种因素无理由的水涨船高。

如果只是因为手中个股不涨而换股,就容易变成追涨杀跌。一轮牛市下来,连个股平均涨幅都达不到。

牛市中普通人的心态:

1、攀比妒忌:持股不如别人的涨幅,彻夜难眠不舒服;

2、自大短视:买了就涨自以为对,买了就跌心里不爽;

3、禀赋效应:对已买入的股票只看利好忽视利空因素;

4、从众倾向:关注追逐热点,其实冷清的地方才有金;

5、落袋倾向:过早想卖出表现良好但仍然低估的股票;

6、厌恶损失:对产生亏损但是已经高估的股票不卖出;

7、错价幻觉:越涨越喜,越跌越恶,性价比其实相反。

频繁换股,往往就是因为心态问题,而不是理性分析的结果。投资应该基于理性和客观的思维。

如果你对于板块轮动有较深的研究,而且自己有能力把握,换股也是可以的。下面以2005年-2007年的牛市行情为例,看板块轮动与个股在不同阶段的涨幅差异。

三、以2005年的牛市来看板块轮动

回首998点到6124点的大牛市,大致可分为以下六波行情。

可以看出大盘股与小盘股,蓝筹股与题材股,重组股与绩优股,成长股与价值股,在各个阶段表现不同。有普涨的时候,也有分化的时候,但到最终除金融、地产等主流板块以外,多数个股涨幅差别并没有那么大。

第一波:2005年6月6日-2005年12月30日,大盘从998点涨到1160点,涨幅约15%,沪市日均成交88亿元。

在此期间,中小板个股平均上涨50%(算数平均,下同),上证50涨23%,沪深300涨21%,很明显市场的领涨板块是小盘股。

第二波:2006年1月1日-2006年7月6日,大盘从1160点涨到1700点,涨幅约45%,沪市日均成交211亿元,较前一波放大了1倍。

在此期间,沪深300涨87%,上证50涨82%,中小板涨50%,市场首度出现普涨格局,98%的个股上涨,资金开始流向蓝筹股。

第三波:2006年7月7日-2006年12月14日,大盘从1700点涨到2245点,涨幅约40%,沪市日均成交254亿元。

在此期间,上证50涨43%,沪深300涨26%,中小板反而下跌1%,所有个股的平均涨幅不到10%,仅56%的个股上涨,市场第一次出现“二八现象”。在最重要的历史关口,大盘权重股成为带头羊,金融和地产成为急先锋,大涨逾30%。

第四波:2006年12月15日-2007年2月26日,大盘从2245点涨到3000点,涨幅约30%。

在此期间,沪深300涨58%,上证50涨56%,中小板涨36%,99%的个股上涨,市场第二次在放量的情况下出现普涨格局,牛市进入新一轮炒作。

第五波:2007年2月27日-2007年5月29日,大盘从3000点涨到4300点,涨幅约40%。市场几乎以45度角的直线刷新新高,仅有的几次回调也以单日回抽的方式完成,市盈率已没有参考意义。

在此期间,沪深300涨72%,上证50涨44%,中小板涨45%,所有A股平均上涨88%,99%的个股上涨,市场继续普涨,而大盘蓝筹股则相对表现疲弱。

第六波:2007年5月30日-2007年10月16日,大盘从4300点涨到6124点,涨幅约40%,沪市日均成交1500亿元,成交量已不再放大,基金主导指标股发动了蓝筹泡沫行情,A股市盈率超过60倍。

在此期间,上证50涨61%,沪深300涨43%,中小板涨1%,而A股平均仅上涨7%,仅43%的个股上涨,这是一个超级二八行情,指数与个股表现出现严重背离。

四、持有到牛市的最后阶段才是普通投资者的最优选择

还有一点要注意的是,牛市在最开始的一年到两年时间,个股平均涨幅并不大。而牛市最后的半年多时间,却是个股普涨,平均涨几倍的行情。

所以,普通投资者耐心持股到牛市的最终泡沫阶段,才能有超额的收益。

下面两张图统计了2005年,2013年的大牛市平均股价表现。可见最后半年个股的平均涨幅比例,是牛市前面两年的2倍到3倍左右。

2005年-2007年的A股平均股价

2013年-2015年的A股平均股价

五、什么才是正确的换股方法

1、 原来的买入标的存在缺陷。

比如说公司业绩,基本面出现了问题,或者与自己原来的判断不符。

2、 买入时标的分析存在错误。

由于主观原因或个人偏好,对于标的选择出现了错误,现在及时纠正。

3、 有更好的可替代个股。

通过研究,发现有成长性更好,估值更低,预期更好的标的。新标的更符合当前市场的风格。

4、 单一个股仓位太重,压力太大,影响人个情绪与生活。

投资盈利的最终目的是有良好的人际关系,美满的家庭,和幸福的生活,否则赚最多的钱也失去了意义。

5、 股价涨得太多,已远远偏离内在价值与基本面。

这种换股方式,我认为比较合理,适合不同的市场阶段。

就是投资标的达到预期收益后不要简单机械地长期持有,而是通过换股的方式换成另一个安全边际更大的投资标的。

举例来说,在一只股票上赚8倍,就相当于在3只股票上赚1倍,实现前者要比后者难许多。在当前信息透明度较高的时代,市场有效性在不断增强,很多预期都在提前被反映,换股轮动是不错的选择。

很多人觉得从六七元钱拿到100元钱的人才牛,但这样离人性远,用换股轮动的方式离人性更近,风险更小。做投资没必要挑战自己的极限,明明有大道可以走,没必要走小道险径。

毕竟我们投资的最终目标,是用最优的方式实现盈利的最大化,而不是挑战吉尼斯世界纪录,或者去获得别人的认可和称赞。

长期投资只要能取得优秀的收益,是不是买到十倍股又有什么区别呢?

相关公司分析:

谈谈捷成股份

谈谈水晶光电

谈谈共达电声的参与价值

行中衡

方向比选择重要

喜欢此内容的人还喜欢

我决定自己做平台了

宇宙之心数藏

不喜欢

不看的原因

内容质量低不看此公众号

整车功能介绍

电控技术大师

不喜欢

不看的原因

内容质量低不看此公众号

纯电动汽车整车控制器原理及功能解析

电控技术大师

不喜欢

不看的原因

内容质量低不看此公众号

若兰兮:

漫步者(SZ002351) 全志科技(SZ300458) 这个有突破的样子共达电声(SZ002655) 其实这个有个很硬的逻辑当年天猫精灵,小爱同学包括小米?没有实现的愿望,有chatgpt#chatgpt# 很轻易就实现了 就是新一代的入口,智能语音音箱,在gpt公布API的情况下,只要吊了API,这个整体的流畅的对话能给出很详细的一个解决方案,整体智能语音相会得到一个集体的大爆发,不再是以前那种智障的一样的东西可是一个智能的东西。有板块集体翻倍的潜力mark下 后面回头验证创业板指 上证指数

拿只笔上前线:

声学行业算科技行业里较古老的子行业,也是需求较刚性相对其它科技行业发展较稳定的行业。希望ai这次变革能催化万物有声时代更快到来。共达电声(SZ002655)歌尔股份(SZ002241) 瑞声科技(02018)

共达电声(SZ002655):

共达电声:共达电声股份有限公司关于收购资产暨关联交易的完成公告 网页链接

每日经济新闻:

每经AI快讯,有投资者在投资者互动平台提问:请问贵司有研发生产智能音箱的计划吗?

共达电声(002655.SZ)3月31日在投资者互动平台表示,公司专注在声学领域的发展,产品广泛应用于智能车载、智能穿戴、智能家居、智能手机、AI、VR等消费类电子产品领域。

(记者 毕陆名)

免责声明:本文内容与数据仅供参考,不构成投资建议,使用前核实。据此操作,风险自担。

每日经济新闻

贝叶斯韭黄:

市场表现:上周智能音箱板块表现活跃,国光电器上涨幅度超20%,另外包括漫步者、共达电声的表现也不错。

市场热点:ChatGPT为代表的生成式AI模型与智能音箱的结合,会有何应用前景?今、明年可能推出哪些新品?给市场竞争格局和整个市场的β带来怎样的变化?

智能音箱:2014年Amazon推出了Echo后,其销量迎来迅速增长,但在2019年,全球智能音箱年销量基本稳定在1.7~1.8亿台,国内销量稳定在3,700万台左右。2022年,国内销量同比下滑20%左右,进入增长的瓶颈期。

问:智能音箱领域现在存在哪些问题使得其不能实现渗透率持续提升?

答:Echo推出后,国内国际市场很快跟进:京东、讯飞推出叮咚音箱,哈曼卡顿和微软推出了Invoke、天猫精灵、百度、小米等也都推出了智能音箱。产品推出后销量迅速上升,与国内的补贴政策相关。当时(供应商)的目的是希望智能音箱能够占领智能家居的入口,或者通过智能音箱和商城形成联接。但产品在实际场景中,(智能音箱)存在较多问题 :

1、交互体验不好(根本性问题):

前期,受制于远场交互,远距离让交互失效、噪音让交流失效。

后期,受制于交互能力,如没有提供“免唤醒”、“多轮对话”。总体来说就是太傻了,也是主要不足。

2、应用场景单一:

主要在报天气、讲故事、听歌曲等简单应用场景,不够深入。

3、个性化能力较弱:

无法识别人的情绪、或针对性对话。

最后用户将智能音箱当作普通音箱使用,未实现智能音箱用作智能家居入口或形成商务链接。阻碍了智能音箱产品的继续发展。

问:以ChatGPT、文心一言为代表的生成式AI模型,未来对于智能音箱存在的交互体验不好,功能单一,个性化比较弱的传统痛点有哪些提升?

答:ChatGPT最大的亮点和突破是通用模型的提升、交互能力上的显著提升。ChatGPT4发布后又有了多模态(已经存在多年)的能力,除语音以外,还有视觉等多种交互形式,融进多模态技术后的ChatGPT4更为强大。

生成式AI对智能音箱的提升点:

1、交互体验提升,如理解上下文、多轮对话。因为其模型非常大,所以它已经远远超出了之前几代的智能音箱,在对话体验上一定是非常大的升级;

2、生成内容质量提升满足在真实场景中服务客户,如使用音箱做家庭旅游规划,或者协助办公。

未来有可能会逐步的实现个性化和情感。但目前还不具备此能力,随着未来技术进一步提升,结合数字人概念,可能在这方面也会有提升。

问:生成式AI模型应用到生活当中,可能拓展哪些应用场景?产品形态是不是会发生一些变化?

答:把通用语言大模型看作一个平台,可添加的要素很多。传统语音智能音箱形态受输入端和输出端使用语音决定。但ChatGPT4的技术平台是多模态的,不限于语音。可能很多人会把机器人与其做结合,以前是智能音箱,现在更愿意用机器人称呼其产品,如陪护型机器人、办公机器人,学习机等。此时,有如下形态变化:

1、传感器数量变多,以感知周围的环境,同时在个性化上,对人的身份进行识别;

2、输出端可能不局限于声音,可能有图像和文档:因为声音输出有局限性,不适合做生产效率提升。

另,智能音箱不一定局限于家居场景,机器人也可以是一个数字人的形态,打通智能驾驶、家居场景等。

问:多模态底层技术成熟但距语音视觉真正融合仍差距较大,就现在市场参与者(软件、硬件)而言,短期内的改变有哪些?是否只要在硬件上加一个api接口就能大概实现这些功能?

答:还没有到一接入马上就能产生效果、立刻产生新品的阶段。传统硬件厂商做出产品的形态有区别。虽然接入ChatGPT能提升交互体验,同时也会带来几个问题:

1、算力分布设计的问题:如情绪识别是放在本地处理还是传到后端ChatGPT上处理;

2、时延控制:平台有大量api接口的访问可能会带来较长时延,影响交互体验;

3、成本的问题:考虑用户调用api的付费模式;

4、数据安全性的问题:仅调用ChatGPT没有问题,一旦涉及到用户数据,需要依据国家规定;

5、突破使用场景的问题:聊天场景可能很快就能有一些明显的改善,但对场景的设计和理解(的改善)没有那么快。如果不深度挖掘使用场景,直接调用ChatGPT而不做设计,产品可能无法有质的突破。这就回到了产品形态,它也许会变成一些细分的机器人的形态来出现,而不是以一个真的完全的智能音箱的形态来出现,在目前还没有做到真正的这种全功能的人工智能的情况下,这些细分场景上的设计反而能真正解决用户的问题。

问:能否跳过智能音箱,直接用手机完成智能、智慧家居的这样一些服务?

答:不会以一个手机或一个智能音箱作为单独的入口。业界共识:以后的智能硬件终端有很多种,不可能有一个智能硬件是通识天下的,未来的智能硬件是齐头并进的:学习机、智能手表、电脑、iPad、手机等。

例如:汽车中手机不会取代车机,你的手机跟你的车机之间是可以完全联通的,信息是共享的,APP都是绑定或者是同步的。我们当然可以拿手机去控制所有的东西,但智能音箱形态比较稳定,仍会作为一个智慧家居场景的入口而存在,通过语音控制家里所有的东西。

问:语音交互的优势、劣势?语音交互的技术成熟度?

答:语音交互这种形式一定是最自然最方便的;其情感表达比较直接,能负载人的情绪信息。语音交互还存在如下问题影响其普及:

1、隐私性问题:比如公共场合的语音沟通;

2、交流效率:不如图表数据直接和迅速;

3、语音识别率有待提升:方言、嘈杂的环境、不同声音识别……,这些问题不能通过ChatGPT解决。

引入ChatGPT后:

1、情感交互目前还没有在ChatGPT的基础上完整实现。语音交互技术从四个维度实现情感交流:情感识别(较成熟)、情感模拟(逐步完善)、情绪反应(ChatGPT还不具备这种能力)、交流内容(ChatGPT无法较好取舍可交流的内容)

2、语音交互的智能化提升代表交流具开使具有建设性意义,有利于语音交互普及。

从技术角度,语音交互包括识别语音(ASR)、语言的处理(NLP)、输出语音(TTS)。其中ASR部分整体成熟度较高、NLP有很大的突破、TTS最早开始成熟,但在情感交互上比较难突破。

问:关于ASR,中文成熟度?竞争格局?

答:ASR国内主要的是科大讯飞、百度做得比较好,国外谷歌应该是做的最好的。现在国内国外基本上是属于同一水准了,中文国内好,英文国外好,谷歌在小语种有一些优势,但差距都不大。

问:相比智能音箱,电视机融合了视听交互是不是更适合作为一个交互的平台?智能音箱短期的市场推广?

答:电视机的智能交互一直存在,一种是在电视机上做,一种是拿遥控器交互,但电视机场景受限,很多人不看电视,所以只拿电视机来做这个事情是不够的。

智能音箱短期的市场推广,作为国光或者漫步者这样的音响厂商,因为它本身并不是一个专门的AI的公司,所以他们依然会以智能音箱形态为主去推,更多的是在场景化上还再多做工作;百度、讯飞、阿里、腾讯这种人工智能企业的选择比较多,比如在原有的产品形态上做升级:讯飞升级学习机、小米和百度升级智能音箱,它能实现的生产力效率的提升以及生活的便利程度,可能超过音响厂商。所以不同公司,因为大家的基础能力和着眼的场景完全不一样,在智能音箱领域短期内的打法会不一样,智能音箱往后发展可能反而会形成一些分化。

问:目前各家产品的时间线?国内互联网厂商未来的一个竞争格局?

答:公开信息:讯飞5月份发布新的学习机、百度文心一言会有后续产品。虽然文心一言发布了,但他的能力和ChatGPT本身还存在差距的,但这些差距很快就会缩小。因为在机器学习领域,有一个所谓的 Teacher的方法,可以把ChatGPT作为老师互相训练,能赶上老师的水平,再加上国内本来就不缺数据、用户、应用场景,所以说其实它赶上ChatGPT甚至在某些领域超过它都是非常有可能的。

未来一定会产生两种类型的公司:构建AI平台的公司,比如百度的文心一言、Moss;和做平台应用的公司,百花齐放。

技术侧:百度和讯飞的技术相对比较扎实,但从应用侧:腾讯、阿里、小米的应用场景或者接触的客户群体反而更多。

问:从技术角度介绍一下,真的能够快速赶上国外水平?

答:NLP这个技术前几年是遇到很大瓶颈的,直到ChatGPT3.5之后发现他的智商水平确实提升了。这种提升有两个原因:

1、模型特别大,包含万亿级参数,训练成本当然也非常高;

2、高质量的数据。

大家担心一旦现在ChatGPT联网,可以去网上搜索信息自己学习,他学的东西是否可信,会不会开始一本正经地胡说八道都非常有可能。

中国各大公司已经知道这个问题一定能够做出来,只是需要时间问题,因为别人也做出来了。只是需要一个训练的过程和数据准备的时间。

问:传统的硬件厂商转型的努力方向?

答:这些传统公司反而比之前更有优势。ChatGPT的开放程度,可能会让传统公司介入人工智能更加容易;传统公司有比较固定的用户群体,具有一定的品牌号召力;他们的产品设计能力其实是强于很多互联网公司的,具备global的设计能力,他们的产品经理对自己客户群体发掘非常深入,对场景的理解分析得非常透彻。

问:一些更加综合性的消费电器或消费电子集团(比如美的、TCL、创维)的机会?

答:个人观点就是他们的启动会稍微晚一点。虽然白电是刚需,人工智能的普及率很高,但是应用很少,在接入ChatGPT之后,挖掘用户价值的链条更长,会慢慢启动,享受AI的红利或者带来的益处可能会晚一点,但最终一定会实现智能化。

晶晨股份 瑞芯微 全志科技 泰晶科技

小结:

ChatGPT在自然语言处理方面取得重大突破,带来了文字交互体验的提升,结合此类生成式AI模型的新一代智能音箱产品有望一改之前单一的场景功能,重新定义产品形态,在更多细分场景下为用户带来更好的体验、提供有价值的服务。

一方面国内生成式AI模型的发展赶上国外水平就是时间问题,国内各厂商可能会形成两种类型的公司:搭建生成式AI模型平台的公司及基于平台开发新应用的公司。另一方面,在新一代智能音箱的推广过程中,不同类型的公司发展路径各异,传统的硬件厂商也存在竞争优势,智能音箱领域短期内将百花齐放,未来可能形成分化。

晶晨股份(SH688099) 瑞芯微(SH603893) 泰晶科技(SH603738)

股民纪要:

#顶流基金隐形重仓股的大曝光#

时间:2023年03月26日

市场表现:上周智能音箱板块表现活跃,国光电器上涨幅度超20%,另外包括漫步者、共达电声的表现也不错。

市场热点:ChatGPT为代表的生成式AI模型与智能音箱的结合,会有何应用前景?今、明年可能推出哪些新品?给市场竞争格局和整个市场的β带来怎样的变化?

智能音箱:2014年Amazon推出了Echo后,其销量迎来迅速增长,但在2019年,全球智能音箱年销量基本稳定在1.7~1.8亿台,国内销量稳定在3,700万台左右。2022年,国内销量同比下滑20%左右,进入增长的瓶颈期。

问:智能音箱领域现在存在哪些问题使得其不能实现渗透率持续提升?

答:Echo推出后,国内国际市场很快跟进:京东、讯飞推出叮咚音箱,哈曼卡顿和微软推出了Invoke、天猫精灵、百度、小米等也都推出了智能音箱。产品推出后销量迅速上升,与国内的补贴政策相关。当时(供应商)的目的是希望智能音箱能够占领智能家居的入口,或者通过智能音箱和商城形成联接。但产品在实际场景中,(智能音箱)存在较多问题 :

1、交互体验不好(根本性问题):前期,受制于远场交互,远距离让交互失效、噪音让交流失效。后期,受制于交互能力,如没有提供“免唤醒”、“多轮对话”。总体来说就是太傻了,也是主要不足。

2、应用场景单一:主要在报天气、讲故事、听歌曲等简单应用场景,不够深入。

3、个性化能力较弱:无法识别人的情绪、或针对性对话。最后用户将智能音箱当作普通音箱使用,未实现智能音箱用作智能家居入口或形成商务链接。阻碍了智能音箱产品的继续发展。

问:以ChatGPT、文心一言为代表的生成式AI模型,未来对于智能音箱存在的交互体验不好,功能单一,个性化比较弱的传统痛点有哪些提升?

答:ChatGPT最大的亮点和突破是通用模型的提升、交互能力上的显著提升。ChatGPT4发布后又有了多模态(已经存在多年)的能力,除语音以外,还有视觉等多种交互形式,融进多模态技术后的ChatGPT4更为强大。

生成式AI对智能音箱的提升点:

1、交互体验提升,如理解上下文、多轮对话。因为其模型非常大,所以它已经远远超出了之前几代的智能音箱,在对话体验上一定是非常大的升级;

2、生成内容质量提升满足在真实场景中服务客户,如使用音箱做家庭旅游规划,或者协助办公。未来有可能会逐步的实现个性化和情感。但目前还不具备此能力,随着未来技术进一步提升,结合数字人概念,可能在这方面也会有提升。

问:生成式AI模型应用到生活当中,可能拓展哪些应用场景?产品形态是不是会发生一些变化?

答:把通用语言大模型看作一个平台,可添加的要素很多。传统语音智能音箱形态受输入端和输出端使用语音决定。但ChatGPT4的技术平台是多模态的,不限于语音。可能很多人会把机器人与其做结合,以前是智能音箱,现在更愿意用机器人称呼其产品,如陪护型机器人、办公机器人,学习机等。此时,有如下形态变化:

1、 传感器数量变多,以感知周围的环境,同时在个性化上,对人的身份进行识别;

2、 输出端可能不局限于声音,可能有图像和文档:因为声音输出有局限性,不适合做生产效率提升。另,智能音箱不一定局限于家居场景,机器人也可以是一个数字人的形态,打通智能驾驶、家居场景等。

问:多模态底层技术成熟但距语音视觉真正融合仍差距较大,就现在市场参与者(软件、硬件)而言,短期内的改变有哪些?是否只要在硬件上加一个api接口就能大概实现这些功能?

答:还没有到一接入马上就能产生效果、立刻产生新品的阶段。传统硬件厂商做出产品的形态有区别。虽然接入ChatGPT能提升交互体验,同时也会带来几个问题:

1、 算力分布设计的问题:如情绪识别是放在本地处理还是传到后端ChatGPT上处理;

2、 时延控制:平台有大量api接口的访问可能会带来较长时延,影响交互体验;

3、 成本的问题:考虑用户调用api的付费模式;

4、 数据安全性的问题:仅调用ChatGPT没有问题,一旦涉及到用户数据,需要依据国家规定;

5、 突破使用场景的问题:聊天场景可能很快就能有一些明显的改善,但对场景的设计和理解(的改善)没有那么快。如果不深度挖掘使用场景,直接调用ChatGPT而不做设计,产品可能无法有质的突破。这就回到了产品形态,它也许会变成一些细分的机器人的形态来出现,而不是以一个真的完全的智能音箱的形态来出现,在目前还没有做到真正的这种全功能的人工智能的情况下,这些细分场景上的设计反而能真正解决用户的问题。

问:能否跳过智能音箱,直接用手机完成智能、智慧家居的这样一些服务?

答:不会以一个手机或一个智能音箱作为单独的入口。业界共识:以后的智能硬件终端有很多种,不可能有一个智能硬件是通识天下的,未来的智能硬件是齐头并进的:学习机、智能手表、电脑、iPad、手机等。

例如:汽车中手机不会取代车机,你的手机跟你的车机之间是可以完全联通的,信息是共享的,APP都是绑定或者是同步的。我们当然可以拿手机去控制所有的东西,但智能音箱形态比较稳定,仍会作为一个智慧家居场景的入口而存在,通过语音控制家里所有的东西。更多调研关注:深圳财富club

问:语音交互的优势、劣势?语音交互的技术成熟度?

答:语音交互这种形式一定是最自然最方便的;其情感表达比较直接,能负载人的情绪信息。语音交互还存在如下问题影响其普及:

1、 隐私性问题:比如公共场合的语音沟通;

2、 交流效率:不如图表数据直接和迅速;

3、 语音识别率有待提升:方言、嘈杂的环境、不同声音识别……,这些问题不能通过ChatGPT解决。

引入ChatGPT后:

1、情感交互目前还没有在ChatGPT的基础上完整实现。语音交互技术从四个维度实现情感交流:情感识别(较成熟)、情感模拟(逐步完善)、情绪反应(ChatGPT还不具备这种能力)、交流内容(ChatGPT无法较好取舍可交流的内容)

2、语音交互的智能化提升代表交流具开使具有建设性意义,有利于语音交互普及。

从技术角度,语音交互包括识别语音(ASR)、语言的处理(NLP)、输出语音(TTS)。其中ASR部分整体成熟度较高、NLP有很大的突破、TTS最早开始成熟,但在情感交互上比较难突破。

问:关于ASR,中文成熟度?竞争格局?

答:ASR国内主要的是科大讯飞、百度做得比较好,国外谷歌应该是做的最好的。现在国内国外基本上是属于同一水准了,中文国内好,英文国外好,谷歌在小语种有一些优势,但差距都不大。

问:相比智能音箱,电视机融合了视听交互是不是更适合作为一个交互的平台?智能音箱短期的市场推广?

答:电视机的智能交互一直存在,一种是在电视机上做,一种是拿遥控器交互,但电视机场景受限,很多人不看电视,所以只拿电视机来做这个事情是不够的。

智能音箱短期的市场推广,作为国光或者漫步者这样的音响厂商,因为它本身并不是一个专门的AI的公司,所以他们依然会以智能音箱形态为主去推,更多的是在场景化上还再多做工作;百度、讯飞、阿里、腾讯这种人工智能企业的选择比较多,比如在原有的产品形态上做升级:讯飞升级学习机、小米和百度升级智能音箱,它能实现的生产力效率的提升以及生活的便利程度,可能超过音响厂商。所以不同公司,因为大家的基础能力和着眼的场景完全不一样,在智能音箱领域短期内的打法会不一样,智能音箱往后发展可能反而会形成一些分化。

问:目前各家产品的时间线?国内互联网厂商未来的一个竞争格局?

答:公开信息:讯飞5月份发布新的学习机、百度文心一言会有后续产品。虽然文心一言发布了,但他的能力和ChatGPT本身还存在差距的,但这些差距很快就会缩小。因为在机器学习领域,有一个所谓的 Teacher的方法,可以把ChatGPT作为老师互相训练,能赶上老师的水平,再加上国内本来就不缺数据、用户、应用场景,所以说其实它赶上ChatGPT甚至在某些领域超过它都是非常有可能的。

未来一定会产生两种类型的公司:构建AI平台的公司,比如百度的文心一言、Moss;和做平台应用的公司,百花齐放。

技术侧:百度和讯飞的技术相对比较扎实,但从应用侧:腾讯、阿里、小米的应用场景或者接触的客户群体反而更多。

问:从技术角度介绍一下,真的能够快速赶上国外水平?

答:NLP这个技术前几年是遇到很大瓶颈的,直到ChatGPT3.5之后发现他的智商水平确实提升了。这种提升有两个原因:

1、 模型特别大,包含万亿级参数,训练成本当然也非常高;

2、 高质量的数据。

大家担心一旦现在ChatGPT联网,可以去网上搜索信息自己学习,他学的东西是否可信,会不会开始一本正经地胡说八道都非常有可能。中国各大公司已经知道这个问题一定能够做出来,只是需要时间问题,因为别人也做出来了。只是需要一个训练的过程和数据准备的时间。

问:传统的硬件厂商转型的努力方向?

答:这些传统公司反而比之前更有优势。ChatGPT的开放程度,可能会让传统公司介入人工智能更加容易;传统公司有比较固定的用户群体,具有一定的品牌号召力;他们的产品设计能力其实是强于很多互联网公司的,具备global的设计能力,他们的产品经理对自己客户群体发掘非常深入,对场景的理解分析得非常透彻。

问:一些更加综合性的消费电器或消费电子集团(比如美的、TCL、创维)的机会?

答:个人观点就是他们的启动会稍微晚一点。虽然白电是刚需,人工智能的普及率很高,但是应用很少,在接入ChatGPT之后,挖掘用户价值的链条更长,会慢慢启动,享受AI的红利或者带来的益处可能会晚一点,但最终一定会实现智能化。

小结:

ChatGPT在自然语言处理方面取得重大突破,带来了文字交互体验的提升,结合此类生成式AI模型的新一代智能音箱产品有望一改之前单一的场景功能,重新定义产品形态,在更多细分场景下为用户带来更好的体验、提供有价值的服务。

一方面国内生成式AI模型的发展赶上国外水平就是时间问题,国内各厂商可能会形成两种类型的公司:搭建生成式AI模型平台的公司及基于平台开发新应用的公司。另一方面,在新一代智能音箱的推广过程中,不同类型的公司发展路径各异,传统的硬件厂商也存在竞争优势,智能音箱领域短期内将百花齐放,未来可能形成分化。

传音控股(SH688036)漫步者(SZ002351)国光电器(SZ002045)

挠头鲨的深度逻辑:

观点仅供参考,买卖需要择时!

时间 : 2023 年 03 月 26 日

市 场热 点:

ChatGPT 为 代表的生成式 AI 模型与智能音箱的 结 合, 会有何 应 用前 景?

今、 明年可能推出哪些新品?

给 市 场竞 争格局和整个市 场 的 β 带 来怎 样 的 变 化?

智能音箱: 2014 年 Amazon 推出了Echo后, 其 销 量迎来迅速增 长 , 但在 2019 年, 全球智能音箱年 销 量基本 稳定在 1. 7~1. 8 亿 台, 国内 销 量 稳 定在 3, 700 万台左右。 2022 年, 国内 销 量同比下滑 20% 左右, 进 入增 长 的瓶 颈 期。

问 : 智能音箱 领 域 现 在存在哪些 问题 使得其不能 实现 渗透率持 续 提升?

答: Echo 推出后, 国内国 际 市 场 很快跟 进 : 京 东 、 讯飞 推出叮 咚 音箱, 哈曼卡 顿 和微 软 推出了 Invoke 、 天猫精灵、 百度、 小米等也都推出了智能音箱。 产 品推出 后 销 量迅速上升, 与国内的 补贴 政策相关。 当 时 (供 应 商) 的目的是希望智能音箱能 够 占 领 智能家居的入口, 或者通 过 智能音 箱和商城形成 联 接。

但 产 品在 实际场 景中, (智能音箱) 存在 较 多 问题 :

1 、 交互体 验 不好 (根本性 问题 ) : 前期, 受制于 远场 交互, 远 距离 让 交互失效、 噪音 让 交流失效。 后期, 受制于交互能力, 如没有提供 “ 免 唤 醒 ” 、 “ 多 轮对话 ” 。 总 体来 说 就是太傻了, 也是主要不足。

2 、 应 用 场 景 单 一: 主要在 报 天气、 讲 故事、 听歌曲等 简单应 用 场 景, 不 够 深入。

3 、 个性化能力 较 弱: 无法 识别 人的情 绪 、 或 针对 性 对话 。 最后用 户 将智能音箱当作普通音箱使用, 未 实现 智能音箱用作智能家居入口或形成 商 务链 接。 阻碍了智能音箱 产 品的 继续发 展。

问: 以 ChatGPT 、 文心一言 为 代表的生成式 AI 模型, 未来 对 于智能音箱存在的交 互体 验 不好, 功能 单 一, 个性化比 较 弱的 传统 痛点有哪些提升?

答: ChatGPT 最大的亮点和突破是通用模型的提升、 交互能力上的 显 著提升。 ChatGPT4 发 布后又有了多模 态 (已 经 存在多年) 的能力, 除 语 音以外, 还 有 视觉 等多种交互形式, 融 进 多模 态 技 术 后的 ChatGPT4 更 为强 大。

生成式 AI 对 智能音箱的提升点:

1 、 交互体 验 提升, 如理解上下文、 多 轮对话 。 因 为 其模型非常大, 所以它已 经远远 超出了之前几代的智能音箱, 在 对话 体 验 上一定是非常大的升 级 ;

2 、 生成内容 质 量提升 满 足在真 实场 景中服 务 客 户 , 如使用音箱做家庭旅游 规 划, 或者 协 助 办 公。 未来有可能会逐步的 实现 个性化和情感。 但目前 还 不具 备 此能力, 随着未来技 术进 一步提升, 结 合数字人概念, 可能在 这 方面也会有提升。

问 : 生成式 AI 模型 应 用到生活当中, 可能拓展哪些 应 用 场 景? 产 品形 态 是不是会 发 生一些 变 化?

答:把通用 语 言大模型看作一个平台, 可添加的要素很多。 传统语 音智能音箱形 态 受 输 入端和 输 出端使用 语 音决定。 但 ChatGPT4 的技 术 平台是多模 态 的, 不限于 语 音。 可能很多人会把机器人与其做 结 合, 以前是智能音箱, 现 在更愿意用机器人 称呼其 产 品, 如陪 护 型机器人、 办 公机器人, 学 习 机等。

此 时 , 有如下形 态变 化:

1 、 传 感器数量 变 多, 以感知周 围 的 环 境, 同 时 在个性化上, 对 人的身份 进 行 识别 ;

2 、 输 出端可能不局限于声音, 可能有 图 像和文档:因 为 声音 输 出有局限性, 不适合做生 产 效率提升。 另, 智能音箱不一定局限于家居 场 景, 机器人也可以是一个数字人的形 态 , 打通智 能 驾驶 、 家居 场 景等。

问 : 多模 态 底 层 技 术 成熟但距 语 音 视觉 真正融合仍差距 较 大, 就 现 在市 场 参与者 ( 软 件、 硬件) 而言, 短期内的改 变 有哪些?是否只要在硬件上加一个 api 接口就 能大概 实现这 些功能?

答:还 没有到一接入 马 上就能 产 生效果、 立刻 产 生新品的 阶 段。 传统 硬件厂商做 出 产 品的形 态 有区 别 。 虽 然接入 ChatGPT 能提升交互体 验 , 同 时 也会 带 来几个 问题 : 1 、 算力分布 设计 的 问题 : 如情 绪识别 是放在本地 处 理 还 是 传 到后端 ChatGPT 上 处 理; 2 、 时 延控制:平台有大量 api 接口的 访问 可能会 带 来 较长时 延, 影响交互体 验 ; 3 、 成本的 问题 : 考 虑 用 户调 用 api 的付 费 模式; 4 、 数据安全性的 问题 : 仅调 用 ChatGPT 没有 问题 , 一旦涉及到用 户 数据, 需要 依据国家 规 定; 5 、 突破使用 场 景的 问题 : 聊天 场 景可能很快就能有一些明 显 的改善, 但 对场 景 的 设计 和理解 (的改善) 没有那么快。 如果不深度挖掘使用 场 景, 直接 调 用 ChatGPT 而不做 设计 , 产 品可能无法有 质 的突破。 这 就回到了 产 品形 态 , 它 也 许 会 变 成一些 细 分的机器人的形 态 来出 现 , 而不是以一个真的完全的智能 音箱的形 态 来出 现 , 在目前 还 没有做到真正的 这 种全功能的人工智能的情况 下, 这 些 细 分 场 景上的 设计 反而能真正解决用 户 的 问题 。

问 : 能否跳 过 智能音箱, 直接用手机完成智能、 智慧家居的 这样 一些服 务 ?

答:不会以一个手机或一个智能音箱作 为单 独的入口。

业 界共 识 : 以后的智能硬 件 终 端有很多种, 不可能有一个智能硬件是通 识 天下的, 未来的智能硬件是 齐头 并 进 的:学 习 机、 智能手表、 电脑 、 iPad 、 手机等。 例如:汽 车 中手机不会取代 车 机, 你的手机跟你的 车 机之 间 是可以完全 联 通的, 信 息是共享的, APP 都是 绑 定或者是同步的。 我 们 当然可以拿手机去控制所有的 东 西, 但智能音箱形 态 比 较稳 定, 仍会作 为 一个智慧家居 场 景的入口而存在, 通 过语 音控 制家里所有的 东 西。

问 : 语 音交互的 优势 、 劣 势 ? 语 音交互的技 术 成熟度?

答: 语 音交互 这 种形式一定是最自然最方便的;其情感表达比 较 直接, 能 负载 人 的情 绪 信息。 语 音交互 还 存在如下 问题 影响其普及: 1 、 隐 私性 问题 : 比如公共 场 合的 语 音沟通; 2 、 交流效率:不如 图 表数据直接和迅速;3、 语 音 识别 率有待提升:方言、 嘈 杂 的 环 境、 不同声音 识别 …… , 这 些 问题 不 能通 过 ChatGPT 解决。

引入 ChatGPT 后: 1 、 情感交互目前 还 没有在 ChatGPT 的基 础 上完整 实现 。 语 音交互技 术 从四个 维 度 实现 情感交流:情感 识别 ( 较 成熟) 、 情感模 拟 (逐步完善) 、 情 绪 反 应 ( ChatGPT 还 不具 备这 种能力) 、 交流内容 ( ChatGPT 无法 较 好取舍可交流的内容) 2 、 语 音交互的智能化提升代表交流具开使具有建 设 性意 义 , 有利于 语 音交互 普及。 从技 术 角度, 语 音交互包括 识别语 音 ( ASR ) 、 语 言的 处 理 ( NLP ) 、 输 出 语 音 ( TTS ) 。 其中 ASR 部分整体成熟度 较 高、 NLP 有很大的突破、 TTS 最早开始成熟, 但在情感交互上比 较难 突破。

问 : 关于 ASR , 中文成熟度? 竞 争格局?

答: ASR 国内主要的是科大 讯飞 、 百度做得比 较 好, 国外谷歌 应该 是做的最好的。 现 在国内国外基本上是属于同一水准了, 中文国内好, 英文国外好, 谷歌在小 语 种 有一些 优势 , 但差距都不大。

问 : 相比智能音箱, 电视 机融合了 视 听交互是不是更适合作 为 一个交互的平台? 智能音箱短期的市 场 推广?

答: 电视 机的智能交互一直存在, 一种是在 电视 机上做, 一种是拿遥控器交互, 但 电视 机 场 景受限, 很多人不看 电视 , 所以只拿 电视 机来做 这 个事情是不 够 的。 智能音箱短期的市 场 推广, 作 为 国光或者漫步者 这样 的音响厂商, 因 为 它本身并不 是一个 专门 的 AI 的公司, 所以他 们 依然会以智能音箱形 态为 主去推, 更多的是在 场 景化上 还 再多做工作;百度、 讯飞 、 阿里、 腾讯这 种人工智能企 业 的 选择 比 较 多, 比如在原有的 产 品形 态 上做升 级 : 讯飞 升 级 学 习 机、 小米和百度升 级 智能音箱, 它 能 实现 的生 产 力效率的提升以及生活的便利程度, 可能超 过 音响厂商。 所以不同公 司, 因 为 大家的基 础 能力和着眼的 场 景完全不一 样 , 在智能音箱 领 域短期内的打法 会不一 样 , 智能音箱往后 发 展可能反而会形成一些分化。

问 : 目前各家 产 品的 时间线 ? 国内互 联 网厂商未来的一个 竞 争格局?

答:公开信息:讯飞 5 月份 发 布新的学 习 机、 百度文心一言会有后 续产 品。 虽 然 文心一言 发 布了, 但他的能力和 ChatGPT 本身 还 存在差距的, 但 这 些差距很快就会 缩 小。 因 为 在机器学 习领 域, 有一个所 谓 的 Teacher 的方法, 可以把 ChatGPT 作 为 老 师 互相 训练 , 能赶上老 师 的水平, 再加上国内本来就不缺数据、 用 户 、 应 用 场 景, 所以 说 其 实 它赶上 ChatGPT 甚至在某些 领 域超 过 它都是非常有可能的。

未来一定会 产 生两种 类 型的公司:构建 AI 平台的公司, 比如百度的文心一言、 Moss ; 和做平台 应 用的公司, 百花 齐 放。 技 术侧 : 百度和 讯飞 的技 术 相 对 比 较 扎 实 , 但从 应 用 侧 : 腾讯 、 阿里、 小米的 应 用 场 景或者接触的客 户 群体反而更多。

问 : 从技 术 角度介 绍 一下, 真的能 够 快速赶上国外水平?

答: NLP 这 个技 术 前几年是遇到很大瓶 颈 的, 直到 ChatGPT3. 5 之后 发现 他的智商 水平确 实 提升了。 这 种提升有两个原因: 1 、 模型特 别 大, 包含万 亿级 参数, 训练 成本当然也非常高; 2 、 高 质 量的数据。 大家担心一旦 现 在 ChatGPT 联 网, 可以去网上搜索信息自己学 习 , 他学的 东 西是否 可信, 会不会开始一本正 经 地胡 说 八道都非常有可能。 中国各大公司已 经 知道 这 个 问题 一定能 够 做出来, 只是需要 时间问题 , 因 为别 人也 做出来了。 只是需要一个 训练 的 过 程和数据准 备 的 时间 。

问 : 传统 的硬件厂商 转 型的努力方向?

答: 这 些 传统 公司反而比之前更有 优势 。 ChatGPT 的开放程度, 可能会 让传统 公司 介入人工智能更加容易; 传统 公司有比 较 固定的用 户 群体, 具有一定的品牌号召力; 他 们 的 产 品 设计 能力其 实 是 强 于很多互 联 网公司的, 具 备 global 的 设计 能力, 他 们 的 产 品 经 理 对 自己客 户 群体 发 掘非常深入, 对场 景的理解分析得非常透 彻 。

问 : 一些更加 综 合性的消 费电 器或消 费电 子集 团 (比如美的、 TCL 、 创维 ) 的机 会?

答:个人观 点就是他 们 的启 动 会稍微晚一点。 虽 然白 电 是 刚 需, 人工智能的普及 率很高, 但是 应 用很少, 在接入 ChatGPT 之后, 挖掘用 户 价 值 的 链 条更 长 , 会慢慢 启 动 , 享受 AI 的 红 利或者 带 来的益 处 可能会晚一点, 但最 终 一定会 实现 智能化。

小 结 : ChatGPT 在自然 语 言 处 理方面取得重大突破, 带 来了文字交互体 验 的提升, 结 合此 类 生成式 AI 模型的新一代智能音箱 产 品有望一改之前 单 一的 场 景功能, 重新 定 义产 品形 态 , 在更多 细 分 场 景下 为 用 户带 来更好的体 验 、 提供有价 值 的服 务 。 一方面国内生成式 AI 模型的 发 展赶上国外水平就是 时间问题 , 国内各厂商可 能会形成两种 类 型的公司:搭建生成式 AI 模型平台的公司及基于平台开 发 新 应 用 的公司。 另一方面, 在新一代智能音箱的推广 过 程中, 不同 类 型的公司 发 展路径各 异, 传统 的硬件厂商也存在 竞 争 优势 , 智能音箱 领 域短期内将百花 齐 放, 未来可能 形成分化。

国光电器(SZ002045) 漫步者(SZ002351) 共达电声(SZ002655)

月人10k:

共达电声(SZ002655)共达电声,奋达科技,全TM不发达

重新注册了:

共达电声买

共达电声(SZ002655):

共达电声:共达电声股份有限公司关于收到深圳证券交易所《关于共达电声股份有限公司申请向特定对象发行股票的审核问询函》的公告 网页链接

共达电声(SZ002655):

同花顺(300033)金融研究中心3月31日讯,有投资者向共达电声(002655)提问, 请问贵司有研发生产智能音箱的计划吗? 公司回答表示,您好,公司专注在声学领域的发展,产品广泛应用于智能车载、智能穿戴、智能家居、智能手机、AI、VR... 网页链接

vvvvv13:

共达电声(SZ002655)看看漫步者,这差距太大了

等待击球:

智能音箱与生成式AI结合前景展望2023-03-29

市场表现:上周智能音箱板块表现活跃,国光电器上涨幅度超20%,另外包括漫步者、共达电声的表现也不错。

市场热点:ChatGPT为代表的生成式AI模型与智能音箱的结合,会有何应用前景?今、明年可能推出哪些新品?给市场竞争格局和整个市场的β带来怎样的变化?

智能音箱:2014年Amazon推出了Echo后,其销量迎来迅速增长,但在2019年,全球智能音箱年销量基本稳定在1.7~1.8亿台,国内销量稳定在3,700万台左右。2022年,国内销量同比下滑20%左右,进入增长的瓶颈期。

问:智能音箱领域现在存在哪些问题使得其不能实现渗透率持续提升?

答:Echo推出后,国内国际市场很快跟进:京东、讯飞推出叮咚音箱,哈曼卡顿和微软推出了Invoke、天猫精灵、百度、小米等也都推出了智能音箱。产品推出后销量迅速上升,与国内的补贴政策相关。 当时(供应商)的目的是希望智能音箱能够占领智能家居的入口,或者通过智能音箱和商城形成联接。但产品在实际场景中,(智能音箱)存在较多问题 :

1.交互体验不好(根本性问题):

前期,受制于远场交互,远距离让交互失效、噪音让交流失效。

后期,受制于交互能力,如没有提供“免唤醒”、“多轮对话”。总体来说就是太傻了,也是主要不足。

2.应用场景单一:

主要在报天气、讲故事、听歌曲等简单应用场景,不够深入。

3.个性化能力较弱:

无法识别人的情绪、或针对性对话。

最后用户将智能音箱当作普通音箱使用,未实现智能音箱用作智能家居入口或形成商务链接。阻碍了智能音箱产品的继续发展。

问:以ChatGPT、文心一言为代表的生成式AI模型,未来对于智能音箱存在的交互体验不好,功能单一,个性化比较弱的传统痛点有哪些提升?

答:ChatGPT最大的亮点和突破是通用模型的提升、交互能力上的显著提升。ChatGPT4发布后又有了多模态(已经存在多年)的能力,除语音以外,还有视觉等多种交互形式,融进多模态技术后的ChatGPT4更为强大。

生成式AI对智能音箱的提升点:

1、交互体验提升,如理解上下文、多轮对话。因为其模型非常大,所以它已经远远超出了之前几代的智能音箱,在对话体验上一定是非常大的升级;

2、生成内容质量提升满足在真实场景中服务客户,如使用音箱做家庭旅游规划,或者协助办公。

未来有可能会逐步的实现个性化和情感。但目前还不具备此能力,随着未来技术进一步提升,结合数字人概念,可能在这方面也会有提升。

问:生成式AI模型应用到生活当中,可能拓展哪些应用场景?产品形态是不是会发生一些变化?

答:把通用语言大模型看作一个平台,可添加的要素很多。传统语音智能音箱形态受输入端和输出端使用语音决定。但ChatGPT4的技术平台是多模态的,不限于语音。可能很多人会把机器人与其做结合,以前是智能音箱,现在更愿意用机器人称呼其产品,如陪护型机器人、办公机器人,学习机等。此时,有如下形态变化:

1.传感器数量变多,以感知周围的环境,同时在个性化上,对人的身份进行识别;

2.输出端可能不局限于声音,可能有图像和文档:因为声音输出有局限性,不适合做生产效率提升。

另,智能音箱不一定局限于家居场景,机器人也可以是一个数字人的形态,打通智能驾驶、家居场景等。

问:多模态底层技术成熟但距语音视觉真正融合仍差距较大,就现在市场参与者(软件、硬件)而言,短期内的改变有哪些?是否只要在硬件上加一个api接口就能大概实现这些功能?

答:还没有到一接入马上就能产生效果、立刻产生新品的阶段。传统硬件厂商做出产品的形态有区别。虽然接入ChatGPT能提升交互体验,同时也会带来几个问题:

1.算力分布设计的问题:如情绪识别是放在本地处理还是传到后端ChatGPT上处理;

2.时延控制:平台有大量api接口的访问可能会带来较长时延,影响交互体验;

3.成本的问题:考虑用户调用api的付费模式;

4.数据安全性的问题:仅调用ChatGPT没有问题,一旦涉及到用户数据,需要依据国家规定;

5.突破使用场景的问题:聊天场景可能很快就能有一些明显的改善,但对场景的设计和理解(的改善)没有那么快。如果不深度挖掘使用场景,直接调用ChatGPT而不做设计,产品可能无法有质的突破。这就回到了产品形态,它也许会变成一些细分的机器人的形态来出现,而不是以一个真的完全的智能音箱的形态来出现,在目前还没有做到真正的这种全功能的人工智能的情况下,这些细分场景上的设计反而能真正解决用户的问题。

问:能否跳过智能音箱,直接用手机完成智能、智慧家居的这样一些服务?

答:不会以一个手机或一个智能音箱作为单独的入口。业界共识:以后的智能硬件终端有很多种,不可能有一个智能硬件是通识天下的,未来的智能硬件是齐头并进的:学习机、智能手表、电脑、iPad、手机等。

例如:汽车中手机不会取代车机,你的手机跟你的车机之间是可以完全联通的,信息是共享的,APP都是绑定或者是同步的。我们当然可以拿手机去控制所有的东西,但智能音箱形态比较稳定,仍会作为一个智慧家居场景的入口而存在,通过语音控制家里所有的东西。

问:语音交互的优势、劣势?语音交互的技术成熟度?

答:语音交互这种形式一定是最自然最方便的;其情感表达比较直接,能负载人的情绪信息。语音交互还存在如下问题影响其普及:

1.隐私性问题:比如公共场合的语音沟通;

2.交流效率:不如图表数据直接和迅速;

3.语音识别率有待提升:方言、嘈杂的环境、不同声音识别……,这些问题不能通过ChatGPT解决。

引入ChatGPT后:

1、情感交互目前还没有在ChatGPT的基础上完整实现。语音交互技术从四个维度实现情感交流:情感识别(较成熟)、情感模拟(逐步完善)、情绪反应(ChatGPT还不具备这种能力)、交流内容(ChatGPT无法较好取舍可交流的内容)

2、语音交互的智能化提升代表交流具开使具有建设性意义,有利于语音交互普及。

从技术角度,语音交互包括识别语音(ASR)、语言的处理(NLP)、输出语音(TTS)。其中ASR部分整体成熟度较高、NLP有很大的突破、TTS最早开始成熟,但在情感交互上比较难突破。

问:关于ASR,中文成熟度?竞争格局?

答:ASR国内主要的是科大讯飞、百度做得比较好,国外谷歌应该是做的最好的。现在国内国外基本上是属于同一水准了,中文国内好,英文国外好,谷歌在小语种有一些优势,但差距都不大。

问:相比智能音箱,电视机融合了视听交互是不是更适合作为一个交互的平台?智能音箱短期的市场推广?

答:电视机的智能交互一直存在,一种是在电视机上做,一种是拿遥控器交互,但电视机场景受限,很多人不看电视,所以只拿电视机来做这个事情是不够的。

智能音箱短期的市场推广,作为国光或者漫步者这样的音响厂商,因为它本身并不是一个专门的AI的公司,所以他们依然会以智能音箱形态为主去推,更多的是在场景化上还再多做工作;百度、讯飞、阿里、腾讯这种人工智能企业的选择比较多,比如在原有的产品形态上做升级:讯飞升级学习机、小米和百度升级智能音箱,它能实现的生产力效率的提升以及生活的便利程度,可能超过音响厂商。所以不同公司,因为大家的基础能力和着眼的场景完全不一样,在智能音箱领域短期内的打法会不一样,智能音箱往后发展可能反而会形成一些分化。

问:目前各家产品的时间线?国内互联网厂商未来的一个竞争格局?

答:公开信息:讯飞5月份发布新的学习机、百度文心一言会有后续产品。虽然文心一言发布了,但他的能力和ChatGPT本身还存在差距的,但这些差距很快就会缩小。因为在机器学习领域,有一个所谓的 Teacher的方法,可以把ChatGPT作为老师互相训练,能赶上老师的水平,再加上国内本来就不缺数据、用户、应用场景,所以说其实它赶上ChatGPT甚至在某些领域超过它都是非常有可能的。

未来一定会产生两种类型的公司:构建AI平台的公司,比如百度的文心一言、Moss;和做平台应用的公司,百花齐放。

技术侧:百度和讯飞的技术相对比较扎实,但从应用侧:腾讯、阿里、小米的应用场景或者接触的客户群体反而更多。

问:从技术角度介绍一下,真的能够快速赶上国外水平?

答:NLP这个技术前几年是遇到很大瓶颈的,直到ChatGPT3.5之后发现他的智商水平确实提升了。这种提升有两个原因:

1.模型特别大,包含万亿级参数,训练成本当然也非常高;

2.高质量的数据。

大家担心一旦现在ChatGPT联网,可以去网上搜索信息自己学习,他学的东西是否可信,会不会开始一本正经地胡说八道都非常有可能。

中国各大公司已经知道这个问题一定能够做出来,只是需要时间问题,因为别人也做出来了。只是需要一个训练的过程和数据准备的时间。

问:传统的硬件厂商转型的努力方向?

答:这些传统公司反而比之前更有优势。ChatGPT的开放程度,可能会让传统公司介入人工智能更加容易;传统公司有比较固定的用户群体,具有一定的品牌号召力;他们的产品设计能力其实是强于很多互联网公司的,具备global的设计能力,他们的产品经理对自己客户群体发掘非常深入,对场景的理解分析得非常透彻。

问:一些更加综合性的消费电器或消费电子集团(比如美的、TCL、创维)的机会?

答:个人观点就是他们的启动会稍微晚一点。虽然白电是刚需,人工智能的普及率很高,但是应用很少,在接入ChatGPT之后,挖掘用户价值的链条更长,会慢慢启动,享受AI的红利或者带来的益处可能会晚一点,但最终一定会实现智能化。

小结:

ChatGPT在自然语言处理方面取得重大突破,带来了文字交互体验的提升,结合此类生成式AI模型的新一代智能音箱产品有望一改之前单一的场景功能,重新定义产品形态,在更多细分场景下为用户带来更好的体验、提供有价值的服务。

一方面国内生成式AI模型的发展赶上国外水平就是时间问题,国内各厂商可能会形成两种类型的公司:搭建生成式AI模型平台的公司及基于平台开发新应用的公司。另一方面,在新一代智能音箱的推广过程中,不同类型的公司发展路径各异,传统的硬件厂商也存在竞争优势,智能音箱领域短期内将百花齐放,未来可能形成分化。

月人10k:

奋达科技(SZ002681)今天4.64抄底奋达科技也遭了,手头还有个共达电声也惨

wWw.Xtw.com.Cn系统网专业应用软件下载教程,免费windows10系统,win11,办公软件,OA办公系统,OA软件,办公自动化软件,开源系统,移动办公软件等信息,解决一体化的办公方案。

免责声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。内容仅供参考使用,不准确地方联系删除处理!

联系邮箱:773537036@qq.com

标签: 音箱 生成 模型