ai智能音箱开发方案，生成式ai智能音箱

2023-10-14 21:42:38

今天小编为大家分享Windows系统下载、Windows系统教程、windows相关应用程序的文章，希望能够帮助到大家！关注股民纪要：#智能音箱#时间：2023年03月26日市场表现：上周智能音箱板块表现活跃，国光电器上涨幅度超20%，另外包括漫步者、共达电声的表现也不错。市场热点：ChatGPT为代表的生成式AI模型

今天小编为大家分享Windows系统下载、Windows系统教程、windows相关应用程序的文章，希望能够帮助到大家！

关注股民纪要：

#智能音箱#

时间：2023年03月26日

市场表现：上周智能音箱板块表现活跃，国光电器上涨幅度超20%，另外包括漫步者、共达电声的表现也不错。

市场热点：ChatGPT为代表的生成式AI模型与智能音箱的结合，会有何应用前景？今、明年可能推出哪些新品？给市场竞争格局和整个市场的β带来怎样的变化？

智能音箱：2014年Amazon推出了Echo后，其销量迎来迅速增长，但在2019年，全球智能音箱年销量基本稳定在1.7~1.8亿台，国内销量稳定在3,700万台左右。2022年，国内销量同比下滑20%左右，进入增长的瓶颈期。

问：智能音箱领域现在存在哪些问题使得其不能实现渗透率持续提升？

答：Echo推出后，国内国际市场很快跟进：京东、讯飞推出叮咚音箱，哈曼卡顿和微软推出了Invoke、天猫精灵、百度、小米等也都推出了智能音箱。产品推出后销量迅速上升，与国内的补贴政策相关。当时（供应商）的目的是希望智能音箱能够占领智能家居的入口，或者通过智能音箱和商城形成联接。但产品在实际场景中，（智能音箱）存在较多问题：

1、交互体验不好（根本性问题）：前期，受制于远场交互，远距离让交互失效、噪音让交流失效。后期，受制于交互能力，如没有提供“免唤醒”、“多轮对话”。总体来说就是太傻了，也是主要不足。

2、应用场景单一：主要在报天气、讲故事、听歌曲等简单应用场景，不够深入。

3、个性化能力较弱：无法识别人的情绪、或针对性对话。最后用户将智能音箱当作普通音箱使用，未实现智能音箱用作智能家居入口或形成商务链接。阻碍了智能音箱产品的继续发展。更多调研关注：深圳财富club

wWw.517338.Com

问：以ChatGPT、文心一言为代表的生成式AI模型，未来对于智能音箱存在的交互体验不好，功能单一，个性化比较弱的传统痛点有哪些提升？

答：ChatGPT最大的亮点和突破是通用模型的提升、交互能力上的显著提升。ChatGPT4发布后又有了多模态（已经存在多年）的能力，除语音以外，还有视觉等多种交互形式，融进多模态技术后的ChatGPT4更为强大。

生成式AI对智能音箱的提升点：

1、交互体验提升，如理解上下文、多轮对话。因为其模型非常大，所以它已经远远超出了之前几代的智能音箱，在对话体验上一定是非常大的升级；

2、生成内容质量提升满足在真实场景中服务客户，如使用音箱做家庭旅游规划，或者协助办公。未来有可能会逐步的实现个性化和情感。但目前还不具备此能力，随着未来技术进一步提升，结合数字人概念，可能在这方面也会有提升。

问：生成式AI模型应用到生活当中，可能拓展哪些应用场景？产品形态是不是会发生一些变化？

答：把通用语言大模型看作一个平台，可添加的要素很多。传统语音智能音箱形态受输入端和输出端使用语音决定。但ChatGPT4的技术平台是多模态的，不限于语音。可能很多人会把机器人与其做结合，以前是智能音箱，现在更愿意用机器人称呼其产品，如陪护型机器人、办公机器人，学习机等。此时，有如下形态变化：

1、传感器数量变多，以感知周围的环境，同时在个性化上，对人的身份进行识别；

2、输出端可能不局限于声音，可能有图像和文档：因为声音输出有局限性，不适合做生产效率提升。另，智能音箱不一定局限于家居场景，机器人也可以是一个数字人的形态，打通智能驾驶、家居场景等。

问：多模态底层技术成熟但距语音视觉真正融合仍差距较大，就现在市场参与者（软件、硬件）而言，短期内的改变有哪些？是否只要在硬件上加一个api接口就能大概实现这些功能？

答：还没有到一接入马上就能产生效果、立刻产生新品的阶段。传统硬件厂商做出产品的形态有区别。虽然接入ChatGPT能提升交互体验，同时也会带来几个问题：

1、算力分布设计的问题：如情绪识别是放在本地处理还是传到后端ChatGPT上处理；

2、时延控制：平台有大量api接口的访问可能会带来较长时延，影响交互体验；

3、成本的问题：考虑用户调用api的付费模式；

4、数据安全性的问题：仅调用ChatGPT没有问题，一旦涉及到用户数据，需要依据国家规定；

5、突破使用场景的问题：聊天场景可能很快就能有一些明显的改善，但对场景的设计和理解（的改善）没有那么快。如果不深度挖掘使用场景，直接调用ChatGPT而不做设计，产品可能无法有质的突破。这就回到了产品形态，它也许会变成一些细分的机器人的形态来出现，而不是以一个真的完全的智能音箱的形态来出现，在目前还没有做到真正的这种全功能的人工智能的情况下，这些细分场景上的设计反而能真正解决用户的问题。

问：能否跳过智能音箱，直接用手机完成智能、智慧家居的这样一些服务？

答：不会以一个手机或一个智能音箱作为单独的入口。业界共识：以后的智能硬件终端有很多种，不可能有一个智能硬件是通识天下的，未来的智能硬件是齐头并进的：学习机、智能手表、电脑、iPad、手机等。

例如：汽车中手机不会取代车机，你的手机跟你的车机之间是可以完全联通的，信息是共享的，APP都是绑定或者是同步的。我们当然可以拿手机去控制所有的东西，但智能音箱形态比较稳定，仍会作为一个智慧家居场景的入口而存在，通过语音控制家里所有的东西。

问：语音交互的优势、劣势？语音交互的技术成熟度？

答：语音交互这种形式一定是最自然最方便的；其情感表达比较直接，能负载人的情绪信息。语音交互还存在如下问题影响其普及：

1、隐私性问题：比如公共场合的语音沟通；

2、交流效率：不如图表数据直接和迅速；

3、语音识别率有待提升：方言、嘈杂的环境、不同声音识别……，这些问题不能通过ChatGPT解决。

引入ChatGPT后：

1、情感交互目前还没有在ChatGPT的基础上完整实现。语音交互技术从四个维度实现情感交流：情感识别（较成熟）、情感模拟（逐步完善）、情绪反应（ChatGPT还不具备这种能力）、交流内容（ChatGPT无法较好取舍可交流的内容）

2、语音交互的智能化提升代表交流具开使具有建设性意义，有利于语音交互普及。

从技术角度，语音交互包括识别语音（ASR）、语言的处理（NLP）、输出语音（TTS）。其中ASR部分整体成熟度较高、NLP有很大的突破、TTS最早开始成熟，但在情感交互上比较难突破。

问：关于ASR，中文成熟度？竞争格局？

答：ASR国内主要的是科大讯飞、百度做得比较好，国外谷歌应该是做的最好的。现在国内国外基本上是属于同一水准了，中文国内好，英文国外好，谷歌在小语种有一些优势，但差距都不大。

问：相比智能音箱，电视机融合了视听交互是不是更适合作为一个交互的平台？智能音箱短期的市场推广？

答：电视机的智能交互一直存在，一种是在电视机上做，一种是拿遥控器交互，但电视机场景受限，很多人不看电视，所以只拿电视机来做这个事情是不够的。

智能音箱短期的市场推广，作为国光或者漫步者这样的音响厂商，因为它本身并不是一个专门的AI的公司，所以他们依然会以智能音箱形态为主去推，更多的是在场景化上还再多做工作；百度、讯飞、阿里、腾讯这种人工智能企业的选择比较多，比如在原有的产品形态上做升级：讯飞升级学习机、小米和百度升级智能音箱，它能实现的生产力效率的提升以及生活的便利程度，可能超过音响厂商。所以不同公司，因为大家的基础能力和着眼的场景完全不一样，在智能音箱领域短期内的打法会不一样，智能音箱往后发展可能反而会形成一些分化。

问：目前各家产品的时间线？国内互联网厂商未来的一个竞争格局？

答：公开信息：讯飞5月份发布新的学习机、百度文心一言会有后续产品。虽然文心一言发布了，但他的能力和ChatGPT本身还存在差距的，但这些差距很快就会缩小。因为在机器学习领域，有一个所谓的 Teacher的方法，可以把ChatGPT作为老师互相训练，能赶上老师的水平，再加上国内本来就不缺数据、用户、应用场景，所以说其实它赶上ChatGPT甚至在某些领域超过它都是非常有可能的。

未来一定会产生两种类型的公司：构建AI平台的公司，比如百度的文心一言、Moss；和做平台应用的公司，百花齐放。

技术侧：百度和讯飞的技术相对比较扎实，但从应用侧：腾讯、阿里、小米的应用场景或者接触的客户群体反而更多。

问：从技术角度介绍一下，真的能够快速赶上国外水平？

答：NLP这个技术前几年是遇到很大瓶颈的，直到ChatGPT3.5之后发现他的智商水平确实提升了。这种提升有两个原因：

1、模型特别大，包含万亿级参数，训练成本当然也非常高；

2、高质量的数据。

大家担心一旦现在ChatGPT联网，可以去网上搜索信息自己学习，他学的东西是否可信，会不会开始一本正经地胡说八道都非常有可能。中国各大公司已经知道这个问题一定能够做出来，只是需要时间问题，因为别人也做出来了。只是需要一个训练的过程和数据准备的时间。

问：传统的硬件厂商转型的努力方向？

答：这些传统公司反而比之前更有优势。ChatGPT的开放程度，可能会让传统公司介入人工智能更加容易；传统公司有比较固定的用户群体，具有一定的品牌号召力；他们的产品设计能力其实是强于很多互联网公司的，具备global的设计能力，他们的产品经理对自己客户群体发掘非常深入，对场景的理解分析得非常透彻。

问：一些更加综合性的消费电器或消费电子集团（比如美的、TCL、创维）的机会？

答：个人观点就是他们的启动会稍微晚一点。虽然白电是刚需，人工智能的普及率很高，但是应用很少，在接入ChatGPT之后，挖掘用户价值的链条更长，会慢慢启动，享受AI的红利或者带来的益处可能会晚一点，但最终一定会实现智能化。

小结：

ChatGPT在自然语言处理方面取得重大突破，带来了文字交互体验的提升，结合此类生成式AI模型的新一代智能音箱产品有望一改之前单一的场景功能，重新定义产品形态，在更多细分场景下为用户带来更好的体验、提供有价值的服务。

一方面国内生成式AI模型的发展赶上国外水平就是时间问题，国内各厂商可能会形成两种类型的公司：搭建生成式AI模型平台的公司及基于平台开发新应用的公司。另一方面，在新一代智能音箱的推广过程中，不同类型的公司发展路径各异，传统的硬件厂商也存在竞争优势，智能音箱领域短期内将百花齐放，未来可能形成分化。

传音控股(SH688036)科大讯飞(SZ002230)漫步者(SZ002351)

若兰兮：

今天又领涨掌阅科技(SH603533)最后居然成为最强的。。不起眼的悄悄每天涨不停，一旦涨停就是加速//@若兰兮: 百度集团-SW(09888 百度肯定快速接入小爱同学。。。干阿里巴巴的天猫精灵 //@若兰兮: 创业板指上证指数我擦。。。一直说的chatpdf福昕软件(SH688095) 宁夏建材立方数科金山办公(SH688111)全面爆发了但是到今天为止。。。柚子居然还没发现 chatbox 才是大应用。、智能音箱没有一个走出来的。佳禾智能。共达电声//@若兰兮: 漫步者(SZ002351)共达电声(SZ002655) 惠威科技(SZ002888) 互联网大佬几年前纷纷抢占家庭入口。出来了很多智能音箱天猫精灵，小爱同学包括小米的小度的华为的。gpt最大的应用就是通过智能对话的入口，把所有的东西给控制在一起，这一个应用是一个超大级别的应用带来一个巨大的一个增量最晚到6月份市场就会出现大量的智能语音结合chatpgt的作品，看好有新龙头像漫步者19年当年10倍带领板块向上创业板指上证指数广告创意蓝色光标视频运营捷成股份电商光云科技值得买写作阅读 chatpdf 福昕软件小说掌阅科技万兴科技 ai作画昆仑礼物浏览器三六零游戏汤姆猫智能音箱✅✅✅

乐天子：

做好板块轮动与中期持股策略，牛市10倍不是梦

原创行中衡行中衡 2019-09-20 12:23

一、普通投资者在牛市赚10倍的可能性分析

牛市开头三个月，一般是指数涨30%，个股普涨50%左右，这时候市值涨50%。

牛市中间阶段，一般为一年半到两年，指数涨幅一般为30%-50%左右。个股平均涨幅50%-100%，市值需上涨100%-200%。这个阶段重在主流板块与个股选择，体现投资水平的时间点。

牛市最后阶段，一般是半年左右，指数与所有个股以45度角上行，已经是泡沫阶段，但确实是最容易赚钱的阶段。指数涨100%，个股普涨300%-500%。市值需增长500%。

所以算下来，如果完整的满仓从低点到高点，象前面满打满算的话，基本是15倍最少。难度在于在低位时是否满仓，高位时能及时离场。所以打个折扣，就是10倍，包括底部未能满仓，顶部提早提场。

当然这里指的是牛市的盈利可能。熊市来了，普通投资者亏损是很难避免的，只能追求少亏。牛市赚得足了，才能度过一轮熊市的煎熬。

根据A股历史，牛市时间一般是两年半到三年。

所以牛市开头和末尾重在仓位与持股耐心，中间阶段重在风格转换与板块轮动。

牛市中间阶段，要会看主流板块，并且持股一直在主流板块，而且避免频繁换股。

做到了这几条，牛市10倍的梦想是可以有的。

比如说现阶段的主流板块是华为产业链，手机产业链，智能穿戴，VR/AR等。

牛市第二阶段，投资者如何选择投资策略，判断主流板块

关于牛市的判断，2018年10月，2019年7月牛市二阶段，基本都是正确的。如下文：

回顾A股历史上的5轮牛市，哪些经验值得普通投资者借鉴？

A股历史时刻的预判20181020

二、普通投资者为什么在牛市中频繁换股

普通投资者经常在投资中频繁换股，买卖与换股往往是冲动型，一轮牛市下来，回头一看，还不如一直持股。

频繁换股有哪些问题？长期持有，期望手中个股几年10倍，还是适当的板块轮动换股，到底哪个投资方式更适合普通投资者呢？我们可以从A股历史来寻找答案。

根据我的理解，普通投资者在牛市中老换股，是因为别人的股票涨得多，自己的股票不涨或者涨得少，别人家的孩子比自家的好。

这种换股思路是有问题的，因为牛市中板块有轮动，大盘股与小盘股，成长股与价值股，传统蓝筹股与科技股，重组股与绩优股等，在不同阶段都会有突出的表现。

牛市的最后阶段，涨幅都是5倍甚至10倍以上。没涨过的个股，牛市后期都会由于各种因素无理由的水涨船高。

如果只是因为手中个股不涨而换股，就容易变成追涨杀跌。一轮牛市下来，连个股平均涨幅都达不到。

牛市中普通人的心态：

1、攀比妒忌：持股不如别人的涨幅，彻夜难眠不舒服；

2、自大短视：买了就涨自以为对，买了就跌心里不爽；

3、禀赋效应：对已买入的股票只看利好忽视利空因素；

4、从众倾向：关注追逐热点，其实冷清的地方才有金；

5、落袋倾向：过早想卖出表现良好但仍然低估的股票；

6、厌恶损失：对产生亏损但是已经高估的股票不卖出；

7、错价幻觉：越涨越喜，越跌越恶，性价比其实相反。

频繁换股，往往就是因为心态问题，而不是理性分析的结果。投资应该基于理性和客观的思维。

如果你对于板块轮动有较深的研究，而且自己有能力把握，换股也是可以的。下面以2005年-2007年的牛市行情为例，看板块轮动与个股在不同阶段的涨幅差异。

三、以2005年的牛市来看板块轮动

回首998点到6124点的大牛市，大致可分为以下六波行情。

可以看出大盘股与小盘股，蓝筹股与题材股，重组股与绩优股，成长股与价值股，在各个阶段表现不同。有普涨的时候，也有分化的时候，但到最终除金融、地产等主流板块以外，多数个股涨幅差别并没有那么大。

第一波：2005年6月6日-2005年12月30日，大盘从998点涨到1160点，涨幅约15%，沪市日均成交88亿元。

在此期间，中小板个股平均上涨50%（算数平均，下同），上证50涨23%，沪深300涨21%，很明显市场的领涨板块是小盘股。

第二波：2006年1月1日-2006年7月6日，大盘从1160点涨到1700点，涨幅约45%，沪市日均成交211亿元，较前一波放大了1倍。

在此期间，沪深300涨87%，上证50涨82%，中小板涨50%，市场首度出现普涨格局，98%的个股上涨，资金开始流向蓝筹股。

第三波：2006年7月7日-2006年12月14日，大盘从1700点涨到2245点，涨幅约40%，沪市日均成交254亿元。

在此期间，上证50涨43%，沪深300涨26%，中小板反而下跌1%，所有个股的平均涨幅不到10%，仅56%的个股上涨，市场第一次出现“二八现象”。在最重要的历史关口，大盘权重股成为带头羊，金融和地产成为急先锋，大涨逾30%。

第四波：2006年12月15日-2007年2月26日，大盘从2245点涨到3000点，涨幅约30%。

在此期间，沪深300涨58%，上证50涨56%，中小板涨36%，99%的个股上涨，市场第二次在放量的情况下出现普涨格局，牛市进入新一轮炒作。

第五波：2007年2月27日-2007年5月29日，大盘从3000点涨到4300点，涨幅约40%。市场几乎以45度角的直线刷新新高，仅有的几次回调也以单日回抽的方式完成，市盈率已没有参考意义。

在此期间，沪深300涨72%，上证50涨44%，中小板涨45%，所有A股平均上涨88%，99%的个股上涨，市场继续普涨，而大盘蓝筹股则相对表现疲弱。

第六波：2007年5月30日-2007年10月16日，大盘从4300点涨到6124点，涨幅约40%，沪市日均成交1500亿元，成交量已不再放大，基金主导指标股发动了蓝筹泡沫行情，A股市盈率超过60倍。

在此期间，上证50涨61%，沪深300涨43%，中小板涨1%，而A股平均仅上涨7%，仅43%的个股上涨，这是一个超级二八行情，指数与个股表现出现严重背离。

四、持有到牛市的最后阶段才是普通投资者的最优选择

还有一点要注意的是，牛市在最开始的一年到两年时间，个股平均涨幅并不大。而牛市最后的半年多时间，却是个股普涨，平均涨几倍的行情。

所以，普通投资者耐心持股到牛市的最终泡沫阶段，才能有超额的收益。

下面两张图统计了2005年，2013年的大牛市平均股价表现。可见最后半年个股的平均涨幅比例，是牛市前面两年的2倍到3倍左右。

2005年-2007年的A股平均股价

2013年-2015年的A股平均股价

五、什么才是正确的换股方法

1、原来的买入标的存在缺陷。

比如说公司业绩，基本面出现了问题，或者与自己原来的判断不符。

2、买入时标的分析存在错误。

由于主观原因或个人偏好，对于标的选择出现了错误，现在及时纠正。

3、有更好的可替代个股。

通过研究，发现有成长性更好，估值更低，预期更好的标的。新标的更符合当前市场的风格。

4、单一个股仓位太重，压力太大，影响人个情绪与生活。

投资盈利的最终目的是有良好的人际关系，美满的家庭，和幸福的生活，否则赚最多的钱也失去了意义。

5、股价涨得太多，已远远偏离内在价值与基本面。

这种换股方式，我认为比较合理，适合不同的市场阶段。

就是投资标的达到预期收益后不要简单机械地长期持有，而是通过换股的方式换成另一个安全边际更大的投资标的。

举例来说，在一只股票上赚8倍，就相当于在3只股票上赚1倍，实现前者要比后者难许多。在当前信息透明度较高的时代，市场有效性在不断增强，很多预期都在提前被反映，换股轮动是不错的选择。

很多人觉得从六七元钱拿到100元钱的人才牛，但这样离人性远，用换股轮动的方式离人性更近，风险更小。做投资没必要挑战自己的极限，明明有大道可以走，没必要走小道险径。

毕竟我们投资的最终目标，是用最优的方式实现盈利的最大化，而不是挑战吉尼斯世界纪录，或者去获得别人的认可和称赞。

长期投资只要能取得优秀的收益，是不是买到十倍股又有什么区别呢？

相关公司分析：

谈谈捷成股份

谈谈水晶光电

谈谈共达电声的参与价值

行中衡

方向比选择重要

喜欢此内容的人还喜欢

我决定自己做平台了

宇宙之心数藏

不喜欢

不看的原因

内容质量低不看此公众号

整车功能介绍

电控技术大师

不喜欢

不看的原因

内容质量低不看此公众号

纯电动汽车整车控制器原理及功能解析

电控技术大师

不喜欢

不看的原因

内容质量低不看此公众号

若兰兮：

漫步者(SZ002351) 全志科技(SZ300458) 这个有突破的样子共达电声(SZ002655) 其实这个有个很硬的逻辑当年天猫精灵，小爱同学包括小米？没有实现的愿望，有chatgpt#chatgpt# 很轻易就实现了就是新一代的入口，智能语音音箱，在gpt公布API的情况下，只要吊了API，这个整体的流畅的对话能给出很详细的一个解决方案，整体智能语音相会得到一个集体的大爆发，不再是以前那种智障的一样的东西可是一个智能的东西。有板块集体翻倍的潜力mark下后面回头验证创业板指上证指数

拿只笔上前线：

声学行业算科技行业里较古老的子行业，也是需求较刚性相对其它科技行业发展较稳定的行业。希望ai这次变革能催化万物有声时代更快到来。共达电声(SZ002655)歌尔股份(SZ002241) 瑞声科技(02018)

共达电声(SZ002655)：

共达电声：共达电声股份有限公司关于收购资产暨关联交易的完成公告网页链接

每日经济新闻：

每经AI快讯，有投资者在投资者互动平台提问：请问贵司有研发生产智能音箱的计划吗？

共达电声（002655.SZ）3月31日在投资者互动平台表示，公司专注在声学领域的发展，产品广泛应用于智能车载、智能穿戴、智能家居、智能手机、AI、VR等消费类电子产品领域。

(记者毕陆名)

免责声明：本文内容与数据仅供参考，不构成投资建议，使用前核实。据此操作，风险自担。

每日经济新闻

贝叶斯韭黄：

市场表现：上周智能音箱板块表现活跃，国光电器上涨幅度超20%，另外包括漫步者、共达电声的表现也不错。

问：智能音箱领域现在存在哪些问题使得其不能实现渗透率持续提升？

1、交互体验不好（根本性问题）：

前期，受制于远场交互，远距离让交互失效、噪音让交流失效。

后期，受制于交互能力，如没有提供“免唤醒”、“多轮对话”。总体来说就是太傻了，也是主要不足。

2、应用场景单一：

主要在报天气、讲故事、听歌曲等简单应用场景，不够深入。

3、个性化能力较弱：

无法识别人的情绪、或针对性对话。

最后用户将智能音箱当作普通音箱使用，未实现智能音箱用作智能家居入口或形成商务链接。阻碍了智能音箱产品的继续发展。

问：以ChatGPT、文心一言为代表的生成式AI模型，未来对于智能音箱存在的交互体验不好，功能单一，个性化比较弱的传统痛点有哪些提升？

生成式AI对智能音箱的提升点：

1、交互体验提升，如理解上下文、多轮对话。因为其模型非常大，所以它已经远远超出了之前几代的智能音箱，在对话体验上一定是非常大的升级；

2、生成内容质量提升满足在真实场景中服务客户，如使用音箱做家庭旅游规划，或者协助办公。

未来有可能会逐步的实现个性化和情感。但目前还不具备此能力，随着未来技术进一步提升，结合数字人概念，可能在这方面也会有提升。

问：生成式AI模型应用到生活当中，可能拓展哪些应用场景？产品形态是不是会发生一些变化？

1、传感器数量变多，以感知周围的环境，同时在个性化上，对人的身份进行识别；

2、输出端可能不局限于声音，可能有图像和文档：因为声音输出有局限性，不适合做生产效率提升。

另，智能音箱不一定局限于家居场景，机器人也可以是一个数字人的形态，打通智能驾驶、家居场景等。

1、算力分布设计的问题：如情绪识别是放在本地处理还是传到后端ChatGPT上处理；

2、时延控制：平台有大量api接口的访问可能会带来较长时延，影响交互体验；

3、成本的问题：考虑用户调用api的付费模式；

4、数据安全性的问题：仅调用ChatGPT没有问题，一旦涉及到用户数据，需要依据国家规定；

问：能否跳过智能音箱，直接用手机完成智能、智慧家居的这样一些服务？

问：语音交互的优势、劣势？语音交互的技术成熟度？

答：语音交互这种形式一定是最自然最方便的；其情感表达比较直接，能负载人的情绪信息。语音交互还存在如下问题影响其普及：

1、隐私性问题：比如公共场合的语音沟通；

2、交流效率：不如图表数据直接和迅速；

3、语音识别率有待提升：方言、嘈杂的环境、不同声音识别……，这些问题不能通过ChatGPT解决。

引入ChatGPT后：

2、语音交互的智能化提升代表交流具开使具有建设性意义，有利于语音交互普及。

问：关于ASR，中文成熟度？竞争格局？

问：相比智能音箱，电视机融合了视听交互是不是更适合作为一个交互的平台？智能音箱短期的市场推广？

问：目前各家产品的时间线？国内互联网厂商未来的一个竞争格局？

未来一定会产生两种类型的公司：构建AI平台的公司，比如百度的文心一言、Moss；和做平台应用的公司，百花齐放。

技术侧：百度和讯飞的技术相对比较扎实，但从应用侧：腾讯、阿里、小米的应用场景或者接触的客户群体反而更多。

问：从技术角度介绍一下，真的能够快速赶上国外水平？

答：NLP这个技术前几年是遇到很大瓶颈的，直到ChatGPT3.5之后发现他的智商水平确实提升了。这种提升有两个原因：

1、模型特别大，包含万亿级参数，训练成本当然也非常高；

2、高质量的数据。

大家担心一旦现在ChatGPT联网，可以去网上搜索信息自己学习，他学的东西是否可信，会不会开始一本正经地胡说八道都非常有可能。

中国各大公司已经知道这个问题一定能够做出来，只是需要时间问题，因为别人也做出来了。只是需要一个训练的过程和数据准备的时间。

问：传统的硬件厂商转型的努力方向？

问：一些更加综合性的消费电器或消费电子集团（比如美的、TCL、创维）的机会？

晶晨股份瑞芯微全志科技泰晶科技

小结：

晶晨股份(SH688099) 瑞芯微(SH603893) 泰晶科技(SH603738)

股民纪要：

#顶流基金隐形重仓股的大曝光#

时间：2023年03月26日

市场表现：上周智能音箱板块表现活跃，国光电器上涨幅度超20%，另外包括漫步者、共达电声的表现也不错。

问：智能音箱领域现在存在哪些问题使得其不能实现渗透率持续提升？

2、应用场景单一：主要在报天气、讲故事、听歌曲等简单应用场景，不够深入。

3、个性化能力较弱：无法识别人的情绪、或针对性对话。最后用户将智能音箱当作普通音箱使用，未实现智能音箱用作智能家居入口或形成商务链接。阻碍了智能音箱产品的继续发展。

问：以ChatGPT、文心一言为代表的生成式AI模型，未来对于智能音箱存在的交互体验不好，功能单一，个性化比较弱的传统痛点有哪些提升？

生成式AI对智能音箱的提升点：

1、交互体验提升，如理解上下文、多轮对话。因为其模型非常大，所以它已经远远超出了之前几代的智能音箱，在对话体验上一定是非常大的升级；

问：生成式AI模型应用到生活当中，可能拓展哪些应用场景？产品形态是不是会发生一些变化？

1、传感器数量变多，以感知周围的环境，同时在个性化上，对人的身份进行识别；

1、算力分布设计的问题：如情绪识别是放在本地处理还是传到后端ChatGPT上处理；

2、时延控制：平台有大量api接口的访问可能会带来较长时延，影响交互体验；

3、成本的问题：考虑用户调用api的付费模式；

4、数据安全性的问题：仅调用ChatGPT没有问题，一旦涉及到用户数据，需要依据国家规定；

问：能否跳过智能音箱，直接用手机完成智能、智慧家居的这样一些服务？

例如：汽车中手机不会取代车机，你的手机跟你的车机之间是可以完全联通的，信息是共享的，APP都是绑定或者是同步的。我们当然可以拿手机去控制所有的东西，但智能音箱形态比较稳定，仍会作为一个智慧家居场景的入口而存在，通过语音控制家里所有的东西。更多调研关注：深圳财富club

问：语音交互的优势、劣势？语音交互的技术成熟度？

答：语音交互这种形式一定是最自然最方便的；其情感表达比较直接，能负载人的情绪信息。语音交互还存在如下问题影响其普及：

1、隐私性问题：比如公共场合的语音沟通；

2、交流效率：不如图表数据直接和迅速；

3、语音识别率有待提升：方言、嘈杂的环境、不同声音识别……，这些问题不能通过ChatGPT解决。

引入ChatGPT后：

2、语音交互的智能化提升代表交流具开使具有建设性意义，有利于语音交互普及。

问：关于ASR，中文成熟度？竞争格局？

问：相比智能音箱，电视机融合了视听交互是不是更适合作为一个交互的平台？智能音箱短期的市场推广？

问：目前各家产品的时间线？国内互联网厂商未来的一个竞争格局？

未来一定会产生两种类型的公司：构建AI平台的公司，比如百度的文心一言、Moss；和做平台应用的公司，百花齐放。

技术侧：百度和讯飞的技术相对比较扎实，但从应用侧：腾讯、阿里、小米的应用场景或者接触的客户群体反而更多。

问：从技术角度介绍一下，真的能够快速赶上国外水平？

答：NLP这个技术前几年是遇到很大瓶颈的，直到ChatGPT3.5之后发现他的智商水平确实提升了。这种提升有两个原因：

1、模型特别大，包含万亿级参数，训练成本当然也非常高；

2、高质量的数据。

问：传统的硬件厂商转型的努力方向？

问：一些更加综合性的消费电器或消费电子集团（比如美的、TCL、创维）的机会？

小结：

传音控股(SH688036)漫步者(SZ002351)国光电器(SZ002045)

挠头鲨的深度逻辑：

观点仅供参考，买卖需要择时！

时间： 2023 年 03 月 26 日

市场热点：

ChatGPT 为代表的生成式 AI 模型与智能音箱的结合，会有何应用前景？

今、明年可能推出哪些新品？

给市场竞争格局和整个市场的 β 带来怎样的变化？

智能音箱： 2014 年 Amazon 推出了Echo后，其销量迎来迅速增长，但在 2019 年，全球智能音箱年销量基本稳定在 1. 7~1. 8 亿台，国内销量稳定在 3, 700 万台左右。 2022 年，国内销量同比下滑 20% 左右，进入增长的瓶颈期。

问：智能音箱领域现在存在哪些问题使得其不能实现渗透率持续提升？

答： Echo 推出后，国内国际市场很快跟进：京东、讯飞推出叮咚音箱，哈曼卡顿和微软推出了 Invoke 、天猫精灵、百度、小米等也都推出了智能音箱。产品推出后销量迅速上升，与国内的补贴政策相关。当时（供应商）的目的是希望智能音箱能够占领智能家居的入口，或者通过智能音箱和商城形成联接。

但产品在实际场景中，（智能音箱）存在较多问题：

1 、交互体验不好（根本性问题）：前期，受制于远场交互，远距离让交互失效、噪音让交流失效。后期，受制于交互能力，如没有提供 “ 免唤醒 ” 、 “ 多轮对话 ” 。总体来说就是太傻了，也是主要不足。

2 、应用场景单一：主要在报天气、讲故事、听歌曲等简单应用场景，不够深入。

3 、个性化能力较弱：无法识别人的情绪、或针对性对话。最后用户将智能音箱当作普通音箱使用，未实现智能音箱用作智能家居入口或形成商务链接。阻碍了智能音箱产品的继续发展。

问：以 ChatGPT 、文心一言为代表的生成式 AI 模型，未来对于智能音箱存在的交互体验不好，功能单一，个性化比较弱的传统痛点有哪些提升？

答： ChatGPT 最大的亮点和突破是通用模型的提升、交互能力上的显著提升。 ChatGPT4 发布后又有了多模态（已经存在多年）的能力，除语音以外，还有视觉等多种交互形式，融进多模态技术后的 ChatGPT4 更为强大。

生成式 AI 对智能音箱的提升点：

1 、交互体验提升，如理解上下文、多轮对话。因为其模型非常大，所以它已经远远超出了之前几代的智能音箱，在对话体验上一定是非常大的升级；

2 、生成内容质量提升满足在真实场景中服务客户，如使用音箱做家庭旅游规划，或者协助办公。未来有可能会逐步的实现个性化和情感。但目前还不具备此能力，随着未来技术进一步提升，结合数字人概念，可能在这方面也会有提升。

问：生成式 AI 模型应用到生活当中，可能拓展哪些应用场景？产品形态是不是会发生一些变化？

答：把通用语言大模型看作一个平台，可添加的要素很多。传统语音智能音箱形态受输入端和输出端使用语音决定。但 ChatGPT4 的技术平台是多模态的，不限于语音。可能很多人会把机器人与其做结合，以前是智能音箱，现在更愿意用机器人称呼其产品，如陪护型机器人、办公机器人，学习机等。

此时，有如下形态变化：

1 、传感器数量变多，以感知周围的环境，同时在个性化上，对人的身份进行识别；

2 、输出端可能不局限于声音，可能有图像和文档：因为声音输出有局限性，不适合做生产效率提升。另，智能音箱不一定局限于家居场景，机器人也可以是一个数字人的形态，打通智能驾驶、家居场景等。

答：还没有到一接入马上就能产生效果、立刻产生新品的阶段。传统硬件厂商做出产品的形态有区别。虽然接入 ChatGPT 能提升交互体验，同时也会带来几个问题： 1 、算力分布设计的问题：如情绪识别是放在本地处理还是传到后端 ChatGPT 上处理； 2 、时延控制：平台有大量 api 接口的访问可能会带来较长时延，影响交互体验； 3 、成本的问题：考虑用户调用 api 的付费模式； 4 、数据安全性的问题：仅调用 ChatGPT 没有问题，一旦涉及到用户数据，需要依据国家规定； 5 、突破使用场景的问题：聊天场景可能很快就能有一些明显的改善，但对场景的设计和理解（的改善）没有那么快。如果不深度挖掘使用场景，直接调用 ChatGPT 而不做设计，产品可能无法有质的突破。这就回到了产品形态，它也许会变成一些细分的机器人的形态来出现，而不是以一个真的完全的智能音箱的形态来出现，在目前还没有做到真正的这种全功能的人工智能的情况下，这些细分场景上的设计反而能真正解决用户的问题。

问：能否跳过智能音箱，直接用手机完成智能、智慧家居的这样一些服务？

答：不会以一个手机或一个智能音箱作为单独的入口。

业界共识：以后的智能硬件终端有很多种，不可能有一个智能硬件是通识天下的，未来的智能硬件是齐头并进的：学习机、智能手表、电脑、 iPad 、手机等。例如：汽车中手机不会取代车机，你的手机跟你的车机之间是可以完全联通的，信息是共享的， APP 都是绑定或者是同步的。我们当然可以拿手机去控制所有的东西，但智能音箱形态比较稳定，仍会作为一个智慧家居场景的入口而存在，通过语音控制家里所有的东西。

问：语音交互的优势、劣势？语音交互的技术成熟度？

答：语音交互这种形式一定是最自然最方便的；其情感表达比较直接，能负载人的情绪信息。语音交互还存在如下问题影响其普及： 1 、隐私性问题：比如公共场合的语音沟通； 2 、交流效率：不如图表数据直接和迅速；3、语音识别率有待提升：方言、嘈杂的环境、不同声音识别 …… ，这些问题不能通过 ChatGPT 解决。

引入 ChatGPT 后： 1 、情感交互目前还没有在 ChatGPT 的基础上完整实现。语音交互技术从四个维度实现情感交流：情感识别（较成熟）、情感模拟（逐步完善）、情绪反应（ ChatGPT 还不具备这种能力）、交流内容（ ChatGPT 无法较好取舍可交流的内容） 2 、语音交互的智能化提升代表交流具开使具有建设性意义，有利于语音交互普及。从技术角度，语音交互包括识别语音（ ASR ）、语言的处理（ NLP ）、输出语音（ TTS ）。其中 ASR 部分整体成熟度较高、 NLP 有很大的突破、 TTS 最早开始成熟，但在情感交互上比较难突破。

问：关于 ASR ，中文成熟度？竞争格局？

答： ASR 国内主要的是科大讯飞、百度做得比较好，国外谷歌应该是做的最好的。现在国内国外基本上是属于同一水准了，中文国内好，英文国外好，谷歌在小语种有一些优势，但差距都不大。

问：相比智能音箱，电视机融合了视听交互是不是更适合作为一个交互的平台？智能音箱短期的市场推广？

答：电视机的智能交互一直存在，一种是在电视机上做，一种是拿遥控器交互，但电视机场景受限，很多人不看电视，所以只拿电视机来做这个事情是不够的。智能音箱短期的市场推广，作为国光或者漫步者这样的音响厂商，因为它本身并不是一个专门的 AI 的公司，所以他们依然会以智能音箱形态为主去推，更多的是在场景化上还再多做工作；百度、讯飞、阿里、腾讯这种人工智能企业的选择比较多，比如在原有的产品形态上做升级：讯飞升级学习机、小米和百度升级智能音箱，它能实现的生产力效率的提升以及生活的便利程度，可能超过音响厂商。所以不同公司，因为大家的基础能力和着眼的场景完全不一样，在智能音箱领域短期内的打法会不一样，智能音箱往后发展可能反而会形成一些分化。

问：目前各家产品的时间线？国内互联网厂商未来的一个竞争格局？

答：公开信息：讯飞 5 月份发布新的学习机、百度文心一言会有后续产品。虽然文心一言发布了，但他的能力和 ChatGPT 本身还存在差距的，但这些差距很快就会缩小。因为在机器学习领域，有一个所谓的 Teacher 的方法，可以把 ChatGPT 作为老师互相训练，能赶上老师的水平，再加上国内本来就不缺数据、用户、应用场景，所以说其实它赶上 ChatGPT 甚至在某些领域超过它都是非常有可能的。

未来一定会产生两种类型的公司：构建 AI 平台的公司，比如百度的文心一言、 Moss ；和做平台应用的公司，百花齐放。技术侧：百度和讯飞的技术相对比较扎实，但从应用侧：腾讯、阿里、小米的应用场景或者接触的客户群体反而更多。

问：从技术角度介绍一下，真的能够快速赶上国外水平？

答： NLP 这个技术前几年是遇到很大瓶颈的，直到 ChatGPT3. 5 之后发现他的智商水平确实提升了。这种提升有两个原因： 1 、模型特别大，包含万亿级参数，训练成本当然也非常高； 2 、高质量的数据。大家担心一旦现在 ChatGPT 联网，可以去网上搜索信息自己学习，他学的东西是否可信，会不会开始一本正经地胡说八道都非常有可能。中国各大公司已经知道这个问题一定能够做出来，只是需要时间问题，因为别人也做出来了。只是需要一个训练的过程和数据准备的时间。

问：传统的硬件厂商转型的努力方向？

答：这些传统公司反而比之前更有优势。 ChatGPT 的开放程度，可能会让传统公司介入人工智能更加容易；传统公司有比较固定的用户群体，具有一定的品牌号召力；他们的产品设计能力其实是强于很多互联网公司的，具备 global 的设计能力，他们的产品经理对自己客户群体发掘非常深入，对场景的理解分析得非常透彻。

问：一些更加综合性的消费电器或消费电子集团（比如美的、 TCL 、创维）的机会？

答：个人观点就是他们的启动会稍微晚一点。虽然白电是刚需，人工智能的普及率很高，但是应用很少，在接入 ChatGPT 之后，挖掘用户价值的链条更长，会慢慢启动，享受 AI 的红利或者带来的益处可能会晚一点，但最终一定会实现智能化。

小结： ChatGPT 在自然语言处理方面取得重大突破，带来了文字交互体验的提升，结合此类生成式 AI 模型的新一代智能音箱产品有望一改之前单一的场景功能，重新定义产品形态，在更多细分场景下为用户带来更好的体验、提供有价值的服务。一方面国内生成式 AI 模型的发展赶上国外水平就是时间问题，国内各厂商可能会形成两种类型的公司：搭建生成式 AI 模型平台的公司及基于平台开发新应用的公司。另一方面，在新一代智能音箱的推广过程中，不同类型的公司发展路径各异，传统的硬件厂商也存在竞争优势，智能音箱领域短期内将百花齐放，未来可能形成分化。

国光电器(SZ002045) 漫步者(SZ002351) 共达电声(SZ002655)

月人10k：

共达电声(SZ002655)共达电声，奋达科技，全TM不发达

重新注册了：

共达电声买

共达电声(SZ002655)：

共达电声：共达电声股份有限公司关于收到深圳证券交易所《关于共达电声股份有限公司申请向特定对象发行股票的审核问询函》的公告网页链接

共达电声(SZ002655)：

同花顺（300033）金融研究中心3月31日讯，有投资者向共达电声（002655）提问，请问贵司有研发生产智能音箱的计划吗？公司回答表示，您好，公司专注在声学领域的发展，产品广泛应用于智能车载、智能穿戴、智能家居、智能手机、AI、VR... 网页链接

vvvvv13：

共达电声(SZ002655)看看漫步者，这差距太大了

等待击球：

智能音箱与生成式AI结合前景展望2023-03-29

市场表现：上周智能音箱板块表现活跃，国光电器上涨幅度超20%，另外包括漫步者、共达电声的表现也不错。

问：智能音箱领域现在存在哪些问题使得其不能实现渗透率持续提升？

1.交互体验不好（根本性问题）：

前期，受制于远场交互，远距离让交互失效、噪音让交流失效。

后期，受制于交互能力，如没有提供“免唤醒”、“多轮对话”。总体来说就是太傻了，也是主要不足。

2.应用场景单一：

主要在报天气、讲故事、听歌曲等简单应用场景，不够深入。

3.个性化能力较弱：

无法识别人的情绪、或针对性对话。

最后用户将智能音箱当作普通音箱使用，未实现智能音箱用作智能家居入口或形成商务链接。阻碍了智能音箱产品的继续发展。

问：以ChatGPT、文心一言为代表的生成式AI模型，未来对于智能音箱存在的交互体验不好，功能单一，个性化比较弱的传统痛点有哪些提升？

生成式AI对智能音箱的提升点：

1、交互体验提升，如理解上下文、多轮对话。因为其模型非常大，所以它已经远远超出了之前几代的智能音箱，在对话体验上一定是非常大的升级；

2、生成内容质量提升满足在真实场景中服务客户，如使用音箱做家庭旅游规划，或者协助办公。

未来有可能会逐步的实现个性化和情感。但目前还不具备此能力，随着未来技术进一步提升，结合数字人概念，可能在这方面也会有提升。

问：生成式AI模型应用到生活当中，可能拓展哪些应用场景？产品形态是不是会发生一些变化？

1.传感器数量变多，以感知周围的环境，同时在个性化上，对人的身份进行识别；

2.输出端可能不局限于声音，可能有图像和文档：因为声音输出有局限性，不适合做生产效率提升。

另，智能音箱不一定局限于家居场景，机器人也可以是一个数字人的形态，打通智能驾驶、家居场景等。

1.算力分布设计的问题：如情绪识别是放在本地处理还是传到后端ChatGPT上处理；

2.时延控制：平台有大量api接口的访问可能会带来较长时延，影响交互体验；

3.成本的问题：考虑用户调用api的付费模式；

4.数据安全性的问题：仅调用ChatGPT没有问题，一旦涉及到用户数据，需要依据国家规定；

5.突破使用场景的问题：聊天场景可能很快就能有一些明显的改善，但对场景的设计和理解（的改善）没有那么快。如果不深度挖掘使用场景，直接调用ChatGPT而不做设计，产品可能无法有质的突破。这就回到了产品形态，它也许会变成一些细分的机器人的形态来出现，而不是以一个真的完全的智能音箱的形态来出现，在目前还没有做到真正的这种全功能的人工智能的情况下，这些细分场景上的设计反而能真正解决用户的问题。

问：能否跳过智能音箱，直接用手机完成智能、智慧家居的这样一些服务？

问：语音交互的优势、劣势？语音交互的技术成熟度？

答：语音交互这种形式一定是最自然最方便的；其情感表达比较直接，能负载人的情绪信息。语音交互还存在如下问题影响其普及：

1.隐私性问题：比如公共场合的语音沟通；

2.交流效率：不如图表数据直接和迅速；

3.语音识别率有待提升：方言、嘈杂的环境、不同声音识别……，这些问题不能通过ChatGPT解决。

引入ChatGPT后：

2、语音交互的智能化提升代表交流具开使具有建设性意义，有利于语音交互普及。

问：关于ASR，中文成熟度？竞争格局？

问：相比智能音箱，电视机融合了视听交互是不是更适合作为一个交互的平台？智能音箱短期的市场推广？

问：目前各家产品的时间线？国内互联网厂商未来的一个竞争格局？

未来一定会产生两种类型的公司：构建AI平台的公司，比如百度的文心一言、Moss；和做平台应用的公司，百花齐放。

技术侧：百度和讯飞的技术相对比较扎实，但从应用侧：腾讯、阿里、小米的应用场景或者接触的客户群体反而更多。

问：从技术角度介绍一下，真的能够快速赶上国外水平？

答：NLP这个技术前几年是遇到很大瓶颈的，直到ChatGPT3.5之后发现他的智商水平确实提升了。这种提升有两个原因：

1.模型特别大，包含万亿级参数，训练成本当然也非常高；

2.高质量的数据。

大家担心一旦现在ChatGPT联网，可以去网上搜索信息自己学习，他学的东西是否可信，会不会开始一本正经地胡说八道都非常有可能。

中国各大公司已经知道这个问题一定能够做出来，只是需要时间问题，因为别人也做出来了。只是需要一个训练的过程和数据准备的时间。

问：传统的硬件厂商转型的努力方向？

问：一些更加综合性的消费电器或消费电子集团（比如美的、TCL、创维）的机会？

小结：

月人10k：

奋达科技(SZ002681)今天4.64抄底奋达科技也遭了，手头还有个共达电声也惨

wWw.Xtw.com.Cn系统网专业应用软件下载教程，免费windows10系统,win11,办公软件,OA办公系统,OA软件,办公自动化软件,开源系统,移动办公软件等信息，解决一体化的办公方案。

免责声明：本文中引用的各种信息及资料（包括但不限于文字、数据、图表及超链接等）均来源于该信息及资料的相关主体（包括但不限于公司、媒体、协会等机构）的官方网站或公开发表的信息。内容仅供参考使用,不准确地方联系删除处理！

联系邮箱：773537036@qq.com

标签：音箱生成模型

上一篇：applocker如何更改，软件applocker怎么使用

下一篇：intel漏洞影响的cpu，intelcpu被曝什么漏洞影响全球

ai智能音箱开发方案，生成式ai智能音箱

莱网畅联流量卡，莱网联盟供货商

小爱音箱使用教程全过程，小爱音箱怎么使用教程

dcss蓝牙音响连接新设备，dcss蓝牙音响怎么样使用

如何解决音箱的呜呜电流声，音箱有电流声音怎么消除

麦博音响耐用吗，麦博十周年与麦博200区别

usb音响有电流声是什么原因，台式机连usb小音箱有电流声