手机浏览器扫描二维码访问
(小燕文学WwW.XiaoYanwenXue.CoM)
智能音箱的硬件和一些生态内容,都已经搞定了,就差一个智能的软件了。
要说智能音箱,智能才是他的心脏部位。
但是智能这个词语,听起来很简单,无非就是两个字,但是做起来却是“蜀道难,难于上青天。”这种感觉。
就拿那个唤醒词来说吧,林奇决定要把那个唤醒词去掉,可是研究了很久,还没有研究到去掉唤醒词的地步。
因为在第一步的时候就被束缚了手脚,那就是语音识别。
近些年来人工智能里面的机器学习发展的很是厉害,尤其是机器学习中的深度学习。
深度学习利用的是大于3层的神经络来学习,有输入层,输出层,中间还有很多隐藏层。
只需要把大量的数据提供过来,输入给写好的程序,运行一段时间之后,就会计算出来一个模型。
输入的数据越多,运算的次数越多,一般情况下得出来的结果也越好。但是这里面还有一个需要注意的就是不能太依赖于输入的数据了,否则会出现过拟合的现象。
过拟合就是在给定的数据中,让程序来预测某些结果,它能达到很高的准确性,比如99999,但是到了通用的数据下,这个模型表现的就很差,可能只有的准确性。
林奇开始的时候也是利用了深度多层神经络来进行训练语音样本的,因为现在市面上最流行的就是种方法。
不过别的公司能采用这种是因为他们有很多的音频资料,并且都是用户自己上传的一些音频素材,比如深信,月活跃量一度超过10亿人,可想而知,每天用它发语音的有多少人,他能收集到多少的语音片段。
再比如寻她、搜猫和可大讯飞,他们三家公司都有自己的输入法,每一个人都说自己的语音识别准确率最高,在手机上用这三种输入法的大有人在,当然虽然在一些环境下用语音输入很是麻烦,但是有一些特定的环境还是很不错的。
所以他们收集到的来自真人的各种场景的语音片段,也是非常丰富的。
像上面的这些公司他们使用深度神经络来训练语音模型,没有任何问题。
但是第二智慧科技没有聊天工具,也没有语音输入法,林奇也想过去这些公司买一些数据,用来训练自己的语音识别库,但是思来想去,还是落了下乘。
第二智慧科技要推出的智能音箱,最主要的一个环节的原料却是从别人那里购买的,虽然没有什么问题,但是林奇总觉得很别扭。
后来林奇也想过去各大站上面爬一些数据,有生物计算机在后面给自己的大力支撑,爬别人的数据,应该很方便。
林奇也真的去这么做了,为了n频率,还特意的n了一些速度。就这样爬了一些数据,但是这些数据拿到手里,林奇发现有一个问题,那就是这些数据很多都是录音棚,或者加工后的数据。
与用户实际生活中,比如在地铁上发的语音,在公交车上发语音,或者在大街上发语音,在家里发语音都不太一样,爬出来的数据很多都没有环境音。
没有环境音本身其实是好的音频,但是对于做语音识别来说这个就非常不合适了,因为做出来的模型不符合人们正常生活,与实际使用场景不符。
那就很尴尬了,就好比你说一个人很厉害,可以用剑杀恶龙,在有恶龙的世界里面,他是当之无愧的英雄。
但是如果他来到了现实生活中,就一事无成。
网游之创世降临 太玄战记 蜀山之天宪神君 桃色小神医 学霸的微观世界 穿越成为近战法师 永恒剑主 绝世天君 侠道行 无限电影之科幻霸主 国策 巫神纪 明末国色江山 奋斗在加拿大 极品仙师 重生之聂小倩 月临:世纪录 超级大忽悠 帝国重器 打个电话给大侠
一代雇佣兵秦枫强力回归都市,打地痞,为美女做保镖,成就不一样的都市兵王...
三年前走投无路的苏璇与富可敌国的封家三少结婚,引起全城哗然。封家暗涛汹涌,处处陷阱,她游刃有余,唯独败给了妖孽偏执嘴巴恶毒极度自恋的老公!夜晚,某人好整以暇的靠在床头,漂亮的丹凤眼微眯,所有人都说你嫁给我是祖上积了德了。苏璇白了他一眼,所以?你要乖乖被我宠,被我疼,收拾坏人由我来做,干了坏事也要记得让我来顶锅!话音刚落,未等回答,某人拉起面前人儿的小手。我三少的女人,只能高高在上。...
昔日威震诸天神域,万世轮回后惨遭灭门!残酷的诅咒,万世的仇恨,谭云立志,不再沉沦!为了挚爱亲人,从此一步步踩着仇人的尸体超越巅峰!逆天杀戮,纵横万界,唯我至尊!...
已完结小说许爱至荒年是著名作家灼华的一本原创小说,小说的主角是慕俞泽夏易欣,该小说划分在女频小说,都市小说许爱至荒年精选篇章慕俞泽,我求你放过我,不管怎么说,夏易欣都是我的妹妹,若是让她知道,她这辈子都不会原谅你的。夏以然几乎用了自己最后一口气,当这句话说完的时候,她连一丝力气都没有,就静静的在那里等待着审判。...
沈云嘉明知道谢棠不是好人,但还是不小心把自己搭进去了...
绿色小说网四组签约作品挂着无限的名字,实质为一个宅的动漫之旅,顺便附带召唤属性。恩,其实我们都是爱的战士啊QQ群214701667欢迎大家加入,讨论剧情发展今天起开始三更之路。。。签约作品,请放心阅读以宅的名义,绝不太监!...