手机浏览器扫描二维码访问
首先每个人都有一个自己的语音模型,训练这个模型需要有一个很优秀的训练好的模型,然后做迁移学习。
但是训练基础模型的时候,是需要很多数据的,程序林奇很快的就做好了,但是没有语音数据是硬伤。
最后林奇收集了很多的网络上公开的音频资料,来输入到模型中进行训练,刚开始的时候找来了很多的汉语的音频。包括从电视剧,电影还有广播,新闻等里面抽取的音频。
等训练好之后林奇测试之后发现针对标准的普通话,这个表现很好,但是如果是方言甚至是另一种少数民族,比如蒙古语,这个软件表现的就非常的不尽人意。
后来林奇换了一个思路,不把每个人的语音转换为文字。而是让机器自己发明一种能发音的文字,不需要人类能看懂,只需要这个软件自己能看懂就好,可以把听到的任何声音都转换为这种机器自己能识别的文字。
修改了核心的算法之后,林奇再次把数据输入进去,同时这次增加了很多的其他的数据,包括英语,德语,日语……几十种语言的数据。还有很多的大自然的声音,乐器的声音,等等。
电脑分析这些数据建立一个模型过程是很慢的,经过漫长的等待之后,终于重新生成了一个模型。
经过测试之后,效果出奇的好,林奇发现尤其是针对有规律的东西,包括语言,乐器这些东西,都能有很好的效果。
然后这些数据经过压缩之后,体积比文字的还小了很多,即使网络环境再不好,只要不是完全没有,通话的质量都是很完美的。
但是美中不足的是,针对不太规律的东西,这个模型处理的效果就不是很好,比如一些环境噪音或者大自然的风声雨声鸟叫等。
林奇接着又去修改了模型,但是训练后的结果都不是很好。
后来林奇想了想“环境噪音,在语音通话过程中,人们应该是不想要的,我干嘛还要费那么大的力气给加上。这不正是几千块钱的所谓的主动降噪耳机,或者是骨传导耳机追求的降噪的功能吗?”
想至此,林奇想抽自己两巴掌,白白浪费了那么多时间。
至于一些风声什么的,林奇也有了一个很好的解决方法,就是在算法里面判断这个声音,如果是没有规律的,但是和环境噪音又有些区别的,那么就保留原有的语音通话,只有这种有语言的才智能的运用自己这套系统。
这个系统的价值在于能让语言的传输大大减小体积,同时还能高度还原原声,甚至带有主动降噪功能。
而这个系统的难点在于:模型的训练。
训练的时候刚开始针对的是普通话,到了后来,林奇彻底的放开了自己的思维,让机器自己去生成一种能传输的自己认识的语言,这样效果大大的提升了,不用针对每一种语言来训练好一个模型,而是针对所有的声音,训练出了一套通用的模型。
在使用的时候,只需要把这个模型加载到用户的手机,用户只需要说几句话,模型就会自动生成对应的音色,还有对应的语言的机器翻译。
通过实际的使用,林奇测试发现,这完全秒杀了世面上所有的语音通话软件。
(大雁文学WwW.XiaoYanWenXue.CoM)
超级大忽悠 桃色小神医 奋斗在加拿大 帝国重器 打个电话给大侠 学霸的微观世界 极品仙师 明末国色江山 重生之聂小倩 永恒剑主 网游之创世降临 国策 绝世天君 无限电影之科幻霸主 太玄战记 巫神纪 侠道行 蜀山之天宪神君 月临:世纪录 穿越成为近战法师
...
一次意外,让主角的大脑发生了奇特的变异,打开了脑域开发这扇通往神秘宇宙的大门,不仅让他获得了如同‘神’一般强大的念力控制和精神感知,还拥有了堪比超级计算机的记忆与分析运算能力。有了念力和超脑能做什么呢?主角的答案是除了违背道德伦理的事情之外,想做什么,就做什么,反正有了念力,就是这么任性→→。逍遥于世界各地的名山大川,沼泽丛林,探索地球充满神秘未知的北纬30°线。为了满足自己的需求,暗地里发展了一下黑科技,却一不留神就改变了整个世界的科技发展脚步。脑域开发进度102050100恭喜你,你已经成为无处不在的神本书群号3497,8857PS主角脑域开发的能力可以参考一下电影超体,当然,也并不是完全相同,电影仅供参考。特别提示本书无修真,无其他异能者,无龙组,无什么古武世家→→...
末世修真,修者含义被重修定义,机甲时代降临!真灵觉醒,隐藏在人体万年已久的神秘力量,能否与超神GI抗衡!星系穿梭,机器人大战,修者乃是凡人!器修武修灵修阵修!我欲修真,我欲超神!...
万界相亲单身狗已哭晕...
鸠不会筑巢,只会占有其他飞禽巢穴。风宸占有的不是巢穴,而是别人的身份和名字,甚至在军统八处的机密档案中都没有留下他的照片,只有一个不为人知的代号,红鸠。作为国民党王牌特工,为获取共党潜伏在军统高层的特工名单,风宸奉命打入上海地下党内部...
五年前,因卧底任务需要,他背负罪名入狱,父母被活活气死,兄弟姐妹妻子为他受苦。五年后,他是扫平战乱的第一战神,权财无双,归国之后,他只想弥补自己对亲人,对妻女的亏欠...