5200小说网

手机浏览器扫描二维码访问

第265章 数据增广和集成学习(第1页)

一秒记住【xiaoyanwenxue.com】精彩无弹窗免费!“重生学神有系统(.shg.tw)”!

经过仔细斟酌,江寒确定了“优胜者”模型。

随后,他就开始考虑,如何进一步优化这个网络的性能。

像是网络的主体结构、权重初始化方案、数据正则化的方法、激活函数的选择……

这类关键因素,在之前的第一轮训练中,就已经确定了下来,无需再做调整。

但除此之外,可以优化的地方依然不少。

比如稍微改变一点学习率,少量增加或减少隐藏神经元的个数,微调一下MiniBatch的大小……

这些都有可能对网络的性能,产生微妙的影响。

而且,每一点细微的调整,会产生什么样的效果,不实际训练、测试一番,是无法预估的。

所以接下来,江寒将“优胜者”代码复制了100份。

这样一来,这个“优胜者”就拥有了100多个“双胞胎兄弟”,或者说:分身。

随后,他就采用不同的方案,对这100多份代码,逐一进行了微调。

等到进行完第二轮训练后,从中再次选出唯一优胜者。

有点类似“养蛊”。

策略已经定下了,但江寒并没有马上开启第二轮训练。

他还打算再做一个比较重要的实验,那就是增广数据。

KAGGLE官方提供了20万条训练数据,理论上说,对于绝大多数机器学习模型,这个数据量已经足够使用了。

但谁会嫌弃数据太多呢?

能提供的数据越多,神经网络的学习效果就越好,训练得越充足,性能自然也就越强。

反正一般来说,不会变得更糟。

所以,何乐而不为?

所谓数据增广,就是在不改变图像类别的前提下,人为地扩充数据。

这样做,常常可以有效地提高模型的泛化能力。

常用的数据增广方式,包括水平翻转、旋转、缩放、平移、裁剪、颜色抖动……

当然,也可以将多种操作组合起来,从而获得更多的数据。

例如,同时做小角度的旋转和随机尺度变换,再微调一下像素在HSV颜色空间中的饱和度、亮度、色调……

江寒很快用Python编写了一份代码,对训练数据集进行了扩充。

原本的18万条训练数据,经过各种运算,足足演变出了将近200万条数据。

封天之圣  玄幻之无上天帝  天降六宝:夫人她千娇百媚  柳定大荒  修仙大佬,求你别秀了  一胎三宝:战神妈咪她A爆全球  山河万里不识君  末世进化之王  人在综漫:开局选择日之呼吸  秦朝之天明崛起  她做了一个可预测未来的梦  爷爷给我算了最后一卦  李长风萧玉如  动漫时空巡逻队  遗世有情之有狐  最强司机  荒山远海  都市豪门战神  玄武戴孝快封村  风水赘婿  

热门小说推荐
乡村大地主

乡村大地主

我是乡村大地主,这里的美女,都是我的!...

神|魔

神|魔

正邪,谁人能定?善恶,任你评说。山是山,水是水山不是山,水不是水山依然是山,水依然是水看破后,所谓的正邪能如何?善恶又如何?所作所为,不过为了活下去而已能够按照自己的心意,活下去...

血幕鸣

血幕鸣

作者红色的风的经典小说血幕鸣最新章节全文阅读服务本站更新及时无弹窗广告小说血幕鸣一个初生的世界,最匮乏,也是最辉煌的时代,无数天骄崛起,带来无数的传承,当血幕重归,毁灭降临,他们抛弃所有顾忌,只为迎接那重墙下的悲鸣。...

蝶与谍

蝶与谍

戴笠你要多弄点情报给我。周林这是日军进攻长沙的军事计划,换一百万大洋!李克农有叛徒告密,日本人知道我们共产党有个蝶在他们身边。周林小风浪翻不了船。这次有一百万大洋给组织。他是日伪特务处处长,又是国民党的上校军衔的情报员──谍,但他真正的身份是共产党的高级情报员──蝶!已创建蝶与谍群...

第一次亲密接触

第一次亲密接触

放学回家,发现家里的小保姆正在和陌生男子壁咚,我威胁她和我青春在热血中绽放,在肆意中张狂。哪有青春不年少?哪有年少不轻狂?若干年后,当我回忆起那第一次亲密接触,心中早已熄灭的热血,亦随之燃烧。...

宅在韩国的农夫

宅在韩国的农夫

狗血的重生了,你说我一个药剂师居然学的是农垦专业!什么,有金手指,还是神农空间!老天啊,你是要我把农民这个行业进行到底啊!...

每日热搜小说推荐