手机浏览器扫描二维码访问
一秒记住【xiaoyanwenxue.com】精彩无弹窗免费!“重生学神有系统(.shg.tw)”!
不过,在跑代码之前,还要对数据进行预处理。
江寒先从报名信息表中,将性别信息仍然“健在”的行挑出来,只保留序号、姓名和性别,另存为label.xls。
这些记录一共9527条,大约占三万多条数据总数的30%。
它们对应着9527张真彩色照片。
24位真彩色的图片,每个像素点在内存里,要占用3个字节的存储单元。
每张照片有210×120个像素,这样读入一张照片,需要的内存空间就是210×120×3=75600个Byte。
9527条数据,共需要9527×75600=720241200B≈686.88M≈0.7G!
这个内存开销,还是比较容易接受的。
但是,“感知机”的算法,需要进行大量浮点乘法运算。
对每个像素的每个RGB分量都算一遍?
没那个必要,也太浪费时间。
所以,聪明的做法,是先把照片数据“压缩”一下。
江寒给“感知机”的代码,添加了一个LoadData函数,用来读取和处理照片数据。
在这个函数里,先定义一个二维的整形数组Feature。
然后从label.xls中读出序号、姓名信息,按照刚才建立的索引表,找到对应的照片文件。
下一步,将照片读取到内存中,读取的同时,将每个像素二值化。
具体做法是:色彩浓度在阈值以上的像素,取值为1,低于阈值就让它为0。
这样一来,原本的真彩色照片,就被转换成了黑白轮廓图。
然后,再将轮廓图中的0或者1的取值,按照从左到右、从上到下的顺序,重新编排成一行数据,存放到数组Feature中。
Feature中的每一行,都存储了一张照片的二值化信息。
一共9527张照片,就需要9527行。
全部照片处理完毕后,就得到了一个巨大的二维数组Feature。
它有25200列、9527行。
接下来,定义一个拥有9527个整形元素的一维数组Label。
从label.xls中读入性别信息,男生设为1,女生设为0,存放在数组Label中。
Feature加上对应的Label,就构成了训练数据集。
训练“感知机”时,将一行行Feature代入公式中,进行加权和运算,其结果再通过sign函数,转换为0或1,然后和对应的Label值对照。
如果不相符,就调整权重和偏置,然后重新计算。
当每一个Feature代入公式后,都能计算出正确的Label时,就得到了一组权重和偏置。
也就是说,构建出了一个可用的数学模型。
依据这个模型,计算机就可以读入任何一张同尺寸、类型的照片,对其二值化的数据代入模型中运算,并根据运算结果判断分类归属。
这就是典型的机器学习过程,计算机从数据中自己“学”到了某种规律。
玄幻之无上天帝 最强司机 都市豪门战神 秦朝之天明崛起 爷爷给我算了最后一卦 风水赘婿 荒山远海 柳定大荒 山河万里不识君 人在综漫:开局选择日之呼吸 李长风萧玉如 修仙大佬,求你别秀了 末世进化之王 她做了一个可预测未来的梦 动漫时空巡逻队 封天之圣 玄武戴孝快封村 天降六宝:夫人她千娇百媚 一胎三宝:战神妈咪她A爆全球 遗世有情之有狐
战神归来,前女友居然找上门来提出非分要求...
穿越玄幻版中国古代,成为阉党一小太监。坐拥梦境系统逆天崛起,称霸阉党泡皇后。名门正派的英雄大侠们,你们的末日到了!...
看高干是怎么修炼成地主婆的看私生女是怎样修炼成学霸的手握空间能种田,系统交易可益智妖魔恶鬼并不可怕,可怕的是笑着承诺帮你的伪施恩者她感激了多年的女人才是害死她们母女俩的恶魔说来说去还不是因为她是上位失败的小三女儿她就是那个所谓爱情结晶的失败品替婚受辱能想象的苦都尝了个遍重新来过,她想,好人难做,还是学坏容易系统傍身,辣手高干,学霸是她,不代嫁...
前世,错付终身,囚禁五年,她的老公和妹妹为了救他们那个心脏病的儿子,居然生生的挖走了她刚生下的孩子的心脏,最后身死人灭。重生一世,回到十六岁那年,一切从头开始,凭着前世的记忆,拥有了空间宝器,从此在商界搅弄风云,炒股票,玩古玩,开娱乐公司,玩转房地产。姜瑜兮这一世的人生信条就是断情绝爱,努力赚钱,成为商界王者。未曾想,重生第一天,竟遇到了一个谁都不敢得罪的人,传说中东都墨家最神秘的墨公子,跺一跺脚...
平凡村医叶念意外获得魔医门道首传承,我是医生,会救人,但谁都别惹我,我还会毒人。...
一个在家族中地位不高的玄气弟子,偶然在地摊上得到一块奇异玉石,里面藏著一门上古剑修传下来的绝世剑阵修炼之法!冰火两仪剑阵,三叠琴音剑阵,四合八级剑阵,六脉五行剑阵,七星八卦剑阵,九天雷火剑阵,十方无极剑阵,周天挪移剑阵,紫雾虚弥剑阵,道心种魔剑阵,万剑归宗剑阵天下地下,唯我剑阵!与我作对者,一概万剑轰杀!。。。。求订阅,求推荐票!!!!...