手机浏览器扫描二维码访问
原因在于,人经过有限的训练,结合规则和知识能够应付各种复杂的路况,但是当前的AI还没有逻辑思考、联想和推理的能力,必须靠大数据来覆盖各种可能的路况,但是各种可能的路况几乎是无穷的。
随着一项项能力的提升,章杉现在对人的理解也很深。
人的智能包含了很多方面,最基本的阶段是认知性智能,也就是对整个世界的认知。
尽管现在对于图象识别、语音识别,AI已经差不多能达到人类的水平,当然可能是在某些特定的约束条件下,能够达到人类的水平。
但是其实这种认知性的任务,对人类而言都是非常简单的,现在AI所能做的这种事情或者能达到的水平,人其实也很容易做到。
只是AI可能在速度上更快,并且规模上去之后成本更低,并且24小时都不需要休息。更有挑战的问题是,人工智能能不能做一些人类做不了或者是很难做好的事情。
像图象识别、语音识别这类认知性的任务,AI之所以做得好,是因为这些任务是静态的,所谓静态就是给定输入,预测结果不会随着时间改变。
但是决策性问题,往往和环境有很复杂的交互,在某些场景里面,如何做最优决策,这些最优决策往往是动态的,会随着时间改变。
现在有人尝试把AI用到金融市场,例如如何用AI技术来分析股票,预测股票涨跌,对股票交易给出建议,甚至是代替人来进行股票交易,这类问题就是动态决策性问题。
决策性问题的第二个难点在于各种因素相互影响,牵一发而动全身。
一支股票的涨跌会对其他股票产生影响,一个人的投资决策,特别是大的机构的投资决策,可能会对整个市场产生影响,这就和静态的认知性任务不一样的。
在静态认知性任务我们的预测结果不会对问题(例如其他的图像或者语音)产生任何影响。
但是在股票市场,任何一个决定,特别是大的机构的投资策略会对整个市场产生影响,对别的投资者产生影响,对将来会产生影响。
当前深度学习已经在静态任务里面取得了很大的成功,如何把这种成功延续和扩展到这种复杂的动态决策问题中,也是当前一个深度学习的挑战之一。
章杉认为,一个可能的思路是博弈机器学习。
在博弈机器学习里,通过观察环境和其他个体的行为,对每个个体构建不同的个性化行为模型,AI就可以三思而后行。
选择一个最优策略,该策略会自适应环境的变化和其他个体的行为的改变。
……
章杉在这篇论文继提出了一种几乎是完全反深度学习思路的机器学习——浅度学习。
强调增强博弈机器学习的重要性,强调AI的逻辑性和思辨性,大幅度降低“机器学习”任务量。
毫无疑问,这是一种全新的机器学习方式!
最起码,这种全新的模型在处理动态信息上取得的成绩将是革命性的。
浅度学习名字听起来有点怪异!
之所以不叫听起来更直白明了的浅层学习。
是因为事实上浅层学习曾经出现在历史的舞台上!
由于人工神经网络的反向传播算法(也叫BackPropagation算法或者BP算法)的发明,给机器学习带来了希望,掀起了“基于统计模型“的机器学习热潮。这个热潮一直持续到今天。人们发现,利用BP算法可以让一个人工神经网络模型从大量训练样本中学习出统计规律,从而对未知事件做预测。这种基于统计的机器学习方法比起过去基于人工规则的系统,在很多方面显示出优越性。这个时候的人工神经网络,虽然也被称作多层感知机(Multi-layerPerceptron),但实际上是一种只含有一层隐层节点的浅层模型。
到了90年代,各种各样的浅层机器学习模型相继被提出,例如支撑向量机(SVM,SupportVectorMachines)、Boosting、最大熵方法(如LR,LogisticRegression)等。这些模型的结构基本上可以看成带有一层隐层节点(如SVM、Boosting),或没有隐层节点(如LR)。这些模型无论是在理论分析还是应用中都获得了巨大的成功。相比之下,由于理论分析的难度大,训练方法又需要很多经验和技巧,这个时期浅层人工神经网络反而相对沉寂。
不过叫浅度学习似乎也不太妥当,之前的浅度学习通常指的是浅度监督式学习~
浅度的监督式的具有1个隐藏层的神经网络具有一些受人喜爱的性质,使得它们比深度网络更容易被解释、分析和优化;但它们的表征能力却不及深度网络。
一般使用了具有1个隐藏层的学习问题来序列式地逐层构建深度网络,其能够继承浅度网络的属性。
章杉在论文中也提及了这些~
浅度监督学习通过反向传播算法在大规模有监督数据上训练的深度卷积神经网络已经成为了大多数计算机视觉任务中的主导方法。
这也推动了深度学习在其它领域的成功应用,比如语音识别、自然语言处理和强化学习。但是,我们仍然还难以理解深度网络的行为以及它们表现出色的原因。这种困难的一大原因是网络的层中采用了端到端的学习方式。
监督式的端到端学习是神经网络优化的标准方法。
但是其也存在一些值得考虑的潜在问题。
首先,使用全局目标就意味着一个深度网络的单个中间层的最终函数行为只能以间接的方式确定:这些层是如何协同工作以得到高准确度的预测结果的,这一点却完全不明晰。
有一些研究者认为并且通过实验表明CNN能够学习实现这样的机制:将不变性逐渐诱导成复杂但不相关的可变性,同时增加数据的线性可分性。
通过求解浅度监督学习问题而实现的CNN层的序列学习是一种可替代端到端反向传播的方法。
这一策略可以直接指定每一层的目标,例如通过激励对表征的特定属性的精细化,比如渐进的线性可分性。然后,就可以根据对浅度子问题的理论理解来开发用于深度贪婪式方法的理论工具。
但传统的浅度监督学习各种各样的缺点还是较为明显。
我,捡破烂成世界首富 纪初安唐石谦重生文 贤者之王 始于心甘情愿纪初安 我将败掉万亿家产张臻秋淑芬 鬼谷八荒之开局就是三剑痴 我是文娱之王陈轩王玲 撼龙风水师 少帅夫人不准逃顾婠婠霍沉离 我没想当绿茶,真的(快穿) 我开局穿越三国战场造机甲 枭霸娇妻 我老婆是天后巨星 尊养小夫郎[种田] 缠绵入骨,首席老公别过分 野蛮匪夫的小娇娇 战神入赘成首富齐昆仑谢芝真 孤岛上的平行世界III 我在古代当神医颜循韩嫣 纪初安唐石谦重生文
沈东,非洲某小王国的元首,一场政变意外结束了他传奇的一生。沈东,魔都老牌豪门石家的上门女婿,却被恶少在他老婆面前活活打死。我擦!沈大帅再次醒来,看着镜子里的自己仰天哀嚎我的千亿美金!我的私人军队!我的超模后宫!全完啦好,上门女婿是吧?老子认了!媳妇儿,给我一年发育,还你一个王者!...
成为真实恐怖电影的演员,在恐怖片的世界中,挣扎求生!进入这座公寓,就等于踏上了一条不归路。只有被它选中的人,才能看到它,才能进入它。而一旦被选择成为了公寓的住户,便再也没有选择了。...
简介蓝星上的所有人,全都莫名其妙的来到了一个丧尸遍野的末日世界。所有人的目标只有一个,活下去。活到十阶段的幸存者,将会前往新世界。开局抽取初始物资,陈雀获得了无限祝福的技能。击杀丧尸,获得面饼,十倍祝福,获得超级肉夹馍。击杀异兽,获得手枪,百倍祝福,获得火神加特林。收养小蛇,千倍祝福,获得灭世大金龙。收养猫咪,万倍祝福,获得猫娘。...
开局就拥有大气运。大机缘,大造化,老子都知道在哪里。还想进副本?老子都通关了!某人语录老子等级比你高,道行比你高,就连女人缘都比你好,你说气不气?什么,猪八戒又调戏我的嫦娥妹妹了?等老子收拾他!...
王者荣耀之我的时代一代屌丝陆峰,凭借手游王者荣耀登上人生巅峰,从此开启无限装逼模式!...
一把来自幽冥的断刀,带来力量的同时,也带来了诅咒。每时每刻都在燃烧的灵魂,必须杀人吞噬灵魂才能维系生命,没人知道什么时候是尽头,从踏上这条路开始,就无法后退。刀出幽冥,死神临世。...