央行金融稳定报告:私募风险暴露亟须整治

记者 郑菁菁 

昨天,现代快报记者对南京的群租房现状展开调查发现,虽然同住一个屋檐下,可这些租客之间的交流却很少,他们是一群“最熟悉的陌生人”。林书豪得分创新高

内部网只需面对本单位战友的评审,一个放在军网上的网站面对的却是全军战友的检阅。我在军网上感受并享受着来自全军网友的爱,回报给网友的是一种态度,一种军人的文化态度。华少回应离职传闻

在开局前,李开复曾预测李世石可以赢的概率更大,而未来几年内AlphaGo一定可以战胜人类。同时,许多围棋界人士也都做了李世石赢的概率更大的判断,然而2场比赛后,他们都失望了。科技界人士震惊了,围棋界人士愤怒了。法国80万人大罢工

陈俨,1969年2月入伍,现任南海舰队政治部副主任,海军少将军衔。我国第一位国防经济学专业博士研究生。曾先后被评为全军优秀四会政治教员、全军优秀党务工作者、全军优秀指挥军官,当选第十届全国人大代表。剑王朝开播

那为什么估值网络会出问题呢?可能是用于训练估值网络的自学习(Self-Play)的样本分布有盲点。为了提高样本生成速度,AlphaGo的自学习样本是通过用两个纯粹的DCNN互搏来生成的(完全没有搜索),而DCNN下出来的棋因为是纯模式识别,一个大问题是死活不正确,经常是在死棋里面下子。如果黑白两方都犯了死活不分的毛病,然后一方比如说白侥幸胜了,那估值网络就会认为方才白的死棋局面是好的。这样估值网络就会染上同样毛病,在中盘复杂的对杀局面中判断失误。若是这种情况就不好处理,AlphaGo下一局可能还会有同样的问题。这里可以看到,电脑本身也不是靠穷举来下棋的,围棋毕竟太复杂,每一步都要剪枝,离当前局面近的仔细剪(用DCNN),离当前局面远的快速剪(快速走子),直到终局得到胜负为止。剪枝的好坏直接关系到棋力的高低,DCNN只是一个有大局观的非常好的剪枝手段,它的盲点也会通过败着反映出来。女婴推拿后身亡

扫码分享到手机

  • 联通