送交者: scott 于 2021-07-27, 18:15:19:
回答: 如Deepmind已有比AlphaGo Zero更强版本,开源AlphaGo Zero可更好验证其superhuman宣称 由 scott 于 2021-07-27, 14:45:58:
Deepmind自己的专长在于without human knowledge,所以现在Deepmind竭力宣传他们自己的Reward Is Enough的reinforcement learning(即强化学习)。
但Reward Is Enough的强化学习,跟深度学习和双通道神经网络一样有很大局限性。如果不找出其问题,就不能进入更高层次的发展。
如果Deepmind不愿意做围棋实验,还可以研究测试语言处理的数据集问题。
SQuAD和CoQA等等语言处理测试数据集明显不能反映人工智能和人类特有智力的真实差别。
笔者设计的语言处理测试数据集也可以证伪Technological Singularity、potentially a meta-solution to any problems、Reward Is Enough,但需要较多资源研究。
如果不能发展智力新科学带来更高境界的理性,也没有机会做实验来验证和纠正重要的学术错误,诡辩就会流行,科学和文明的基础很快会瓦解。这是目前最重要的问题。