有思想的机器:人类的智商或抵不过机器

  早在100多年前,德国心理学家William Stern就推出了IQ测试,用来测量人们的智力。从此以后,IQ测试结果就成为现代生活中判定孩子学习能力以及成年人工作能力的一种标准。

  IQ测试通常包括三类问题,即逻辑问题(如图形推理)、数学问题(如发现数列规律)以及文字推理类问题,这些问题都是基于类比、分类、同义词或反义词设置。

  觉醒的机器:人类的智商终于抵不过机器?

  人类的智商终于抵不过机器

  正是文字推理类问题吸引了中国大学的王华正(Huazheng Wang)等以及北京微软研究院的高斌等研究人员。

  将语言问题变成数学问题

  科学家通过使用数据挖掘技术分析巨大的文本语料库

  最近几年,电脑科学家通过使用数据挖掘技术分析巨大的文本语料库,以发现语料之间的联系。这尤其给王华正等科学家统计单词出现模式带来了极大的便利,比如某个特定的词在其他词前后出现的频率。这就使得在巨大的参数空间里,理清单词之间的关系成为了可能

  这样,在这个高纬度空间里就可以将单词看做一个个向量,像其他向量一样,可以使用比较、增值以及减值等数学方法进行处理。这样就会得到诸如下面的向量关系:国王—男人+女人=女王。

  这个方法现在已经取得重大成功。谷歌假设相近向量代表的不同语言词序列在意思上是对等的,实现了语言自动翻译。

  但是,这种方法有一个显着的缺陷,即假设中,每个单词的含义均由单一向量指代,因此单词的含义也是单一的。而文字测试倾向于使用多义词增加问题的难度

  王华正等人通过查找单词在语料库中的常见搭配解决了这一问题。接下来他们运用运算法则观察这些单词的分布。最后通过词典查出单词的不同含义,并将这些不同含义与不同分布的同一单词对应联系起来。  因为字典释义里本身就包含单词不同释义的例句,因此这个步骤可以自动完成。通过分析这些句子里的向量表示,并且将它们与每个分布点的向量表示进行比较,就可能实现它们的对应。

  总体来说,这种方法就是鉴别单词的不同含义.

  觉醒的机器:人类的智商终于抵不过机器?

  王华正等人通过查找单词在语料库中的常见搭配解决了这一问题

  除了上述方法,还有其他妙招用来提升电脑处理文字推理问题的能力。妙招的关键点在于这些推理类问题可以进行分类,可用用略微不同的方法进行处理。

  人类在这些测试中的表现往往跟他们的教育背景有关。因此,拥本科学历的人比拥有高中学历的人表现要好,拥有博士学历的表现最好。

  王华正等人称他们的深度学习机器模型智力水平介于学士和硕士之间。

  深度学习方法已经如同星星之火席卷了整个计算机科学领域,但是它所引起的革命仍然处于起步阶段。

  谁都不知道这场革命将会把我们带到何处,但有一点可以确定的是:William Stern对这一切也不得不叹服。