沈向洋:目前人工智能处在四五岁小孩阶段

  新浪科技:如果以人的年龄作为一个评判依据,现在人工智能几岁?“看懂”和“听懂”能发展到什么程度?

   沈向洋:我觉得还是小孩子阶段,大家都觉得四五岁,大概也可以认识一些东西这样的。而且我觉得这样讲稍微有点难讲,有些地方比小孩厉害。今天下象棋已经 可以下过人类了,你是不是说超过50岁的人,但是有些东西远远不够,特别是认知这里,今天还没有一个很好的模型,没有很好的理论。

  感知 方面这几年进展的非常的快,即使到三四年前,都会说这个计算机听不懂。我们预计再需要4年左右时间,语音的理解,可以和人类相同,跟十五六岁的人差不多, 就不是说四五岁的人差不多。所以我自己觉得像语音这一块,今天已经超过小孩的理解,但是它的问题是机器和人类非常不一样,人听错的话,他不会大错。机器听 错就是大错,大错的原因就是后面的模型。

  就像我们讲,你知道你知道什么,你知道你不知道什么,你不知道你知道什么,你不知道你不知道什么,这个问题难就难在这里。

   视觉我是充满信心。我自己做了一辈子视觉,我做了25年视觉,今天看到这样的结果目瞪口呆,我在公司跟大家开玩笑,我一辈子做技术,一直做研究,但是9 年前被赶出研究院做产品,所以我就有很多年没有认真做计算机识别,早知道这样,怎么也不做其他方面,就好好做计算机识别。

  新浪科技:除了视觉和听觉外,人工智能的其它方面发展怎么样了?

  沈向洋:除了语音和视觉以外,其他方面的进展也没有那么大,对传感技术的研究,最近也没有新材料的突破,但是大家很努力在去做。

  在语音和视觉、照片也好、视频也好,大家看到有巨大的应用,除了我们在大的科研机构做这样的技术以外,大家看到很多商业的用处。上次谁跟我讲,说现在中国做视觉的公司说都是你的徒子徒孙,都是原来在微软亚洲研究院实习过、工作过的,包括Face++,包括易途科技,那些都是原来在微软亚洲研究院学习工作过的一些人出去的,有很多这样的应用。但是大的核心技术,大家也是非常努力的在研究。

   我觉得很多这样的技术,核心的东西都应该放出去,我最近在微软推一个大的项目叫牛津计划,以前我们出过一个测年龄的网站,也出过一个测你和另外一个人看 起来是不是很相像的网站,这些东西都是小的应用而已,真正的核心技术是计算机识别的算法,现在放出去,我就提了两个口号,一个就是让你的数据更加智能;另外一方面是让大家都可以有这样的机会,可以运用这样的技术。


分享到: 微信 更多