十二 31
文/刘江
20121025日,坐在富丽堂皇的天津大礼堂里,与天津各高校的两千多师生一起聆听21世纪的计算大会的报告,不由得感慨如今的年轻人在求学阶段就能与包括图灵奖得主在内的世界顶尖学者零距离接触,实在令人羡慕。

大会期间,刘江(中)与Michael Jordan教授(左)和Eric Horvitz(右)合影

21世纪的计算大会由微软亚洲研究院主办,始自1999年,到2012年已经是第十四届,是微软亚洲研究院自成立之初便开始举办的学术盛会,主要面向来自亚太地区各大科研机构和高等院校的计算机科研人员及相关院系师生,集中展示计算科学领域的最前沿技术及未来的发展趋势。正如本次大会的主办方之一,南开大学的校长龚克所说,微软亚洲研究院所主办的“21世纪的计算大会”能够激励青年人更加前瞻、深入地思考二十一世纪的计算所面临的种种挑战,同时帮助人们更好地理解二十一世纪的计算和经济、社会、文化等方方面面之间日益密切的联系。

今年是我连续第三年参加“21世纪的计算大会”。大会主题从2010年上海的 ·计算·现实世界2011年北京的计算之本,创新之源演进为今年的计算,自然而然。顾名思义,自然用户界面(NUINatural User Interface)是中心议题。

果不其然,Rick Rashid博士演讲中有几个演示都与更自然的用户界面有关。其中包括在今年UIST大会上引起广泛注意的手腕穿戴式3D交互原型项目Digits,用不太复杂的硬件实现人手运动的捕捉和模拟,已经达到较高精度。而反响最强烈的是实时语音机器翻译,系统不仅将他实时说出的英文语音识别出来,翻译为质量很高的中文,还能匹配他的语音语调用中文说出来,实在是技惊四座。演讲视频在微博里也引起了轰动和广泛传播,更成为国内外很多媒体热议的话题。Rashid之后也专门撰文指出,这个演示其实包括语音识别、机器翻译和语音合成三个领域的研究成果。仅仅语音识别方面,这个系统因为采用了深度神经网络(Deep Neural Networks),错误率降低了30%,是1979年隐式马尔可夫模型出现以来精确度的最大提升。

但是仅有人机界面层面的突破,仍然是无法实现自然而然的,自然界面离不开大数据的支撑。图灵奖得主、康奈尔大学教授John Hopcroft的演讲计算机科学的新方向一如既往的高瞻远瞩,而其主题正是近一两年非专业人士也喜欢议论几句的大数据。他认为计算机科学正在经历根本性的变革,将改变社会生活的方方面面,意识到这种变化并未雨绸缪的人会获得巨大优势。过去30年编程语言、编译器、操作系统、算法、数据库等领域关注的主要是怎样更好地发挥计算机的作用;而未来将转为应用导向,如何将计算机应用于各个其他领域,比如某些理念在科技文献中是怎样传播的,社交网络中社区怎样演变,如何从非结构数据源中提取信息,处理各个应用领域产生的海量数据等等。计算机科学理论和教育都需要改变,以适应这样的变化。他指出,支持新方向的基础理论有:大规模图,谱分析,高维和降维,聚类,协同过滤,从噪声中提取信号,稀疏矩阵等。其中很多方面以前都没有很好的研究,需要学术界和工业界的共同努力。

依据数据决策有多重要?在会议间歇我采访微软雷德蒙研究院的副院长Eric Horvitz时,他兴致很高地回忆起自己曾经救过导师George Dantzig(线性规划之父)命的轶事。1980年代Dantzig被诊断有心脏病,医生建议他尽快手术,但搞优化的Dantzig岂能随便答应。他找来Horvitz,让他把自己的心脏病手术时间当成一个研究课题来做。Horvitz查阅了大量医学文献资料和数据,结合老师的个人情况,画出一个优化曲线,推算出Dantzig的手术应该一年后做,结果决策大师研究一番后居然照做了。Dantzig此后逢人便夸Horvitz的功劳,他又活了20多年,90岁高龄时才去世。

那么,大数据是否意味着数据越多越好呢?去年大会上斯坦福大学教授Emmanuel Candes在演讲中就给出了一个反例。他2004偶然发现,一幅采样不足的图片,利用数据的稀疏性和不连续性,通过巧妙的数学处理,可以得到比采样更多的对比图片更清晰的结果。他与陶哲轩在此方面的合作开创了现在非常热门的压缩感知(Compressed Sensing)研究领域,并因此获得SIAM Polya奖和NSF Waterman奖。现实生活中,由于处理和通信能力的限制,加上传感器和采样系统设计不佳,大量采样数据是冗余的,很快会被压缩而丢弃,造成了大量浪费。压缩感知为我们提供了一种新的思考问题的角度。

本次大会的演讲嘉宾,来自加州大学伯克利分校的Michael Jordan教授有心理、统计和认知科学学位,同时是电气工程与计算机系和统计系的教授,他对大数据本质的认识非常独到。计算机研究的是对资源的管理。资源指的是时间、空间和能量,传统上数据并不认为是资源,而是工作负荷。但现在数据也成为资源了。Jordan教授强调,时间、空间和能量等其他资源基本上是多多益善的,越多处理越快,而数据作为资源却很不一样,数据越多,计算处理不快反慢,而且数据越多越复杂,麻烦也就越大。数据多了,不仅查询起来复杂得多,而且在给定时间里应用复杂算法也越来越不可能了。这正是大数据的本质困难。

对此,Jordan提出两种解决途径。一是自底向上,化整为零,将算法里的分治原则更全面地运用到统计推断里去,将大数据化为许多小数据来处理,即大数据的Bootstrap法。普通的Bootstrap算法非常简单,而且看上去与分布式计算/云计算非常匹配,但因为重抽样的数据量也会很大,并不实用。Subsampling(子抽样)法又有无法保证正确性的问题。最后行之有效的是结合了前两者的BLB方法Bag of Little Bootstraps),实践证明非常高效,而理论上又能证明高阶正确性。

二是自顶向下,通过凸松弛法(Convex Relaxation)实现计算效率和统计效率的权衡。在计算机学家看来,数据多意味着计算多;而在统计学家看来,数据多意味着风险(错误率)越低,随着数据增长,统计推断反而可能简化。Jordan在演讲前进行的专访中特别向我指出,计算机科学只有几十年,遇到的很多问题统计学、数学都思考了几百年了。大数据实际上做的正是将计算机科学和统计两个领域联系到一起。他建议计算机专业人士要多看本学科外的相关论文,并半开玩笑地说这是他的授徒秘诀(他门下弟子如Andrew NgDavid Blei等多成就斐然)。这让我联想起2010年与会的图灵奖得主Chuck Thacker介绍自己屡屡能在多个方面创新的秘诀,是经常读各领域的原始论文尤其是比较老的论文,看人们最初怎么思考,又在哪里摔倒。

关于创新,大会专门有一个名为颠覆性创新的主题论坛。北京大学的迟惠生教授认为创新就要包容异见、但不要轻易受他人影响。中国科学技术大学李卫平教授则提醒大家不应为了颠覆性创新而创新,颠覆性创新必须满足人们现实需求并且影响广泛,颠覆性往往出现在交叉学科点。微软亚洲研究院的研究经理张虹更强调创新的困难,但是不要因此而泄气;另外,软技能很重要,不要当书呆子,要善于激励别人加入,建立社区。这些都是我最近听到的最好的创新箴言。

大会最后,洪小文院长的演讲很有启发性。我印象最深刻的是,他举了一个有意思的例子,今天大家都已经习以为常、非常自然的用牙膏刷牙这一全人类的共同习惯,其实是在20世纪初因为广告大师Claude C. Hopkins的巧妙推销才很快成为一种社会风气的。也就是说,人们很多感觉自然的事情其实并不是天生的,而是久而久之的习惯和学习使然,本身就是人为创造的。不仅是刷牙,说话、写字亦然。因此,技术不应该仅仅适应已有的习惯,更应该从数据中获取真知灼见,创造新的习惯和自然,并勇于促成人们的改变与社会的变革,这才是真正的创新。

博观而约取,温故以知新,自然、大数据、创新,在这里融会贯通了。

本文选自《程序员》杂志2013年1期,未经允许不得转载。如需转载请联系 market@csdn.net

《程序员》2013年杂志订阅送好礼活动火热进行中

 

转播到腾讯微博

----->立刻申请加入《程序员》杂志读者俱乐部,与杂志编辑直接交流,参与选题,优先投稿

请评论

preload preload preload
京ICP备06065162