28

文/刘江

3月6日,我与全球媒体同行一起,亲身感受了心仪已久的微软研究院年度技术盛会——技术节(TechFest)。

这个活动每年都会在微软雷德蒙总部举办,向公司内外展示来自研究院全球各地13个机构的最新研究成果。到2013年,这项以创新和未来感著称的活动已经是第13届。而微软研究院本身也发展成为计算机科学领域内首屈一指的基础研究机构:无论是图灵奖得主、美国工程院院士的数量,还是超过850位博士研究人员、1000多博士实习生,以及每年在各类顶级学术会议和期刊上发表的研究成果,在世界范围内都可以傲视群雄;在微软公司内部,研究院以1%的员工贡献了约25%的专利(而且总体上更为基础、重要),并有诸多技术成为微软产品的核心竞争要素。

IT=Intelligent Technology

IT技术近年来正以前所未有的深度和广度影响着人类社会。而IT本身的含义也在深化:计算设备、系统和服务不仅仅是为人们简单地存储和处理信息,逐渐向以接近人类感知的自然、智能的方式为人类服务的方向转变,以互联网为中心的计算机系统越来越像智能助理,理解人类的需要,甚至做出提前预判。本届技术节的两大主题——“更人性的自然界面”和“大数据时代的到来”正反映了这种从信息(Information)到智能(Intelligent)的演进。这两个主题之间是相辅相成的:有了更多、更丰富类型的数据(多媒体、社会化媒体等)和基于这些数据的分析,计算机系统才能展示出更贴近人习惯的界面,更好地服务用户;有了更自然的界面,系统才能获取更多与人的习惯密切相关的数据。而数据的处理需要云计算平台的配合,自然界面的基础则是移动终端、各种屏幕、Kinect等新型人机交互设备。云、移动、自然界面和大数据构成了整个IT的大趋势,这些在本届技术节亮相的诸多项目中都得到了很好的展示。

主题演讲中展示的GeoFlowSketchInsight两个项目都是数据可视化方面的优秀项目。GeoFlow的技术来自著名的WorldWide Telescope项目,已经作为Excel的一个预览组件向公众开放使用,能将表格里的时空数据变成酷炫的动态3D效果。更重要的是,这项技术有助于决策者发现以前并不明显的重要问题,比如,警力的部署是否与犯罪行为的密度相符?交通路线的设计是否适应变化的流量?连锁店的选址是否与主要受众出没之地一致?而SketchInsight则探索如何将触摸屏转变为智能白板,通过自由地画草图和符号,流畅、更加亲民地用数据来讲故事。请高度关注,这很可能是PowerPoint未来某个版本的雏形。

新成立的纽约研究院的ViralSearch项目因为有著名学者Duncan Watts(六度理论的提出者)参与而获得了媒体的较多关注。这是一个利用Twitter的数据库来研究口碑传播规律的项目,很直观地体现了大数据的力量:你可以找到一个话题、文章、视频等是怎样在Twitter中最初产生,然后通过具体哪些人和途径被成千上万乃至更多的人知道的——当万事万物被数字化和互联网化之后,历史将清晰地在我们面前发生和重现。此外,SandDance利用硬件加速技术,实现了在Web上互动地多维度展示和研究数百万数据项,体现了大数据和自然界面两大主题的结合。

如何利用技术改善教育也是一个热点。印度研究院的VidWiki尝试建立一个类似Wikipedia的视频共享众包平台,提供工具让用户添加各种标注,一起改善视频质量。“用视频增强教材”来自硅谷研究院,是对未来教材的大胆想象,研究员们通过数据挖掘算法找出教材中不足的地方,然后用网上丰富的免费视频给予加强,这个项目已经在微软的设备产品和印度政府资助的低价电子书Aakash上实现。剑桥研究院自动出题是智能导师系统的一部分,目前已经可以自动生成代数证明、逻辑、句型语法填空甚至棋盘游戏问题,不禁让人遐想:未来教师这个职业也会消失吗?

此外,实时业务元数据提取面部互动两个项目的想法也都有独到之处。还有一些项目主要偏重于后端算法,在这种场合无法充分展示实力,但意义其实非常深远。比如剑桥研究院Thore Graepel领导的项目“提高数据发掘和分析效率的工具”就极具雄心,要在Excel和SQL Server中实现机器学习的平民化,无需编程和大量繁琐工作,就能从网上提取各种有价值的相关信息,结合已有数据进行学习,并凭借机器学习推断出缺失的信息(可能是销量预测和销售机会),或者通过无监督学习找出异常数据点(可能是疾病、机器故障、股票异动)。

本届技术节上,来自北京微软亚洲研究院的几个项目都让人眼前一亮,贴近实用,显示出很强的实力。其中李志伟蔡锐等的“使用便携式设备进行3D重建”就很好地体现了前后端的结合。通过在平板电脑或者手机上的摄像头对真实事物环绕拍摄多张普通2D相片,然后就能在云端快速(十几秒内)实现3D重建,获得效果不错的3D模型。有意思的是,同时展示的还有另外两个异曲同工的项目,一个是来自微软剑桥研究院的KinectFusion,使用Kinect深度摄像头和C++ AMP技术实现高品质的实时3D扫描与重建,将成为下一版Kinect SDK的一部分(本次还展示了另一个进入Kinect SDK的项目“教Kinect读懂手势”);一个是Redmond研究院的“实时3D场景捕获与重建”,对硬件条件和环境要求较高,但效果也更好。

曹翔等的BodyAvatar项目则利用Kinect,实现了通过肢体行动自由创造各种非常科幻的3D虚拟形象。随着3D打印、3D游戏和网页展示逐渐进入主流,可以预见这些技术都有广阔的应用场景。

袁路和孙剑等的“高品质、鲁棒的视频稳定技术”同样令人印象深刻,通过算法(从视频中寻找相对静止的特征点,以判断设备的运动模型)可以基本消除普通移动设备和消费摄像机拍摄视频的手抖因素,获得接近专业的高品质,而且对计算资源的要求也很低。可以想象,如果Windows Phone和Windows 8平板能够内置类似的功能,将成为有竞争力的一大产品亮点。

微软研究院的创新之道

初次参加技术节的人,肯定会惊讶于微软研究院涉及领域的深度和广度,比如微软有研究员在做艾滋病病毒的研究,亚洲研究院还有敦煌等文化遗产的高清数字化项目,WorldWide Telescope也是一个宏大而之前看不到多少商业价值的研究。这让我们隐隐然感到微软似乎在下一盘超大的棋局。

而另一方面,微软近年来在移动和互联网领域受到来自Apple和Google的强大挑战,又使一些人对微软研究院乃至整个公司的创新之道有所质疑。《华尔街日报》旗下AllthingsD记者Ina Fried在技术节第一天就发出一篇文章,名为“微软科技节这么酷,可为什么他们的产品不酷呢?”,算是这方面的代表。她在文中说,Apple并没有专门的研究院,但却能每每拿出更吸引消费者眼球的创新产品。

采访微软公司首席研究官Rick Rashid和新任全球副总裁兼微软研究院海外负责人周以真时,我都问了同一个问题:微软研究院是否有自上而下的统一计划?得到的都是否定的回答。Rashid说,产品研发才需要有计划,无论多长时间,总要有目标,有时间表,即使是不切实际的时间表。而研究就是要寻找一切机会不断探索,不考虑结果如何,直到最终成功。“在研究中,如果你做好的探索和尝试,足够聪明,总会有些发现,有些进步,这都是成功。”Rashid强调,在微软研究院,没有提议报告,研究人员也没有太多预算约束,而且鼓励不同团队在相同的领域竞争与合作,因为探索是无法计划的。曾经在美国自然基金会执掌计算机科学研究全国资金分配的周以真也持相同的看法,她说研究就是要冒风险,尝试一些看上去不那么有把握、正确的事情。少数人是很难对研究进行规划的,关键在于找到顶尖的优秀人才,尽可能提供条件,帮助他们成功。

事实上,Rashid在技术节主题演讲中开宗明义,微软研究院的第一目标,是推进所涉及的各个领域的研究前沿。需要不断挑战极限,既能够创造新技术,又能够探索这些技术所带来的可能性。这个第一目标可以与微软产品完全无关。在采访中他还进一步解释,做研究并不是为了创造某个特定产品,或者为了将某个特定的技术转换成产品。做研究的目的是为了不断推动最先进技术的发展,开发新的想法,学习新的理念,创造新的东西。如果把研究和产品联系的太紧密,会减少创新的机会和研究的价值。虽然研究院也有另外两个目标,一个是快速将创新技术转化为产品,一个是确保微软的产品充满希望。但这后两个某种意义上是第一个目标的自然结果。

去年7月Google研究总监Peter Norvig等曾专门撰文介绍他们独特的将研究与研发紧密结合的混合研究方式。在那篇文章中,Norvig也承认Google的方式下,与用户和产品离得太近,容易陷入其中而短视,错过影响极大的范式转变。

而微软研究院的这种开放、以研究者为中心的理念,在我看来,实际上正是它20多年间迅速成为世界计算机学术重镇的奥秘。比如,今天炙手可热的大数据研究,其实微软研究院早在1995年邀请Jim Gray加盟、开辟eScience领域时就已经开始了。因此这方面微软的积累深入而且广阔,涉及计算机技术在医学、环境、天文、生物、人文等诸多领域的应用和创新。在云计算领域,微软的Azure服务和Office 365都已经又像昔日罗马军团那样,在稳定地获取市场份额。而在自然用户界面领域,微软的布局也非常多样化,在Kinect之后,又推出Surface,在2012年还收购了大屏幕触摸屏公司Perceptive Pixel(PPI),要在多屏时代占据有利地势。虽然在目前的移动终端上微软还在追赶,但是这恰恰是一个领导者变化频仍的市场,看看诺基亚、摩托罗拉和黑莓,明天谁会笑到最后,还很难说。

反过来,Apple在狂飙突进的爆发性增长之后开始进入平台期,而且在云计算、大数据等诸多对未来至关重要的领域乏善可陈,恰恰暴露了他们长期性研究方面的不足。

同样受邀参加本届技术节的中国科学院副秘书长潘教峰也肯定了微软支持基础前沿研究的理念,他认为微软研究院的研究不仅仅着眼于当前研发新产品的需求,更着眼于推动计算机技术的发展,着眼于创造和把握微软的未来。加之微软具有强大的系统集成能力,使得其在计算机软件领域具有卓越的引领能力。

我曾经问过微软亚洲研究院从事人机界面研究的曹翔,移动互联网的大潮从某种意义上是由多点触摸这一界面层的创新应用而启动的,那么下一次类似的界面层革命会发生在什么时候,又怎么发生?他回答,今天成功应用的技术,往往可以追溯到几年甚至几十年前的研究,所以预测未来的最好方式,就是去看各领域的研究热点。

是的,在微软技术节,我看到了未来。

本文选自《程序员》杂志2013年5期,未经允许不得转载。如需转载请联系 market@csdn.net

《程序员》2013年杂志订阅送好礼活动火热进行中

转播到腾讯微博

----->立刻申请加入《程序员》杂志读者俱乐部,与杂志编辑直接交流,参与选题,优先投稿

请评论

preload preload preload
京ICP备06065162