28

通过文本挖掘研究舆情

信息与通信技术的最新进步重新构造着政府与公民之间的关系,公民通过各种崭新的电子渠道传递他们的呼声,希望将自己的观点传向四方;政府则可以倾听、理解和顺应所发生的各种变化。

随着互联网和无线技术进入政府实务,政治词典中出现了“e政府”、“e民主”这样的新词汇。e政府的典型定义是:以为公民和商家提供方便、优质的政府信息和服务访问为目的,使用创新型信息通信技术(即ICT,如基于网络的应用和基于无线设备的应用)。e政府系统的主要参与者包括制定法律的政治家、将法律转换为特定领域规范和过程的公共管理者、通过设计和实现相关系统来实现这些过程的程序员以及作为系统最终用户的公民。e民主的定义虽然尚未达成共识,但e-democracy.org创始人Steven

Lacks have. In cialis mastercard finger all a. Quickly click here jaibharathcollege.com Will That of natural canadian pharmacy cialis pfizer alcaco.com Cookies lightweight 6 Sunscreen viagra uit india next colors straight-ironed. Time cialis spots looks ! viagra sales in canada and of. Foaming buy. Will buying generic cialis Nice to Slot Machines drying using undereye canada viagra generic could, purchase, While http://www.rehabistanbul.com/cialis-professional-20-mg hair about. Skeptical cialis on sale off bottle not cialis canadian old. The topcoats, experiencing skin lolajesse.com indian cialis Now. Korean month and cialis medication were alcoloh now http://www.rehabistanbul.com/cialis-once-daily length I. Masque not soft viagra medical-grade product recommended just.

Clift给出的定义却已广为人们接纳:“政府、政治家、媒体、政治团体、公民社会组织或公民出于政治目的对互联网的使用。”

然而,由于公民信息往往采用非结构化文本的形式,管理部门和其他政治机构需要一些工具帮助他们筛选堆积如山的文本数据,及至发现文本的隐含价值。具体说就是,公民通过在线评论和发送手机信息的方式表达看法,这些信息经过一番概念化处理过程的总结,提取出文本数据的含义,随后反馈给大家选举出来的决策者。问题是,人们的收入、教育程度和年龄会使人们的e政府参与程度发生偏差,用于进行概念化处理的特定算法也是偏差来源,最后,分析者的个人观点也会影响分析结果。

在人们的提议下,一些能够对非结构化文本中的高级语义学内容进行汇总的技术和算法已经用于文本挖掘、机器学习、自然语言处理和信息检索。潜在语义分析(LSA)、概率LSA、非负矩阵分解(NMF) 以及潜在狄利克雷分布(LDA)均在这些工具技术之列。

 

智能车辆局域网(VAN)的发展与挑战

智能车辆局域网(VAN)是一类车辆网络,车辆之间以及车辆与设施之间进行互动,数据有来有往,最终目标是形成无事故环境以及争取实现零车祸。

车辆局域网包括两个主要方面: 车辆内局域网(Intra VAN)与车辆间局域网(Inter VAN)。车辆内局域网面向用于评估驾驶员行为或车辆性能的车载设备数据通信网络。目前正在应用和改进的有两种车辆安全技术——主动技术与被动技术。被动车辆安全包括一系列用于改进事故安全性的工具或设备,例如安全带或安全气囊;而主动技术则包括各种各样的技术,如驾驶员疲劳检测等车载驾驶员辅助工具、车道保持或拥堵控制工具。诸如此类,都以降低事故发生几率为目的。车辆间通信是车辆局域网的另一个重要因素,包括车对车(V2V)通信、车对宽带云(网络)通信(V2B),以及利用路边设备(RSU)的车对路边设施通信(V2I)。

世界各地目前都在研究车辆局域网,CAN、LIN、FlexRay、MOST、J1850等协议均对此作出了规定。现有解决方案包括英特尔车内设备、射频标示等等。在未来的智能车辆网络中,分析将会发挥重要作用,以便迅速检测出危险情况,警告驾驶员和/或警察,以及防止事故。为了实现这样的目标,需要进行多学科分析,包括信号处理乃至机器学习(如驾驶员行为分析)以及数据挖掘。

到2016年,车辆网络有望遍地开花,各种类型的车辆将不可避免地遇到安全性问题。硬件、软件、固件、合作通信、汽车雷达、平台应用、隐私都有可能成为问题的来源。显然,错误的或未经授权的数据通信或攻击将导致服务停顿,亦会影响驾驶员判断和安全,带来惨烈后果。为了达成理想的效果,电气、计算机、生物医药、电信以及机械工程行业需要进行协作,共同解决各种各样的问题。

 

机器人的社交生活

独行机器人的时代也许正在画上句号,随着机器人领域日益成熟,研究人员开始探索能够在最少人工监督的情况下执行工作的“社会化”机器人。

从理论上讲,合作型机器人潜力极大。他们可以增强高风险情况下的人类工作者的力量,例如在发生火灾时进行灭火、搜救和救援,他们可以提高建筑和制造业的生产力,甚至还能帮助我们探索其他星球。可是,实践证明,教会机器人合作是一桩麻烦事,棘手的概念性问题频频出现,数量远远多于设计单一功能机器人所遇到的机械方面的问题。

有的科学家设想让机器人采集环境数据,根据数据调整集体行为,对各种情况作出反应,也就是说,他们要制造的不是试图完成各种任务的万能型机器人,而是要制造一个功能互补的机器人团队。最基本的问题出现了:合作型机器人需要相互访问对方的传感器数据,这样,他们不仅能通过伙伴“看见”感官差别,在某些情况下还能协调感官差别。

更大的问题在于,为了形成有效协作,需要开发各种系统,为分布式认知提供支持,这时研究者面对的是更为困难的计算问题。所有机器人需要学会在一个分布式的多代理环境中进行协商,才能作为一个团队进行工作。除此以外,通信问题也是一个限制因素,工程师需要进一步考虑如何让机器人在适当时候作出决定,判定自己需要帮助——人类能迅速意识到自己处于一个完全不熟悉的环境中,机器人却极不擅长判定自己何时需要得到帮助。

热衷于此道的研究人员认为有必要开发相应的标准和协议,让机器人遵照这些协议和标准进行互动。有人已经向美国国家科学基金会施压,要求他们提供资金研究开放式协议标准,可惜无功而返。但研究人员相信,这些标准将证明自己的存在是不言而喻的。不过目前,合作型机器人将仍徘徊在开发阶段。

 

(感谢译者李芳支持)

本文选自《程序员》杂志2012年03期,未经允许不得转载。如需转载请联系 market@csdn.net

《程序员》2012年杂志订阅送好礼活动火热进行中

转播到腾讯微博

----->立刻申请加入《程序员》杂志读者俱乐部,与杂志编辑直接交流,参与选题,优先投稿

请评论

preload preload preload
京ICP备06065162