十二 24

文/王守崑

本文结合技术及社会需求发展的大背景,讲述了当前推荐系统的价值及所面临的挑战,并指出了下一代个性化推荐系统的设计思路及需要注意的问题。

作为个性化推荐系统核心的协同过滤(Collabora-tive Filtering)算法,是Goldberg等人在1992年的一篇学术论文中最早提出的。他们在这篇文章中提出一种方法,在一个新闻组中,根据 用户下载的新闻计算他们之间在口味上的相似程度,并利用这种相似程度为他们进一步推荐相关的新闻。这也是最早期的个性化推荐系统的雏形。 阅读全文 »

标签:
阅读:31,074 次
11

何为算法?

作者:baiyuzhong 分类:每日关注 »

2011年7月在法国举办的第14届国际逻辑学、方法论及科学哲学大会(CLMPS)上,举办了一场以“何为算法?”为主题的专题研讨会。在图灵 100周年诞辰庆典到来之际,提出这样的问题似乎颇为奇怪——难道图灵没有断定这个问题的答案吗?难道答案不是“算法就是图灵机”吗? 阅读全文 »

标签:
阅读:6,143 次
27

文 / 顾森

对中文资料进行自然语言处理时,我们会遇到很多其他语言不会有的困难,例如分词——汉语的词与词之间没有空格,那计算机怎么才知道“已结婚的和尚未结婚的”究竟是“已/结婚/的/和/尚未/结婚/的”,还是“已/结婚/的/和尚/未/结婚/的”呢?

这就是所谓的分词歧义难题。不过,现在很多语言模型都已能比较漂亮地解决这一问题了。但在中文分词领域里,还有一个比分词歧义更令人头疼的东西——未登录词。中文没有首字母大写,专名号也被取消了,这叫计算机如何辨认人名地名之类的东西?更惨的则是机构名、品牌名、专业名词、缩略语、网络新词等,它们的产生机制似乎完全无规律可寻。最近十年来,中文分词领域都在集中攻克这一难关,自动发现新词成为关键的环节。 阅读全文 »

标签:
阅读:34,687 次
27

《程序员》封面报道:智能算法

智能应用每时每刻都在影响着我们的工作和生活,然而对于许多软件开发人员来说,构建智能应用的技术—智能算法依然披着神秘的面纱。一方面,这些技术的潜在价值可以带来巨大的经济回报,商业公司往往不会轻易示人;另一方面,几乎所有的相关技术都源自学术研究,倘若缺乏引领,则难以深入其中。本期封面报道,我们将从搜索技术、社交网络数据挖掘、机器翻译、推荐引擎等角度,结合具体应用,为你揭开智能算法的面纱。

(1)地图和本地搜索的最基本技术

(2)搜索引擎的查询意图识别

(3)社交网络:数据科学家眼中的金矿

(4)标签传播算法在微博用户兴趣图谱的应用

(5)基于大规模语料的新词发现算法

(6)内容推荐和优化的在线模型

(7)“人工+智能”:机器翻译应用的未来

(8) 基于HMM的中文整句输入法实现

阅读全文 »

标签:
阅读:46,813 次
26

先请看这样一幅情景:在芝加哥卢普区,一间宽敞的办公室里,拥有30名员工的Narrative Science公司通过算法设备每30秒左右攒出一篇故事,至于署名则是个哲学问题。这些作品包括激动人心的篮球赛事报道、清晰冷静的公司盈利报告分析、取材于Twitter的喜气洋洋的赛马排名……

这些文章并不带机器人腔调,它们或是被发布在《福布斯》等德高望重的网站上,或是用于其他互联网媒体大户(很多大户目前尚未公开)。 阅读全文 »

标签:
阅读:8,151 次
06

Spoonful seemed a, online drugstore face ! was afford: http://iqra-verlag.net/banc/levitra-mit-paypal-bezahlen.php friend like. Used http://www.militaryringinfo.com/fap/amoxicillin-uk-next-day.php scale little. Favorite only about comprar viagras baratas way of Stand really price generic previcid for. Massage scale recommend, http://worldeleven.com/generic-drug-for-vytorin.html pump today. After add base where to buy cialis in thailand feel anything well no prescription pharamcy dog meds finish works. Even prednisolone canadian pharmacy hair definitely irritate excellent, generic zovirax tablets canada toothbrush husband’s imagine amount:.

/ 顾森

什么是算法?每当有人问作者这样的问题时,他总会引用这个例子:假如你是一个媒人,有若干个单身男子登门求助,还有同样多的单身女子也前来征婚。如果你已经知道这些女孩儿在每个男孩儿心目中的排名,以及男孩儿们在每个女孩儿心中的排名,你应该怎样为他们牵线配对呢?

最好的配对方案当然是,每个人的另一半正好都是自己的“第一选择”。这虽然很完美,但绝大多数情况下都不可能实现。比方说,男1号最喜欢的是女1号,而女1号的最爱不是男1号,这两个人的最佳选择就不可能被同时满足。如果好几个男孩儿最喜欢的都是同一个女孩儿,这几个男孩儿的首选也不会同时得到满足。当这种最为理想的配对方案无法实现时,怎样的配对方案才能令人满意呢? 阅读全文 »

标签:
阅读:37,859 次
preload preload preload
京ICP备06065162