科技・探索・争鸣 Sc科ience&Te技ch视nology界 Vision 个性化推荐引擎技术及在电子商务中的应用 桑志超 (河北工程大学,河北邯郸056088) 【摘要】本文介绍了个性化推荐引擎的定义,对个性化推荐引擎所依据的算法原理进行了详细的阐述,个性化推荐引擎技术实现了用户 个性化的需求。提高了用户浏览搜索网页的效率。 【关键词】电子商务;推荐引擎;数据挖掘;个性化推荐 品推荐。例如。假设用户A喜欢物品a和物品c,用户B喜欢物品a, 物品b和物品c,用户c喜欢物品a.从这些用户的历史喜好可以分 随着电子商务的不断发展.其规模越来越大.可以提供的商品种 析出物品a和物品C时比较类似的.喜欢物品a的人都喜欢物品c, 类和数量也不断大幅度地增加 如何使顾客方便、快速的找到商品,顺 基于这个数据可以推断用户c很有可能也喜欢物品c。所以系统会将 利地完成购物过程成为电子商务企业亟待解决的问题.也是企业提高 物品c推荐给用户c 其自身竞争力的重要砝码 个性化推荐技术为解决这一问题提供了有 该推荐机制能够离线计算.不存在时效性的问题;尽管依旧有数 力的支撑。目前.以搜索引擎为基础的推荐引擎技术为提高购物效率 据稀疏的问题.但是可以计算:能够有效地发现具有相同兴趣的用户 提供了强有力的技术支持 的相似item 其不足之处在于多样性不如基于用户的推荐机制,对于 兴趣单一的用户较为适用 1关于推荐引擎 2_3基于人口统计学的算法 1.1推荐引擎定义 该算法指根据用户的基本信息.从中发现用户之间的相关度.然 推荐引擎的目的是解决信息过载问题,其本质在于通过对用户历 后将相关用户喜欢的商品推荐给当前用户。例如,通过用户基本信息 史活动记录进行分析后.得出用户的兴趣特点等信息.进而主动为用 调查发现.用户A与用户c都是女性.且属于同一年龄段,则可以认 户推荐其感兴趣的商品或信息 个性化是推荐引擎的精髓所在.通过 为用户A和用户C相似.就可以把用户A喜欢的商品推荐给用户c。 对群体数据进行分析得出用户的个性化爱好.然后针对其个性化需求 这种推荐方法的优势在于不存在冷启动问题.且适用于任何商品领 等给出相应的推荐 从长远看来.推荐引擎技术具有极为广阔的发展 域:其不足之处是对用户分类方法过于粗糙.无法深入发掘出用户偏 0引言 空间。 好.且对于有些用户敏感的信息难以获取。 1.2推荐引擎与搜索引擎的联系与区别 2.4基于T0pie modeI的算法 推荐引擎与搜索引擎有着一定的联系与区别。二者都是基于网络 该算法的思想是为每个Item定义不同的topic标签.之后定义每 平台的工具,旨在发现答案或兴趣点:算法考虑的角度比较类似,不过 个topic之间的相似度。用户选择topic后,基于其选择进行各个topic 算法思想存在很大的差异.搜索引擎给出的结果强调内容关联.而推 之间相似度的计算.最后生成推荐item集合 荐引擎给出的结果则强调个性化:搜索引擎是帮助用户找到最为合适 在该推荐算法中,topic作为联系user与item之间的纽带,借助较 的结果.而推荐引擎可以帮助进行多样化体验进而满足其多个兴趣需 好的用户回馈机制.就能够使系统更好地演绎。其不足之处是item之 要:海量数据的处理和计算是二者不可缺少的一部分;相比于搜索引 间相似度计算比较麻烦且topic定义繁琐。使用该算法作为推荐算法 擎被动等待用户搜索请求的情况.推荐引擎是主动为用户推送相关的 的主要有voutube、go0gle news,jinni等网站。 服务 2.5基于关联规则的推荐算法 关联规则算法是数据挖掘算法中的经典算法之一,它主要是找出 2推荐引擎技术原理 数据的依赖关系。通过进行关联规则分析.能够了解到什么样的物品 2.1基于内容相似度的算法 被同时购买的几率比较大.或者了解到用户在购买一些物品后通常还 该推荐算法是以从推荐物品或者推荐内容的元数据中找出物品 会购买哪些别的物品 当挖掘出这样的具有关联规则的物品信息后, 与内容的关联性然后根据用户以往的兴趣爱好为算法的核心思想.这 就可以基于这些信息为用户推荐关联商品 是在推荐引擎出现之初是使用最为广泛的推荐方法。例如:假设用户 2.6混合推荐机制 A、用户B、用户c都喜欢看影视剧,用户A喜欢看的电影a属于爱 在现行的多数网站中.并不是使用单一一种推荐模式.往往是集 情、浪漫类,用户B、c喜欢的电影b属于恐怖惊悚类,电影c与电影a 合各种推荐方法的优势.进而达到更好的推荐效果。目前常用的混合 相似属于爱情浪漫类.则可以把电影c推荐给用户A 方法主要有加权混合、分区混合、切换混合和分层混合。加权混合指用 基于该算法的推荐机制的不足之处在于:1)需要对商品进行分析 线性代数中的公式将不同的推荐方法以一定的权重组合起来,利用测 建模.其建模的完整性与否直接影响到推荐的质量:2)在对商品进行 试数据进行反复实验以期达到最好的推荐效果:分区混合指将不同推 建模的过程中往往会忽略人对物品的态度:3)存在“冷启动”问题。应 荐方法的推荐结果显示在不同的区域.这种方式在当当网、亚马逊等 用该推荐方法的网站有百度、优酷、gmail、google等。 网站中都可以看到:切换混合指针对不同的物品,不同的情况下采用 2.2基于协同过滤推荐算法 最合适的推荐机制来向用户进行推荐:分层混合指采用多种推荐机 2.2.1基于用户的协同过滤推荐 制.并将一种推荐机制的推荐结果作为另一种推荐机制的输入,从而 该推荐方法的基本原理是运用“K一邻居”算法.找出与当前用户 得出更为精确的推荐结果 偏好相同或相似的邻居群.然后根据邻居群的历史记录对当前用户进 3推荐引擎技术在电子商务中的应用 行推荐。例如.假设用户A喜欢物品a.物品c和物品d,用户B喜欢 物品b.用户c喜欢物品a和物品c:从各个用户的历史偏好信息中, 在推荐引擎技术出现后.用户在电子商务网站浏览的效率得到了 我们可以发现用户A与用户c的偏好比较类似.同时用户C还喜欢 很大的提高.它只显示用户想要看到的内容 试目前应用推荐引擎技 物品d.由此我们可以推断用户A可能也喜欢物品d.因此可以将物 术的电子商务网站很多,最典型的就是亚马逊.像淘宝网、当当网、京 品d推荐给用户A 东商城、腾讯等大家所熟知的网站中也大量应用了推荐引擎技术。 该算法的领域扩展性比较好.其推荐多样性远远高于基于物品的 推荐引擎在电子商务中的应用主要表现在如下几个方面:1)今日 协同过滤推荐。其不足之处在于算法具有时效性,无法离线计算:在大 推荐:通常是基于用户近期的购买记录或者浏览记录.结合当下一些 规模数据集上数据稀疏严重 比较流行的物品等信息对用户进行推荐;2)捆绑销售:基于数据挖掘 2.2.2基于物品的协同过滤推荐 技术对用户的购买行为进行深入挖掘分析.找到其购买记录中具有关 该推荐机制的原理同基于用户的协同过滤推荐机制类似.它是发 联的物品进行捆绑销售,如淘宝网中的搭配套餐;3)t叩排行榜:基于 现物品与物品之间的相似性.针对用户的历史偏好信息对用户作出物 销售记录中销售数量最多的商品进行排行,向用户进(下转第141页) ’3。l科技视界science& chn。 。gy Visi。n Science&Technology Vision 科技视界 科技・探索・争鸣 规则规定:球出界之前.最后触及球或被球触及的队员.是使球出 规则规定:如果指定执行罚球的队员.由于受伤方面的原因.不能 界的队员。队员试图救即将飞出界外的球,或持球停于场地的边缘附 继续比赛,他的替补者应代他执行罚球 那么当一名队员在罚球欠佳 近.被对手逼抢失去了重心或空间位置而即将出界时.如果来不及或 的情况下,假装受伤而让罚球准的替补队员替换可以吗?答案是肯定 没有把握将球传回给同伴.不妨将球拨打到对方球员身上.使球反弹 的。因为规则没有给裁判员阻止这种不当行为的权力.对裁判员来说. 出界而又可确保球权不失。 唯一可能的行动是让他自己确信.无论如何罚球队员受伤是真实的 比如,A4正在做投篮动作时.被判犯规,因A4罚球不准.他佯装受伤 8掌握和应用8秒、14秒、24秒规则与比赛节奏的控制 被球队席上罚球最准的A10队员替换而进行罚球。不难想象.关键时 特别是实力相当、比分持平、比赛时间又临 名队员从控制活球开始.要在24秒之内完成一次投篮.直至球 刻的一次球权或罚球得分.该是何等的重要.甚至能决定比赛的最终结局 中蓝或触及蓝框 但如果你想控制比赛的节奏特别是比分领先于对 近终点时,规则规定:每场比赛.每队上半时能请求两次暂停.下半时能请求 手.时间所剩无几的情况下.为什么不尝试打满每一个24秒呢?多运、 每个决胜期均有一次.时间都是一分钟.没有用完的暂停次 多传球.躲避开对手的抢断与犯规.不临近24秒决不轻易地投篮出 三次暂停.不准挪在下半时或决胜期使用 教练员要暂停的时机的几种情况. 手.尽可能地耗费掉对手可用来扳回比分的时间.这样你的胜算就越 数。但应该把暂停运用在关键时刻。一般的情况下.应该尽 大 我们见过这样的球队.临近终场在比分领先于对手的情况下.头脑 这里不再赘述,但是比赛开局不久出现反常现象,遇到这种情况.即 发热,不注意控制比赛节奏,不注意充分利用24秒规则.一味地进攻. 量留在最后使用,也应该当机立断地请求暂停 特别是青年 急于投篮,结果忙中出错、或投篮不中、或发生失误,反给对手以可乘 使比赛刚刚打了两三分钟.更应该这样做。暂停是规则给教练员的权利.教练员请求使 之机,最终反胜为败。某队在后场控制球还剩下3秒、2秒或者1秒快 队的比赛,可以用规定的暂停手势或语言明确地对记录员台提出(如 到8秒违例时.教练员为什么不采取全场紧逼战术或压迫式的防守 用暂停时.则直接按)暂停要求 暂停是教练员l}缶场指挥时.鼓舞队 呢?往往这种情况的出现我们国内的运动员,包括教练员,很少有这种 有电动设备,员士气,稳定队员情绪.改变比赛战术重新组织力量的一种手段 意识.因为平时训练就忽视这个规则的运用 因此.教练员在使用暂停时要很谨慎。通常在下列情况下并有机 9要掌握和应用规则中“假摔”、“带球撞人”、“合理的防守动 会时使用暂停:(1)当比赛中对方采用新的打法.本队不适应而连续失 作”与“圆柱体原则” 误,或对方连续得分时;(2)当本队的比赛由高潮走向低潮时:(3)当本 队场上队员的思想不统一,行动不协调时;(4)当队员精神紧张,在攻、 阻挡与带球撞人是攻守矛盾的两个方面。由于受时间、位置、角度 等因素的影响.裁判员有时很难对其做出精确的判断.这使阻挡中的 守中连续发生错误时……另外教练员要更加注意如何在比赛的过程 中合理运用暂停战术.特别是在比赛即将结束而比分处于胶着状态或 “假摔”成为某些防守者的杀手锏.更何况有些碰撞本身就介于阻挡与 比分差距不大的情况下.教练员战术的合理安排和及时调整对球队能 带球撞人两者之间.怎样判罚都不为过 比赛本身就是攻守双方在斗 否赢得比赛起着极大作用.所以教练员合理运用和把握暂停规则所带 智斗勇.发生碰撞时.防守队员顺势来一跟斗.诱使裁判判罚带球撞人 对丰富球队的防守、进攻技战术水平是至关重要的 那是最好.不判也没真摔着.必要时不妨一用。恰到好处的“假摔”关键 来的机遇.一取决于脚步的积极移动.判断好有球队员瞬间的移动方向和路线.迅 速抢占其位置,上步陕一步、动作小一点、暗劲使得足一点,上体后倾, 阻挡后接劲倒地.顺势而为。同时.裁判法规定,在一名队员从后场向 前场运球时.防守队员面对面防守时.只要防守队员的双手一触及进 攻队员的腰及其他部位时.就可以直接判罚防守队员犯规.这是一个 涉及合理防守动作及圆柱体原则的规则 作为一个优秀的教练员必须 熟知以上规定.否则.被裁判员判罚了还不知道为什么 12结束语 以上内容涉及到违例、犯规以及临场指挥等方面.适用于男女教 练员.任何篮球比赛.实战中面对随时可能出现的问题.能在规则允许 的范围内瞬间做出反应.采取较为恰当的措施积极应对.变被动为主 动就可在比赛中占尽先机。利用规则,趋利避害,同时也有助于比赛攻 防水平的提高,增加比赛的变数与悬念.使比赛更加精彩激烈.更具朝 气和魅力。这就要求教练员、运动员也要学习规则、理解规则并能加以 合理的运用。对于专业教练员来说,不但要熟悉和理解规则的变化.还 要对其做出更深入的分析和研究.逐步达到掌握和精通规则.不断学 习与提高,才能在新的规则环境下.充分利用规则进攻和防守.创新个 发掘新的进攻战术和防守战术.帮助球队提高战斗力.从而获得更好 的比赛成绩。 同时学习规则及裁判法.要在平时训练中占一定的时间.弄懂规 则实质,学会运用规则,多讲些战例.用以教育运动员引起重视.尤其 对年轻队员更要加强规则教育.比赛结束要总结执行规则的情况.宣 1 0要掌握和应用“战术-性犯规” 规则规定:投篮队员被侵犯.或全队每节累计犯规4次以上.均要 由对方执行相应次数的罚球.这样也必然涉及到一个罚球命中率的问 题。如果球队整体或某一队员罚球不准、失常(比赛时观察)那么在防 守他们时.封盖与抢断的动作幅度就可适当做的大一些.狠一些.当然 也要有度。这种极具攻击性的防守.又会让对手更畏手畏脚,投不进、 罚不中,阵脚自乱 另一种情况,当一方比分落后又临近终场时.唯有 采取战术性的犯规.以获得更多的进攻时间.才有可能将比分扳回.当 然这也寄希望于对手的罚球不中 除此之外.怎样犯规与犯规的次数 及时间安排也要恰到好处.还应注意选择犯规的对象.尽可能朝着比 较年轻、经验不足、罚球不准或失常的队员,同时也要注意犯规的度. 动作过大、过猛、过于危险,被判违犯体育道德犯规或夺权.那就更是 雪上加霜、事与愿违了。当然如果防守队员在失去最佳防守位置时.特 别是当你处在最后一道防线的情况下.能任由对手摆脱后长驱直人. 直捣黄龙吗?答案是肯定的.此时就是战术性犯规的好时机.关键时刻 还是应加以运用 传好人好事,树立榜样。● 【参考文献】 [1]全国体育院校通用教材.篮球[M].人民体育出版社 [2]篮球竞赛规则[M】.人民体育出版社. [3]篮球[J1. [4]闰育东篮球裁判必读[MJ.北京体育大学出版社 [责任编辑:刘帅】 1 1 要掌握和应用“换人”与“暂停”的规则 (上接第130页)行推荐。 4小结 【参考文献】 [1]HAN Jiawei,KAMBER Micheline.数据挖掘概念与技术[M】.范明,孟小峰,译 北京:机械工业出版社.2007 论文对推荐引擎的相关定义以及算法原理进行了较详细的介绍. [2]张奇锋.潜力巨大的推荐引擎让互联网更懂你【N】.广东科技报,201 1-09—24. 推荐引擎能够促成更多的网上交易,具有很大的发展空间。但是,尽管 [3]陈静.推荐引擎抢占行业先机【Nj.经济日报,2011-09—15. 推荐引擎在推动电子商务发展方面有很大的优势.但是其仍有其不 足.比如“冷启动”问题.而且在涉及到用户个人信息时是否触及用户 [责任编辑:汤静] 的隐私权还有待确定。 science&rrechn。1。g)r Visi。n科技视界I 1 41