您现在的方位: 伟德官网网 >> 广告新闻 >> 广告展会 >> 广告论坛 >> 正文

Netflix,为何能成为个性化引荐的王者?

责任编辑:佚名    新闻来源:不详    新闻日期:2018/7/23

QQ截图20180720141824.png

作者:Shady,微信大众号:ShadyDesign

注:从《纸牌屋》开端,Netflix越来越多地进入国人的视界中。关于它的用户引荐体系、“大数据剖析”等等神话和传说也有不少,本文是我在查找了一些材料后,收拾出来的Netflix的引荐思路和一些办法。过分技能的算法内容实在是hold不住,因而仅从逻辑上进行阐明。一来收拾自己的思路,二来尽或许学习些东西,共享出来欢迎各位谈论。

一、坐等风来

回忆前史,Netflix是一家典型的提早布局等风来的公司。

1997 年 8 月,在DVD机仅推出几个月后,Reed Hasting和Marc Randolph创建了Netflix,并在 1998 年 3 月上线了全球第一家线上DVD租借商铺。以仅 30 名雇员拿下了 925 部电影,这简直是其时一切的DVD电影存量。

1999 年他们推出了全新的按月订阅的形式,用户第一次有机遇享受到没有过期罚款、没有运费、手续费等等一系列烦人的东西的服务。比较Netflix之前运用的单部电影租借的方法,新形式对用户愈加友爱,所以Netflix凭借着这个形式敏捷在职业里树立起了口碑,老旧的单部影片租借形式也于 2000 年与世长辞。

随后的 2001 年,由于DVD机价格越来越低,成为当年圣诞节成为最受欢迎的礼物之一,Netflix也在 2002 年坐上了这趟快车,用户量得到了巨幅增加。这是Netflix创建四年迎来的第一个风口,现在看来不得不感叹其眼光之独特。

2005 年,他们发现尽管没有高清内容,但Youtube的流媒体服务(可简略了解为在线播映)依然非常受欢迎,所以抛弃了自己的硬件产品Netflix Box转入其间,于 2007 年上线了流媒体服务。而跟着日后网络带宽的提高和费用的下降,占有了先发优势的Netflix又一次收成了巨大增加。

2006 年,一项名为Netflix Prize的算法大赛横空出世,Netflix拿出 100 万美元奖金让开发者们为他们的优化电影引荐算法。到 2012 年第四季度,Netflix已在全球具有 2940 万订阅用户。

2012 年,Netflix开端测验克己内容,并于 2013 年推出《纸牌屋》,高明的内容质量和一次放出整季内容的发行方法,让它瞬间风行全球。

本年 4 月,Netflix的全球订阅用户到达1. 25 亿,服务逾越 190 个国家和区域。到今天,它的市值逾越迪士尼成为全球互联网企业排名第六的公司。

回忆Netflix这 21 年的前史,好像每一次转型的机遇和方向都是如此精确,以至于有些“自可是然”地达到今天的高度。可是假如咱们透过现象看实质,从万变中找不变的话,有一件事必定会被说到——个性化引荐。乃至能够说,“个性化引荐”就像Netflix克己的鼓风机,第三个风口是他们自己造出来的。

没有清晰的材料阐明Netflix在做邮递租借DVD的时分有没有引荐机制。但他们的确从最开端的时分,就非常重视数据,并开端搜集用户数据了:他们会在邮递的信封里附上问卷让用户给电影打分。这些打分数据是之后Netflix引荐体系的重要柱石之一。

“个性化引荐”一向都是Netflix的杀手锏,数据堆集和算法研制的提早让它在这方面简直是不可被逾越的,时至今天用户在Netflix上观看的80%内容都是由引荐而来的。

二、解构好莱坞

Netflix的引荐体系之所以能够如此高效地达到方针,我以为最大的理由是他们教会了“让机器懂电影”。在一篇名叫<How Netflix Reverse Engineerd Hollywood>的文章中(由Alexis C. Madrigal于 2014 年宣布)。作者从Netflix的引荐分类动身,解说了他们是怎样解构好莱坞进而去给用户做引荐体系的。

在Netflix的主页中你会看到一行一行的电影,每一行是一个分类,官方叫它altgenre,或者说“微分类”,每个分类中是一系列的电影。这些分类和电影都是为你量身引荐的。

在这些分类中有一些非常精准、非常有意思的标题:情感充分的反体系纪录片(Emotional Fight-the-System Documentaries)、根据现实的皇室剪影(Period Pieces About Royalty Based on Real Life)、 80 年代的外国凶恶电影(Foreign Satanic Stories from the 1980s)。

那么这些类型是怎样来的呢,作者Alexis做了一件很绝的作业:

他把Netflix的一切分类全爬了下来,共有 76897 个分类之多。并且将这些分类的用词和语法做了深化剖析,还自己开发了一个“类型生成器”,生成出了和Netflix类似的成果。他乃至给出了公式:区域+形容词+类型+故事根底+拍照地+年代+关于(什么的内容)+合适年龄段(Region… + Adjectives… + Noun Genre… + Based On… + Set In… + From the… + About… + For Age X to Y)。

但看到这儿,咱们仅仅看到了Netflix解构好莱坞的成果,那么这一切是从哪里开端的呢?

2006 年,Netflix产品副总裁Todd Yellin带领一票工程师用数月时刻写了一份长达 24 页的名为《Netflix量子论》(Netflix Quantum Theory)的文档。专门叙述怎样用“微标签”(microtag)拆解电影。

这份文档的意图是作为练习手册,让不同的人对微标签有相同的了解,以确保能够体系性地、规范一致地解构上千部电影。现在这份手册现已扩展到了 36 页。

这份 36 页的练习手册叙述了怎样给一部影片的性暗示内容、血腥程度、浪漫等级、乃至情节总结等元素评级。文档还解说了怎样给影片结局打标签、给首要艺人的“社会承受度”打标签、给每部影片的浪漫程度打标签,更重要的是,每个标签都有从 1 到 5 的评级。

以《超胆侠》电影为例,标签会包括“四个首要人物”,至于其间Matt Murdock这个人物,会有艺人名、人物名、他很“英豪”(heroic)、是个律师等等。

Netflix便是用这样的方法,解构了简直一切的电影,用精密、精确的微标签和评级教会引荐体系去知道电影、解读电影。

更令人称道的是,给Netflix打标签真的是一份作业。Netflix组建了一只团队,付钱让他们看电影一起给这些电影打上标签。有功德的媒体采访到了一位“标签员”(tagger),让他叙述给Netflix打标签是一种什么样的体会,非常有意思。

三、解构用户

2012 年前后,Netflix的引荐体系阅历了一次严重的战略改动,官方技能博客以名为<Netflix Recommendations: Beyond the 5 stars>的文章(分为1、 2 两部分)论述了这种改动的来龙去脉:

在邮递租借DVD的年代,Netflix能够取得用户的评分,可是用户观看电影的进程对途径是隐形的。可是跟着流媒体事务的展开,Netflix总算有机遇看到用户的更多方面。所以他们知道到:

Everything is a Recommendation.”——一切都是引荐。

由这一主意催生出的,是愈加详尽、深化的用户引荐。

Netflix的官方文档中把自己称为“走运”,由于他们有许多的相关数据和能够把这些数据应用到产品中的人才。

以下是Netflix用来优化引荐体系的数据源:

  • 数以百万计的用户评分数据(tagins),并且每天还在以百万量级增加;

  • 作为算法基准线的项目热度(item popularity);

  • 包括时长、时刻、设备类型的数百万播映数据(stream plays);

  • 用户每天会想自己的列表(queue)中增加数百万项目;

  • 每个项目下丰厚的元数据(metadata);

  • 每个项意图展现方位(presentation)和作用;

  • 用户的交际数据(social);

  • 百万级的用户查找数据(search terms);

  • 来自外部(external data)的票房或影评数据;

  • 当然,实际上用到的数据还远不止这些。

除了和影片相关的数据外,用户数据是Netflix引荐体系的另一重要柱石。

转型流媒体后,用户的一切行为悉数在途径内完结,这给了Netflix查询用户的绝佳环境,他们不仅仅知道用户看过什么,乃至知道他们是怎样看的:什么时分看的,看了多长时刻,在哪里暂停,在哪里重复,在哪里封闭等等,这些行为数据无一不是用户喜爱的表现。

经过剖析这些行为数据,和解构好莱坞得来的影片数据进行匹配,让Netflix的引荐精度越发精确。

四、引荐新姿态:个性化海报引荐

上一年Netflix推出了一项新的引荐功用:个性化海报引荐,具体来说便是“不同的用户看到的同一个电影的引荐海报是不一样的”。假如你喜爱动作戏,则或许你看到的海报是片中的打架局面,假如你喜爱片中某个主演,那么你看到的是以他为主角的海报。

这一功用的源头相同是对电影内容和用户喜爱的解读。以为地去发明更多的“一见钟情”,进一步提高了引荐体系的功率。

五、Netflix的自省

1.从官方文档泄漏中的信息来看,长久以来Netflix尽管对算法非常依靠,但也意识到它的缺乏,这种缺乏或许是一切的算法都躲不开的——“越引荐越类似”。因而Netflix的算法中非常重视“不同”(adversity)。别致、多样性、新鲜度,都是引荐中考虑的要素。

极力帮用户去“发现”爱好,这也是Netflix的引荐方针之一。

2.关于前边说到的个性化海报引荐,官方特别地阐明晰对它的忧虑:不期望它变成“骗”用户看电影的功用,也便是说要极力把这个功用控制在一个度里,说白了便是不“标题党”,为了让用户去看某个电影而强行用海报蛊惑他。

六、跋文

就在我写这篇文章的前几天,Netflix又做出了两个重要改动:1. 把五星点评体系改为“喜爱/不喜爱”的点评体系;2. 取消了影片下的谈论功用。

关于这两个改动网上有些解读,但我还没想清楚,就不追这个热点了。

关于Netflix可说的还有许多,最近他们还推出了另一个官方博客:Netflix Research,加上原有的the Netflix Tech Blog,有爱好的各位能够重视一下。

参考材料:

  • <Netflix Recommendations: Beyond the 5 stars (Part 1)>:https://medium.com/netflix-techblog/netflix-recommendations-beyond-the-5-stars-part-1-55838468f429

  • <Netflix Recommendations: Beyond the 5 stars (Part 2)>:https://medium.com/netflix-techblog/netflix-recommendations-beyond-the-5-stars-part-2-d9b96aa399f5

  • < How Netflix Reverse Engineered Hollywood>:https://www.theatlantic.com/technology/archive/2014/01/how-netflix-reverse-engineered-hollywood/282679/

  • <Netflix tagging: Yes, it’s a real job>:https://www.washingtonpost.com/news/arts-and-entertainment/wp/2015/06/11/netflix-tagging-yes-its-a-real-job/?noredirect=on&utm_term=.51f470d15c18

伟德官网网


  • 上一篇新闻:
  • 下一篇新闻:
  • 发 表 评 论

      姓 名:   性 别:
      Q Q号:   Email:
    我要给这篇文章评分 1分 2分 3分 4分 5分
      请自觉遵守,留意文明讲话
    企业推行
    企业服务
    m88 188bet uedbet 威廉希尔 明升 bwin 明升88 bodog bwin 明升m88.com 18luck 188bet unibet unibet Ladbrokes Ladbrokes casino m88明升 明升 明升 m88.com 188bet m88 明陞 uedbet赫塔菲官网 365bet官网 m88 help
    广告模特
    全国各地广告网分站
    伟德官网网服务主旨:为我国北京天津上海重庆深圳厦门黑龙江哈尔滨吉林长春辽宁沈阳河北石家庄甘肃兰州青海西宁陕西西安、河南郑州、山东济南、山西太原 、安徽合肥、湖北武汉、湖南长沙、江苏南京、四川成都、贵州贵阳、云南昆明、浙江杭州、江西南昌、广东广州、福建福州、台湾台北、海南海口、新疆乌鲁木齐、内蒙古呼和浩特、宁夏银川 、广西南宁、西藏拉萨、香港、澳门等世界各地伟德开户及广告人供给广告规划,品牌传达营销,案牍策划,广告人才招聘训练,伟德网址,广告事例,广告构思、betvictor伟德、4A媒体等伟德注册。