调研的视频推荐算法
思维导图:https://modao.cc/mind/share/a014600d580bd126492335b122baff1ca6af36b2
个人对视频推荐算法的理解
1.前提条件:内容生产速度 > 内容消费速度
例如:内容生产速度为每天生产100万-300万条视频,平台内有1000万活跃用户量,平均每个用户每天消费1000条视频, 那么如果没有视频推荐算法会怎么样? 是不是每个用户能看到什么内容只能全凭运气了? 在这种情况下,我们认为这1000万活跃用户他为什么还会继续活跃?是因为平台给钱让用户每天活跃吗? 现在的痛点是什么?一定是按用户喜好,进行匹配推荐用户可能感兴趣的视频内容,这一点大家有不同的观点吗? 解决这个痛点之后,用户确实能被精准的推荐自己感兴趣的视频内容了。 新的问题来了,平台内10天总共生产了1000万条视频,其中有10万条汽车相关的视频,1000万活跃用户量中有10万是对汽车相关感兴趣的, 怎么玩?是不是这10万条视频,就要无差别的推荐给这10万个用户? 这10万个用户其中的任何一个用户,他的痛点是什么? 他能看完这10万个视频吗?如果看不完怎么办? 是不是需要从这10万视频中找出更高质量的内容进行推荐? 那这个高质量是谁来评判? 是不是应该由用户来评判? 怎么评判? 评判为不高质量就代表着死亡,没有任何播放量了吗? 视频推荐算法是不是应该一个一个的来解决这些问题? 解决完了上面的问题后,还会有新的问题吗? 新的问题中有哪些问题是需要视频推荐算法来解决的? 我不做解答,大家自己去想想,视频推荐算法它具体应该做些什么,是不是首先要让它知道自己是需要解决什么?
再举个例子
例如:内容生产速度为每天生产10条视频,平台内有100活跃用户量,如果现在的视频推荐算法还是同上面一样,会出现什么效果?会不会出现新生产的10条视频,没有1条是现存100个活跃用户所感兴趣的?肯定会,会怎么办?记住这个时候视频推荐算法还没有增加其他的功能,只能按用户喜好进行推荐,得到的结果就是100个用户,没人能看到任何1条新的视频内容。新生产的10条视频内容也全都是0播放量。那么怎么优化?是让这10条视频被100个用户每个人都看到还是只希望被10个人看到?我们希望视频推荐算法实现什么效果?视频推荐算法它自己也是懵逼的,不知道该干些啥。
2.我们现在需要解决的问题是什么?
每个用户看到的都是一样的?如果希望每个用户看到的不一样,还是回到了上面的问题,10条视频,100个用户,每1条视频只能被不同的10个用户能看到,它就真的不一样了。但是这是我们想要的吗? 可能我们还是只是希望每个用户都能看到足够多的视频,并且自己感兴趣的视频始终能最快的被自己刷新看到,这样一来,视频推荐算法,变成了视频排序算法了。所有的视频,针对不同的用户喜好,会有不同的排序顺序,打开APP第一眼能看到推荐的视频大都是不太一样的。
3.我们的视频推荐算法(或者叫排序算法)应该怎么做?
期望值:针对不同的用户喜好,会有不同的排序顺序,打开APP第一眼能看到推荐的视频大都是不太一样的。
方案A:
所有分值满分10000。
3.1.给视频打标签,如“汽车”、“美食”、“旅游”、“书法”、“小动物”等等,暂时只能**后台人为给打标签**
3.2.给视频的标签分配不同的初始分值,如“汽车(5分)”、“美食(3分)”、“旅游(6分)”、“书法(2分)”、“小动物(1分)”,原因是这个视频的内容都包含这些标签,但是每个标签占的分值可能有高有低。
3.3.给用户打标签,如用户完整的播放了某个视频,就给这个用户打上这个视频的一些标签,这个时候,这个用户也有“汽车”、“美食”、“旅游”、“书法”、“小动物”这些标签了
3.4.给用户的标签计算分值,如用户自身已有标签“汽车(1分)”,然后完整的播放了一个有“汽车”标签的视频,给用户自身的标签“汽车(+1分)”,每个标签的分值到10000就到顶了,有分值10000的标签,说明用户最喜欢这个标签相关的视频内容
3.5.给视频的标签加分,如有标签“汽车(5分)”的视频被没有标签“汽车”的用户看了,不加分,反之每次被带有标签“汽车”的用户完整的看了+1分,点赞再+1分,转发也+1分,更多可以慢慢的补充
3.6.给视频计算质量分,如点赞数、点赞率、播放量、完播率、评论数、评论点赞数等等计算分值(初始分值10分)
3.7.给视频的标签减分,如被带有标签“汽车”的用户去报,快速划走等等条件进行判断,可以减分
3.8.给用户的标签减分,如带有标签“汽车(分值100以上)”的视频,用户自己不愿意看,就减分
3.9.给视频减少质量分。如被举报、有违规言论等等,可以减分
3.10.用户、视频、标签、视频质量、加分减分项都有了,可以按照各个分的权重进行排序了