我们分析了10000条视频,终于知道了今日头条推荐系统的秘密


Warning: Invalid argument supplied for foreach() in /data/cxweb/www/gupowang.com/public/article/view.html on line 71
7年前
【来源丨视频帮平台】

【编辑丨善小花】


有人说,2016年是直播元年,也有人说,内容的黄金时代又来临了。直播和内容一相遇,短视频就应运而生。所以,你们或许都听过,短视频已经成为了新的互联网风口。——姑婆

就算法机制平台而言,播放量绝大部分取决于【推荐量】。

受“今日头条金秒奖组委会”的邀请,视频帮就“金秒奖”第一季度累计3.04亿播放量的10166个参赛短视频进行了专业分析。


由今日头条主办的“金秒奖”(jmj.toutiao.com)是首个短视频行业专项奖项,以一线资源和奖品希冀成为中国优秀短视频作品发源地。

特借此机会,用一篇干货说清楚今日头条的推荐机制。


推荐的流程是:

短视频上传并审核后进入推荐系统,系统识别短视频内容的分类,标题等标签信息后试探性推荐给首批目标用户,根据用户反馈进行多批次推荐或停止推荐。

整合全部影响【推荐量】的因素及算法模型逻辑后,将其划分为两大板块——转化率,热度

转化率=推荐给目标用户后获得的播放量/推荐量

这很好理解,如果算法机制是人的话,费力气将你的短视频推给了10000个用户,最后只有1个用户点击播放,鬼才会继续把精力放你身上~

系统每批次推荐量的量级都是根据上一批次推荐后的【转化率】来评估的。

即,如果首次推荐的转化率差,后面当然不会再获得推荐~

因此【推荐给目标用户后获得的播放量】就变得至关重要,是影响转化率的唯一变量,直接决定着推荐量的多与少。

而【推荐给目标用户后获得的播放量】的4大决定因素是分类、标题 、用户垂直精准度、封面。

用大白话总结来说就是:取决于谁会看? 看不看?

让我们模拟一遍推荐流程中来思考:

Step.1 短视频A进入推荐系统后,系统根据其上传设定的分类“体育”将其放置于体育分类池中。
——分类

Step.2 系统抓取短视频A标题《姚明大动作,男篮设两队两主帅》中的关键词,“姚明”,“男篮”。
——标题

Step.3 系统匹配用户数据中标有“姚明”“男篮”所对应“体育”“篮球”“姚明”“男篮”等标签的用户,小量级试探性推荐,观察用户是否感兴趣观看并有良性反馈。

——用户垂直精准度
——标题+封面

Step.4 继而扩大量级推荐,并根据“姚明”,“男篮”关联更多关键词及标签用户,如“NBA”,"CBA","奥尼尔"等......

——用户垂直精准度

到这儿,我们来结合“金秒奖”第一季度累计3.04亿播放量的10166个参赛短视频,逐一就【转化率】的影响因素进行数据验证及运营建议:

标题

将全部10166个参赛短视频的标题提取后,划分标题字数长度区间并匹配平均播放量,得出趋势如下:

标题字数长度在5-10个字内的短视频平均播放量最低;

标题字数长度在25-30个字内的短视频平均播放量最高;

标题字数长度与平均播放量整体呈递增趋势。

A、从系统抓取标题中关键词层面来说

字数越多越有空间包含更多的关键词信息,从而使得系统识别更明晰更丰富,得以推荐更精准垂直的目标用户,获得更多的播放量。

若标题内可识别关键词信息过少或对应标签缺失,推荐系统只得无目标“试探性”推荐,无法保障推荐的用户垂直精准度,自然难以获得良性反馈。

B、从用户阅读标题时可接收到的内容信息量来说

字数越多越有空间将短视频内容表达完整及包装,起承转合,徐徐诱之,获得更多的播放量。


那么,哪些词能够get到用户的G点,使得用户在阅读标题的3秒内,获得百发百中的刺激反应呢?

我们将全部10166个参赛短视频的标题进行自然语言处理,提取高频词,再以平均播放量为基准进行排序整理。

最热名词:

绝活,解放军,结婚,农村,武器,美女,中国,舞蹈,真相,姿势,答案,秘密,做法;

最热动词:

吐槽,发现,盘点,曝光,揭秘;

最热形容词:

火爆,神秘,可怕,第一,厉害,奇葩;

最热副词:

终于,竟然;

最热连词:

结果;

互联网阅读场景下,标题的存在不再是传统意味上的“画龙点睛”。背负“诱发点击”功能的标题与其说是语言艺术,不如说是心理学艺术。

标题直接决定着用户是否会点击播放,观察了10166个参赛短视频中高播放量的短视频并结合上述词组,发现分段式结构的故事性标题更能完成“诱发点击”的任务。

最热副词:终于,竟然;使得标题内的关键元素形成冲突,

最热连词:结果的脱颖而出也验证着前因后果留悬念的句式更有内容性,剧情转折呈现力更强,冲击用户情绪。

参赛作品中电影解说内容短视频“宇哥讲电影”就深谙其道:


同一视频,“宇哥讲电影”在其他平台仍主打主流的《X分钟看完XXX》格式,在今日头条却定制了专属标题。

其对李安导演的《喜宴》解说短视频,标题起名为《亲友闹洞房时不知新娘新郎其实是假结婚,这下只能假戏真做了!》,轻松获得350万播放量。

并不推荐标题党或固定标题模型来突破播放量门槛,而是要在大量的观察和分析后,了解平台的用户接收习惯或文案取向风格来做突破,才是长久之道。

标题党或固定标题模型反而容易被平台以技术手段排查。

封面

用户浏览短视频的信息流页面时,平均停留时间很短暂,3秒钟的有效时间内,如何利用封面将用户的注意力锁定?得以被阅读标题,被播放?

我们通过对“金秒奖”第一季度全部10166个参赛短视频进行观察,发现高播放量短视频的封面制作规律:

NO.1、 封面与短视频内容的调性统一


内容调性,简单说就是潜在受众会喜爱的内容风格。喜爱看《乡村爱情故事》的观众与喜爱看《花样男子》的观众很难在审美层面达成一致。没有必要盲目跟随头部内容潮流,封面的色调,配色,设计只要坚持应和潜在受众即可。

NO.2、 画面清晰度高,定制尺寸,景别以中景,特写为主


头部内容每新发一个短视频,配合各个平台不同的封面展现要求会输出20张以上的封面图,来保证预期清晰度,画面不变形。同时,双封面要求下,会根据封面展现形势进行调整,重新设计。

除了向头部内容学习,还有一个很好的方法,学习平台上“广告”的封面图。广告投放的背后是高费用成本,人力成本与经验成本的结果,每张广告都有其借鉴价值和意义。

NO.3 、高亮核心重点,彰显戏剧张力


含有剧情的搞笑,情感,资讯等类目短视频,封面可采用短视频中最有戏剧张力单帧的截图,最夸张,最有表现力的表情或是容易误解(污解)的片段,人物间要有交流意味。

分类

我们将全部10166个参赛短视频进行分类并匹配各分类的平均播放量。又剔除了平均播放量不及10万的“冷门儿”分类。

除了传统的美食、时尚、生活方式等变现能力强的垂直领域,随着消费升级,受众对资讯专业度的需求快速提升,如金融,健康,教育等类别正处于爆发前夜。

在推荐系统中,因内容分类冷门儿导致潜在目标用户群过少而难以获得推荐量的情况不胜枚举。短视频项目冷启动阶段,锁定平台热门分类去输出内容的确会相对获得好成绩。

主流受众“把持”的推荐机制正是泛娱乐内容起量快的主要原因。

然而同样的,在推荐机制中,同类标签(垂直内容)的短视频作品互有助力,“抱团成长”。用户行为反馈的数据与收益,在不断唤起更细分内容的启动和专精。长尾效应下,越是大量级平台,垂直内容培育就越需要更多的时间,但前景必然一片大好。

另,单个账号专注单一垂直分类非常的重要。

系统在前期识别并确认账号的分类领域后,当该账号发布不属于已确认的分类领域的内容时,系统需要重新识别分类再进行推荐。

这导致会延长推荐启动时间,无法在规定时效内,推荐给绝对目标用户。自然难以拿到良好的【转化率】成绩。播放量也不会很理想。

就高播放量的参赛短视频作品进行观察,其主体账号分类非常统一,如有多个细分短视频栏目,采取的是注册多个账号来规避以上风险。

热度=用户反馈

让我们重温下推荐流程,短视频上传并审核后进入推荐系统,系统识别短视频内容的分类,标题等标签信息后试探性推荐给首批目标用户,根据用户反馈进行多批次推荐或停止推荐。

所谓的用户反馈即是决定【推荐量】的另一大板块——热度

用户反馈包括了评论、点赞、分享、播放完成度。

分享,评论,点赞


我们将全部10166个参赛短视频以播放量为基准进行区分,分为0-1万播放量,1-10万播放量,10万+播放量三个样本组。匹配相应的平均评论量,平均点赞量,平均分享量。

用户反馈行为与播放量呈正相关。

近期愈发多的短视频主感知在己身没有调整的情况下,同比16年推荐量变少.......是因为,很多短视频主未重视的“用户反馈行为数据”在推荐系统中的权重升高。

首先,算法机制平台多以资讯平台起家,在海量内容开荒收割用户市场时期,用户粘性通过资讯内容的“取之不竭”及高兴趣匹配度的识别手段来维系。

而内容平台阶段时期,整体战略及运营策略发生转变。

在内容提供方与平台处于卖方市场关系,在内容提供方需要更强的商业变现空间和机制,在用户停留几率取决于内容提供方等几点需求下,内容提供方与用户的强联系及机制必然需要建立。

这是趋势性问题,平台在其中也将所获颇丰。

此刻,今日头条客户端新版本的上线,正面表达了这一诉求:强化社交!

敲黑板,从今天开始注重粉丝运营,注重用户反馈,在发布简介信息及短视频中强调与用户互动。最基本的:

“如果喜欢,可以关注我或给我一个赞,有什么想告诉我的可以在下方评论哦~”

播放完成度


在视频分析页面,有播放完成度的统计功能

低于20%,20%-80%,高于80%的播放完成度三档对应的是三档不同等级的推荐量评估。同时,整体播放完成度的成绩也影响头条账号主体的评级。播放完成度与短视频时长,跳出率,观看进度都有相应的关系

我们仅就短视频时长来观察“金秒奖”第一季度全部10166个参赛短视频,



5分钟-6分钟时长的短视频平均播放量最高;

4分钟-5分钟时长的短视频平均播放量次之;

2分钟-3分钟时长的短视频意外处于第三序位。

数据结果供你参考,可以测试调整你的短视频时长来观察相应效果。

最佳发布时间

另,在短视频流程中,用户的及时反馈(点击播放,评论,分享,点赞)可以在有效时间内同比获得更多批次的推荐量。

这也是上文中提及不专注单一垂直分类的短视频账号所发布的内容无法在有效时间内获得保障推荐量的反面后果。

在短视频发布后的推荐时效——24小时内,获得推荐批次的多与少直接影响着播放量的成绩。

这也要求在短视频发布的时间点,用户能够快速反馈。

粉丝运营是一方面,用户活跃时间也是重要的影响因素。

为保障数据的有效性,在“金秒奖”第一季度全部10166个短视频外,我们额外抓取了今日头条上45万个短视频,将发布时间与平均播放量对比。



07:00,12:00,17:00 分别是一天中3个最佳发布时间。

观察数据趋势,与非算法机制平台发布最佳时间点对比有一定区别,

这源于发布后到达用户的流程不同,

非算法机制平台内容发布后直达关注粉丝,由粉丝选择点击阅读与否,阅读后同时段分享扩大覆盖面。

算法机制平台内容发布后则进入推荐系统进行首批目标用户反馈测试,再而多批次推荐,需要时间。

将数据中平均播放量所匹配的07:00,12:00,17:00最佳发布时间,与互联网用户客户端的活跃时间数据进行比照,

此数据结论的确留有着【推荐系统】反馈测试收集时间的余地。

上述便是【推荐量】的秘密,在透彻了解推荐流程后,逐一因素进行分析与调整就可使得你的推荐量足以与你的内容质量比肩!也许这才是真正的“不输在起跑线上”。

收藏

{{favCount}}

个人收藏

投稿请戳这里!投稿
0

次分享

文章评论(0)

{{ user.nickname }}
发表评论
登录 进行评论
加载更多 正在加载中... 没有更多了