行为数据匹配相似用户,如亚马逊早期推荐逻辑的“协同过滤”技术。
到2000年后基于文本、图像等内容特征推荐,如早期新闻聚合平台的“内容推荐”。
再到2010年后神经网络模型提升复杂特征处理能力,如google的深度神经网络广告推荐的“深度学习”。
如此抖音在继承传统推荐技术的基础上,结合移动互联网特点,最终实现了三点创新。
“王董,您看,这就是我们目前在原有推荐算法上的三个新改良。
首先是这个‘实时反馈机制’,它可以通过收集到的用户滑动、停留、点赞等行为数据,运用深度学习算法和实时反馈算法,毫秒级更新形成针对用户个人的推荐模型,点对点绘制‘动态兴趣图谱’。
如此就能精准捕捉用户兴趣,实现“千人千面”的内容分发。
然后是在这个‘多模态融合’,它可以将视频的视觉、听觉(音乐)、文本(字幕)等特征全方位整合,突破单一维度推荐的局限性。
还有这个‘冷启动优化’,按照王董您当初在项目开发初期要求的‘技术普惠’产品哲学,为了达成‘让普通人的内容也能被看见’的理念,我们专门调整了算法的公平性设计,建立起‘公域流量池’机制。
通过这种机制,“种子用户”的行为数据可以快速为新内容/账号定位受众,让新创作者和优质内容能够更容易突破圈层,便能解决传统推荐系统中的冷启动难题……”
抖音开发团队的负责人滔滔不绝地向王皓以及集团高层管理者介绍着有关于软件的各种信息,王皓在一旁也是听得频频点头。
至少目前来看,星河集团开发的抖音,和他前世的那款抖音,区别并不大,都是利用高效的内容匹配机制和高准确度的推荐算法提升用户粘性和留存率,形成软件运行中“内容-用户-流量”的正向循环。
甚至得益于星河集团本身强大的经济与技术实力,这次他们开发抖音算法的过程中,不仅有着庞大的工程师团队,还有业内顶尖的算法科学家与架构师一同协作。
有了他们的存在,星河集团这一版的抖音,实际上已经是极其成熟的产品,几乎有着原时空2018版抖音90%的完成度。
“目前我们的软件已经完成了大范围内测,也发现并解决了运行中的各种bug。
后续我们团队要做的,一个是软件正式上线后,继续根据运营情况进行算法优化。
这方面我们也有了几个目标,一个是开发基于注意力机制的排序模型,可以用于提升用户兴趣预测精度。
另一个是引入强化学习(rl),实现‘探索-利用’平衡,在满足用户已知兴趣的同时,推送多元化内容。
当然了,我对我们的抖音也很有信心,相信在很短的时间内,它就能取得极好的成绩。
所以如何支撑千万级甚至是亿级日活用户的实时计算,解决分布式计算、模型压缩等工程难题,也是接下来需要我们所攻克的。”
哗啦啦!
当抖音开发团队的技术负责人介绍完有关于这个软件的内容后,王皓带头鼓起了掌,然后给予了那些团队开发