搜索和推荐
搜索引擎分为两部分:
离线专注从网站抓内容并建立不同的索引体系
基于关键词,每一个关键词对应一长串提及该关键词的内容,比如“教育“命中内容1,2,3;“NBA“命中内容1,2,4
关于索引:对信息的不同理解维度进行处理,如话题,类目,实体词等
用户搜索关键词,系统进行分词、变换、扩充、纠错(如NB2K --> NBA2K)等处理
在线部分响应搜索请求,完成内容的筛选和排序
召回-->排序-->干预(如插入官方网站到文章10和1之前)
排序例子:按照特定预估目标(如点击导向,互动导向,停留时长导向等)对候选集统一排序,经过规则层处理后反馈给用户
用户的点击反馈会影响排序环节的模型
传播度(累计阅读和播放)
本文内容是对《内容算法》的学习总结,作者是之前今日头条的工程师/产品经理的闫泽华。闫泽华对于内容,平台,用户,自媒体感觉确实是玩明白了。对于这本书,是值得认真吸收其经验的。 以上总结了推荐系统的信息,推荐系统的协同过滤,用户画像的建立,内容的冷启动和生命。此后作者还讨论了编辑分发,算法分发,社交分发,业务场景,数据驱动产品优化,还有具体视角的自媒体运营。打算过两天再写一篇学习笔记。
code/s?__biz=MzkzMDE5NjU2OQ==&mid=2247483768&idx=1&sn=0c6fb023f9be2e9e6f46e5fe1b50ff2a&chksm=c27cbc4ef50b355845af705e5b28eddda536f7ad59223e8858bc8599c36e9f6bca00547c8c80#rd