今日头条曹欢欢:没有文本特征,内容推荐引擎

  今天曹欢欢头条新闻:没有文字功能,内容推荐引擎不能工作

  “在今天的头条新闻的前三年,我从用户那里收到的最大问题之一就是我给了我多少年的重复? 1月11日,今天的“让算法开放透明”来自中国科技大学的算法架构师,计算机科学博士曹欢欢发表了题为“使算法公开化,透明“在今天的总部,以消除来自社区的算法的一些误解,同时接受意见和建议。曹欢欢详细解释说:“每个人对重复的定义都是不同的。有人昨天看了一篇关于巴萨的文章,今天看了两篇,可能会觉得讨厌。但对于像巴塞罗那粉丝那样的重磅粉丝,可能不会等待所有的报道再次看到。要解决这个,其实需要提取精确的文字功能,比如哪篇文章说一个东西,哪篇文章基本一致等等。“曹欢欢强调,文字功能推荐独一无二的价值在于没有文字功能,推荐引擎不能工作的同时,文本特征的粒度越细,冷启动能力越强。从今天的标题推荐系统中提取的主要文本特征包括以下几类,首先是语义标签类别的特征,它们是由人们定义的明确标记的语义标签,每个标签具有明确的含义,标签系统是预定义的“曹欢欢说:”另外,还有隐含的语义特征,主要是话题特征和关键词特征,主题特征是对概率分布的描述,没有明确的含义,关键词特征是基于一些统一的功能描述,没有明确的设置。“分享后,曹欢欢回答了社区人士关于算法的问题,包括如何启动今天的冷启动,如何平衡广告和内容,以及如何准确地扩大用户兴趣图和其他实际项目的性问题。同时,我听取了大家对今日头条算法的意见和建议。算法原理一直属于公司的行业秘密,很少有公司会被公布。今天的头条新闻,算法是透明的,接受建议,属于行业首例,今天头条新闻,人造智能发展带来的挑战以前从未有人类遇到,随着业务的增长,是与业界共同思考和研究新技术带来的机遇和风险的责任和义务。