谙前码后
用,写,迭代。爬虫不看样式。
首页
摘录
搜索
来源:热榜
2025-05-29
来源:微博
2025-05-21
来源:热榜
2025-04-21
来源:主页 / X
2025-04-18
畏惧感源于缺乏经验,而非缺乏能力
勇于尝试足以驱除这种恐惧感
by: Sahil Bloom
来源:主页 / X
2025-04-16
别人眼里的幸福不会是你自己的幸福,埋在自己心里不愿说出的害羞的满足才是自己真正的幸福。
——维多利亚·希斯洛普《岛》
来源:X 上的 曾老师:““不要同情弱者,弱者不一定是好人,弱者其实都很蠢,对帮过他的人,恩将仇报;对唤醒他的人,充满敌意。对有钱有势的人,倒头就拜;对画饼的人,感恩戴德。 ” ——刘震云” / X
2025-04-15
“不要同情弱者,弱者不一定是好人,弱者其实都很蠢,对帮过他的人,恩将仇报;对唤醒他的人,充满敌意。对有钱有势的人,倒头就拜;对画饼的人,感恩戴德。 ”
——刘震云
来源:微博
2025-03-31
来源:抖音首次公开推荐算法原理 - IT之家
2025-03-31
一条视频从海量信息中被选中,推送给用户,一般要经过进入内容池、召回、排序三个环节。用户发布的新视频首先要经过初步评估进入内容池,然后进入召回环节,其作用是从海量的内容池中,初步快速粗筛出一大批用户可能感兴趣的内容。
举例来说,召回环节需要用到召回模型,抖音最常用的召回模型是“双塔召回模型”(Two-Tower Retrieval Model)。双塔召回模型把用户和内容都转化为数学空间里的一个个点,就像是给用户和内容贴上了独特的“数字标签”,这个过程叫做向量化表征学习。其大概过程如下:
(1)分别将用户特征、内容特征进行数学转化(如展示小猫的视频为 0,展示小狗的视频为 1,短视频为 0,长视频为 1,那么一个展示小猫的长视频即(0,1),其实际长度取决于特征有多少维度,用户特征同理);
(2)将转化后的数学特征输入到用户塔、内容塔两个深度学习模型中,经过训练,各自形成一组新的数字集合,这叫做用户表征和内容表征。在这一步,原本各自代表一个现实特征的数字不再具备任何实际语义,两个模型会把用户特征和内容特征都转化为没有现实意义的数字代码 —— 因此,算法不用理解现实语义,只需处理纯粹的数学符号;
(3)将两组形式为纯粹的数字集合的用户表征和内容表征,放入同一个向量空间中,每一组数字集合便在向量空间中拥有了一组专属的向量值,好比一组独有的“数字指纹”;
(4)将训练过的所有内容表征的向量值和当前用户表征的向量值的距离进行对比,距离越接近代表用户越喜欢。当你的“数字指纹”和某个视频的“数字指纹”在坐标系里刚好比较“匹配”(距离近),算法就会推荐它。
抖音推荐算法简述
来源:热榜
2025-03-27
来源:热榜
2025-03-24
第1页 共40页
下一页