第68章 时间杀手&多维数据+算法碾压!(求追读!Orz~)(2/2)
男生兴趣標籤选择音乐、篮球、数码、游戏,地理位置选择深市南山区。
註册完成,张智东將两个帐號的首页,一左一右投屏在屏幕之上,翻看“新鲜事”版块中的內容。
几人惊讶的发现,两个帐號主页推送的信息差异极大。
差不多有近半信息,跟之前选择的兴趣標籤相关,剩下的则是当前热点新闻资讯。
將三人的表情尽收眼底,张智东解释道:“其实,在转型开放平台之前,校內网就已经在试运行这种个性化推送算法,只不过还不像现在这么精准。”
“我们的研发部门,也已经在攻关了,只不过暂时还没有太大的收穫。”
“而这次更新之后,这套算法发生了质变,极光科技似乎在其中引入了注意力机制,会动態分配不同用户行为的权重,並实时更新推荐结果。”
张智东边说边演示,在男生帐號多次搜索“考研资料”,並对搜索到的內容点讚、评论。
女生帐號则是搜索“瑜伽”,进行相同的操作。
隨后返回首页,继续翻看“新鲜事”。
差不多五分钟过后,小马哥三人眼中的疑惑,逐渐变为惊讶,然后是震惊。
因为男生帐號的首页,竟然出现了教育类內容,其中有一条还是深市大学的讲座信息。
而这位男生选择的地理位置,正是深市!
女生的帐號,则是推送了瑜伽、健身等相关信息。
看著屏幕中的那位,脸型很像“嫩牛五方”的不知名女明星的健身自拍照,前不算禿后很翘,小马哥却完全无心观赏,一拍桌子。
“马上跟进!”
这种內容推荐算法,简直就是“用户时间杀手”!
他甚至都生出了一种,以这套算法为核心,把qq门户彻底改头换面的想法。
再换个角度,如果把这套算法,用在gg精准推送上呢?
那gg费不得直接起飞嘍!
刘驰平也想到了这点,心头有些火热:“研发部那边进展怎么样,需要多久能攻破这套算法?”
“半年,一年,或者两年。”张智东也给不出准確的时间,但不妨碍他先浇灭他们急功近利的幻想。
首先是技术难度。
目前,行业內主流的推荐模型是“协同过滤”,每日离线计算,次日更新推荐內容。
企鹅也是如此。
而极光科技的推荐模型,是基於注意力机制的混合模型,並且可进行动態行为捕捉,五分钟內更新推荐结果。
之前谁也没见过这么离谱的推荐模型,极光科技还採取了加密、混淆等多种技术手段,保护算法的核心逻辑,完全无法窥探算法全貌。
並且,想都不用想,极光科技绝对申请了专利。
光是技术摸索,就不知要耗去多少时间。
另一方面,则是数据维度的差距。
极光科技手上掌握著2000+標籤的用户信息,覆盖消费、学习、社交等诸多场景,並且有著极强的数据处理能力。
甚至还可以借用交大的超算。
也因此,极光科技可以十分高效的验证、训练模型。
而他们企鹅手上,只掌握著100+標籤的用户信息。
由於匿名的关係,即便他们能仿照对方的数据採集维度,也无法保障信息的真实性。
这代表著,他们不仅训练模型的难度更高,技术水平相等的情况下,推荐的准確性也必然不如对方。
很无奈,但这却是现实。
他们被极光科技以多维数据+算法碾压了。。