傅南笙站起来之后,会议室里的议论声立刻就停了下来,听到后面的话,大家心里不禁又浮现出了自家小袁总往年的各种新奇的想法。
在座的都是乐家科技的中高层管理层,绝大多数都已经在公司工作了三年以上了,对于自家小袁总前些年的那些天马行空甚至是匪夷所思的想法,事后都基本上被证明是对的。
现在,袁总又提出了一个新的想法,一个新的产品,难道说,我们辣个熟悉的男人,他,又要回来了?
会议结束之后的第二天,乐家科技“微影项目组”正式成立。
单单就产品的技术开发和架构搭建本身来说并不复杂,这其中需要开发人员和产品经理投入精力最多的,一是新项目与乐家科技目前已有的产品之间的互联互通问题。
哪些产品可以进行互联互通,互联互通的形式又应该怎么定义,交互的场景是否需要过渡,等等等等。
二来就是袁总重点提到的那个“方法”了,利用大数据对不同用户的浏览喜好进行定义,利用算法进行挑选,推送对方喜欢的内容。
本小章还未完,请点击下一页继续阅读后面精彩内容!
这种算法,目前在业内做的最为成熟的就是每日头条了,作为对方的投资人,袁旭自然知道,这也是对方的核心机密,自然不可能向微影项目组透露。
当然,天下不止一个张屠户。
DD搜索作为目前华夏第二大搜索引擎,其研发中心中自然也有负责搜索和推荐算法以及系统架构等后端技术研发的工程师。
自家公司,一纸调令,DD技术产品研发中心系统开发一部的负责人赵睿就摇身一变成为了微影项目组技术和后台总负责人。
事实上,看似“神秘”的所谓“算法”,其架构搭建的速度,远比想象中要快。
不过才半个月的时间,赵睿已经带领团队将内容分发的模型开发出来了。
袁旭听闻,小小的吃了一惊,作为一名技术外行,对于确切的产品参数,袁旭并不怎么懂,他只知道,上辈子看到过不少的“事后诸葛亮”的分析,认为字母乱跳公司,之所以能成功的在大厂们的环绕之下杀出重围,最重要的就是手里握着的那听上去很是神秘的“机器算法”。
这种类似于屠龙宝刀一般的利器,自己公司随便来个人,十来天的时间就搞定了?
这怕不是来忽悠我的吧?
袁旭第一时间就让赵睿带着项目组的技术团队到自己办公室来汇报情况。
“袁总,我们所说的算法模型,其实就是一个推荐系统,确切的说,应该是一个内容推荐系统。”
“具体的说,这个内容推荐系统,就是一个让用户对分发内容感到满意的函数。”
“这个函数中包含三个维度的变量。”
“第一是内容,无论是图片、文字还是视频,每种内容都有自己的很多的特征,需要考虑怎样提取不同内容类型的特征以便做好推荐。”
“第二是用户特征,包括各种兴趣标签,职业、年龄、性别等,还有很多模型刻划出的隐式用户兴趣等。”
“第三是环境特征。这是移动互联网时代推荐的特点,用户随时随地移动,在工作场合、通勤、旅游等不同的场景,信息偏好有所偏移。”
“这三个维度下,就构成了一个基本的推荐模型。”
“当然,一个优秀的工业级推荐系统需要非常灵活的算法实验平台,可以支持多种算法组合,包括模型结构调整,因为很难有一套通用的模型架构适用于所有的推荐场景。”
“我们的模型,采用的是LR和GBDT算法做结合,这样,一个标准的推荐模型就完整的建立起来了。”
“模型建立完毕后,我们还需要对其进行训练,模型的训练上,我们建议采用实时训练,实时训练省资源并且反馈快,这对信息流产品非常重要,用户需要行为信息可以被模型快速捕捉并反馈至下一刷的推荐效果。”
“我们目前计划采用基于storm集群实时处理样本数据,包括点击、展现、收藏、分享等动作类型。”
“整体的训练过程是线上服务器记录实时特征,导入到Kafka文件队列中,然后进一步导入Storm集群消费Kafka数据,客户端回传推荐的label构造训练样本,随后根据最新样本进行在线训练更新模型参数,最终线上模型得到更新。这个过程中主要的延迟在用户的动作反馈延时,因为模型推荐后用户不一定马上看,不考虑这部分时间,整个系统是几乎实时的。”
“当然,这会产生非常庞大的信息数据,我们需要对目前的系统底层做一定的优化,完善运维工具。”
赵睿对着自己做的一份界面很是简陋的演示文件,对着袁旭和宋瑞一众人一顿输出。
袁旭的感觉,嗯,听不懂,但是看上去,好像挺像那么一回事的,逻辑能够自洽。