第784章 计算机学习

大时代之巅 荒野悲歌 1871 字 2个月前

“12。”

“不对,是10。是5+5等于多少?”

“10。”

“对了。5+5等于多少?”

“10。”

“5+5等于多少?”

“10。”

沈向阳做出了这个解答,然后接结束了这个问题,“这就是机器学习的逻辑。当然不是算术了,而是计算用户对广告或者内容的喜好度。其实针对广告的个性化投放,不能根据广告本身,而是根据内容。朋友网的个性化广告我看了,主要就是根据用户的个人信息,这略显粗糙,准确率也不高。”

“那应该怎么做?”

“通过机器学习,把广告和内容捆绑。比如阅读内容A的用户,都喜欢广告A,两者就可以对接了。这个比较简单。更复杂的是内容投放,要结合统计学习和神经网络,通过机器学习,让计算机学习用户的阅读习惯。就像刚才的算术题一样,一开始,错误率比较大,越是学习,错误率就越小,就越贴近正确答案,即用户的阅读习惯。”

周不器不太服气,透露了点小秘密,“朋友网的个性化广告分发算法,是Facebook做出来的呢!嗯,我们是合作伙伴。”

“这样啊……”沈向阳笑了笑,“Facebook的技术也不怎么样。”

“呃……”

口气真大!

好吧,这哥们的确够资格讽刺Facebook技术差。

周不器接着说:“还有一个项目,我们都做了半年了,一点头绪都没有,我们派出了一个很厉害的技术大牛,叫徐铭,他也没办法。他本来是搜索事业群的技术总监,不过项目没进展,接下来就把他调进研究院,你来带吧。”

“什么项目?”

“智能搜索,个性化搜索,千人千页。”

其实就跟个性化内容推荐差不多,不同的是,这次是针对搜索结果的个性化推荐。

沈向阳脸色就凝重起来,“这可难多了!比那个朋友网的个性化广告,今日头条的个性化内容都难。”

“是吗?不都是个性化推荐吗?”

“级别不一样。”

“嗯?”

沈向阳解释道:“技术难题往往是两点,一类是复杂度,一类是规模量。比如Photoshop、MATLAB这种工程软件,就是太复杂了,我们国内做不出来。规模量指的是数据多少。一个算法,处理小数据时可能很奏效。可是涉及到大规模数据,算法就失效了。就像手工制作和机械化批量生产一样,没有可比性。”

周不器点了点头,“嗯,大数据。”

沈向阳道:“大数据算法是一套,个性化算法是一套,大数据下的个性化算法,又是另外一套。这并不是简单的1+1=2的关系,需要从算法框架方面有更优化的设计。智能搜索这个概念前两年就提过了,可是做不到。”

现在,全世界连大数据都没搞明白呢,对大数据下的衍生算法,更是想都别想。

这么一看,还是老沈技术更高、视野更广、认知更清楚啊!

智能搜索这个项目,是许亮杰、程秉皓、王小船和徐铭共同决定的,觉得这个方向大有可为。可沈向阳却给否了,说做不到。

嗯,一家公司,肯定是技术最好的人当首席技术官。

老沈实至名归啊!