大时代之巅_第784章计算机学习

“12。”

“不对，是10。是5+5等于多少？”

“10。”

“对了。5+5等于多少？”

“10。”

“5+5等于多少？”

“10。”

沈向阳做出了这个解答，然后接结束了这个问题，“这就是机器学习的逻辑。当然不是算术了，而是计算用户对广告或者内容的喜好度。其实针对广告的个性化投放，不能根据广告本身，而是根据内容。朋友网的个性化广告我看了，主要就是根据用户的个人信息，这略显粗糙，准确率也不高。”

“那应该怎么做？”

“通过机器学习，把广告和内容捆绑。比如阅读内容A的用户，都喜欢广告A，两者就可以对接了。这个比较简单。更复杂的是内容投放，要结合统计学习和神经网络，通过机器学习，让计算机学习用户的阅读习惯。就像刚才的算术题一样，一开始，错误率比较大，越是学习，错误率就越小，就越贴近正确答案，即用户的阅读习惯。”

周不器不太服气，透露了点小秘密，“朋友网的个性化广告分发算法，是Facebook做出来的呢！嗯，我们是合作伙伴。”

“这样啊……”沈向阳笑了笑，“Facebook的技术也不怎么样。”

“呃……”

口气真大！

好吧，这哥们的确够资格讽刺Facebook技术差。

周不器接着说：“还有一个项目，我们都做了半年了，一点头绪都没有，我们派出了一个很厉害的技术大牛，叫徐铭，他也没办法。他本来是搜索事业群的技术总监，不过项目没进展，接下来就把他调进研究院，你来带吧。”

“什么项目？”

“智能搜索，个性化搜索，千人千页。”

其实就跟个性化内容推荐差不多，不同的是，这次是针对搜索结果的个性化推荐。

沈向阳脸色就凝重起来，“这可难多了！比那个朋友网的个性化广告，今日头条的个性化内容都难。”

“是吗？不都是个性化推荐吗？”

“级别不一样。”

“嗯？”

沈向阳解释道：“技术难题往往是两点，一类是复杂度，一类是规模量。比如Photoshop、MATLAB这种工程软件，就是太复杂了，我们国内做不出来。规模量指的是数据多少。一个算法，处理小数据时可能很奏效。可是涉及到大规模数据，算法就失效了。就像手工制作和机械化批量生产一样，没有可比性。”

周不器点了点头，“嗯，大数据。”

沈向阳道：“大数据算法是一套，个性化算法是一套，大数据下的个性化算法，又是另外一套。这并不是简单的1+1=2的关系，需要从算法框架方面有更优化的设计。智能搜索这个概念前两年就提过了，可是做不到。”

现在，全世界连大数据都没搞明白呢，对大数据下的衍生算法，更是想都别想。

这么一看，还是老沈技术更高、视野更广、认知更清楚啊！

智能搜索这个项目，是许亮杰、程秉皓、王小船和徐铭共同决定的，觉得这个方向大有可为。可沈向阳却给否了，说做不到。

嗯，一家公司，肯定是技术最好的人当首席技术官。

老沈实至名归啊！