一来,好东西不要一次性拿出来。
一点一点的往外抛,才让对手始终难以追赶。
要知道,国外的维基百科,也要等到明年才会出现。
二来,隋波也希望借此让俞军独立思考,尽快的成长起来。
王川也完成了对新闻搜索、图片搜索、mp3搜索三个功能性产品的技术设计。
在新闻搜索上,王川尝试了一种“相似度识别”技术。
通过这种技术,即使两篇新闻的标题和头尾略有不同,但只要正文的内容相似度达到某个级别,就能被百度搜索的技术识别并归并。
这样,如果网上的新闻有上百篇内容相似的文章,在百度的新闻搜索中,就只显示一篇。
而搜索结果的标准,是用户点击量、内容全面性等指标。
至于图片搜索,一方面来自于新闻图片,因为大部分网上的新闻文章都配有图片。
另外就是一些非新闻类图片。
这主要是从众多的小网站中抓取的,包括壁纸、美女写真等。
在数据库的图片存储上,王川借鉴了电商平台新研发的efs(eabsp;file system)技术,极大的缓解了数据库的读取压力。
再加上技术和负载均衡等系统,也保证了用户在带宽较差的情况下,打开图片的速度和体验。
mp3搜索方面,王川和俞军有过一次争论。
王川认为,用户搜索
本章还未完,请点击下一页继续阅读>>>