字:
关灯 护眼
沧桑文学 > 重生87:开局截胡港岛女神 > 第1745章 一句话点醒了贾瀞雯

第1745章 一句话点醒了贾瀞雯

    第1745章 一句话点醒了贾瀞雯 (第1/3页)

    办公室里安静得能听见服务器风扇转动的声音。

    李明盯着屏幕,右手放在鼠标上。

    他点了一下,屏幕中央的小沙漏开始转。

    一秒,两秒,三秒……十秒过去了。

    屏幕终于刷新,显示出一列结果。

    “还是慢。”他叹了口气。

    贾瀞雯站在他身后,看着那些搜索结果。

    李明刚才输入的是“电脑价格”,出来的结果有七八条,但只有两条真正和电脑价格有关。

    一条是电脑公司的介绍,另一条是去年的旧新闻。

    剩下的,有一条是“电影《电脑奇侠》”,还有几条是其他完全不相关的内容。

    “准确率多少?”贾瀞雯问。

    张涛在另一台电脑前算了一下:“刚测了五十个关键词,只有十五个返回了有用结果。

    准确率……百分之三十左右。”

    会议室里一片沉默。

    五个年轻人都在,脸上的表情都差不多——疲惫,还有点沮丧。

    他们已经连续工作了两个月,做出了这个能跑起来的搜索引擎。

    可效果实在不理想。

    “速度呢?”贾瀞雯又问。

    “平均响应时间十二秒。”王磊说,“最慢的一次等了半分钟。

    这还只是在我们内网测试,如果放到真实的网络上,有延迟,有带宽限制,可能更慢。”

    贾瀞雯点点头。

    她走到白板前,看着上面密密麻麻的架构图。

    爬虫、索引、分词、排序……每个模块都做了,每个模块都能工作,可组合起来就是这个结果。

    “问题出在哪儿?”她问。

    李明站起来,走到白板前:“首先是索引结构。

    我们现在用的是最简单的倒排索引,但数据量一大,查询效率就低。

    需要优化数据结构。”

    张涛补充:“分词也有问题。

    基于词典的方法太死板,很多新词、专业词切分不准。

    比如‘奔腾处理器’,我们的词典里没有这个词,就切成‘奔腾’和‘处理器’,但用户可能搜‘奔腾处理器’整个词。”

    “排名算法也不够聪明。”王磊说,“现在基本是按关键词出现次数排序,但这样很容易被垃圾页面钻空子。

    一个页面堆满关键词,就能排到前面,可内容根本没价值。”

    贾瀞雯听着,一条条记在本子上。

    她知道这些技

    (本章未完,请点击下一页继续阅读)
『加入书签,方便阅读』