黄聪:4.2、搜集引擎信息查询服务-中文自动摘要

在上一节的搜索引擎原理教程中,我们知道了搜索引擎是如何对用户的查询进行检索排序的,然而只是得到了文档列表还不能形成完整的结果页面,我们还需要对返回的排序列表的每一项进行中文自动摘要,本节黄聪就分析一下搜索引擎是如何实现这个技术的。

查看全文|视频教程|阅读(5,860)|2011年12月03日

黄聪:4.1、搜集引擎信息查询服务-网页信息检索

第二和第三章的教程中我们学习了搜索引擎原理网页搜集以及预处理的实现方法,在本章我们将一起研究搜索引擎的查询服务是如何实现的。

查看全文|视频教程|阅读(4,917)|2011年12月02日

黄聪:3.2.2、搜集信息的预处理-网页消重

搜索引擎原理上一节的《3.2.1、搜集信息的预处理–净化与数据提取》我们研究了搜索引擎是怎么进行网页正文的提取的,本文我们来看搜索引擎又是如何对重复的网页进行消重的呢。

查看全文|视频教程|阅读(3,615)|2011年12月02日

黄聪:3.2.1、搜集信息的预处理-净化与数据提取

搜索引擎原理上一节的《3.2、搜集信息的预处理–网页净化和消重》我们知道搜索引擎第一步要做的是网页分析,网页分析中又包括正文提取以及分词,中文分词技术已经在之前的课程中讲解过,就不再重复,本节主要是讲搜索引擎是如何进行正文提取的。

查看全文|视频教程|阅读(3,883)|2011年12月02日

黄聪:3.2、搜集信息的预处理-网页净化和消重

在上一节的《3.1.3、搜集信息的预处理–分析页面和建立倒排文件》中我们说过,搜索引擎在预处理的第一步就是要先进行网页的分析,本节将对这部分的内容进行展开。

查看全文|视频教程|阅读(4,166)|2011年12月01日

 < 1 2 3 ... 5 ... 9 >