黄聪:2.2、页面搜集原理、技术和系统-搜集过程


了解了一些页面搜集的基础知识后,我们来看看搜索引擎搜集一个页面的整个过程是怎么进行的。

查看全文|视频教程|阅读(5,524)|2011年11月28日

黄聪:2.1、页面搜集原理、技术和系统-基础知识

在上一章的《1.1.5、搜索引擎工作原理–体系结构》中我们了解了搜索引擎的体系结构,而搜索引擎最开始要做的就是互联网页面的搜集,在本章中,黄聪会和大家一起探讨页面搜集的原理、技巧和系统。

查看全文|视频教程|阅读(4,335)|2011年11月27日

黄聪:1.1.5、搜索引擎工作原理-体系结构

今天黄聪要和大家分享的是搜索引擎的体系结构,搜索引擎是一个很庞大的系统,由许多的部分组成,按模块来分的话,可以分成蜘蛛、调度器、网页数据库、网页分析模块、索引器等等,按过程来分的话可以分为网页搜集、预处理、查询服务。那么这个系统的结构是什么样的呢?本节黄聪可以给大家一点介绍

查看全文|视频教程|阅读(7,659)|2011年11月27日

黄聪:1.1.4、搜索引擎工作原理-查询服务基础简介

《1.1.3、搜索引擎工作原理–预处理基础简介》中介绍了搜索引擎会为每个网页进行预处理,以最好的结构保存在数据库中,为三段式工作流程中的查询服务打下基础,那么在本节就介绍一下搜索引擎查询服务的基础简介。

查看全文|视频教程|阅读(4,023)|2011年11月27日

黄聪:1.1.3、搜索引擎工作原理-预处理基础简介

在上一节《1.1.2、搜索引擎工作原理–网页搜索基础简介》我们知道搜索引擎会有一定的策略从网络上搜集回网页,然而这些刚搜集回来的网页是没有办法直接投入使用的,搜索引擎还需要对这些网页进行一定的预处理,才能为之后的查询服务打好基础。本节将对预处理做一个简单的介绍。

查看全文|视频教程|阅读(4,351)|2011年11月26日

 < 1 2 3 ... 7 8 9 >