<?xml version="1.0" encoding="utf-8"?><feed xmlns="http://www.w3.org/2005/Atom"><title type="text">博客园_Yin.P.Cube_分类_搜索技术</title><id>http://feed.cnblogs.com/blog/u/48388/category/195725/rss</id><updated>2012-05-28T13:41:21Z</updated><generator>feed.cnblogs.com</generator><link rel="alternate" type="text/html" href="http://www.cnblogs.com/SmartBizSoft/category/195725.html"/><link rel="self" type="application/atom+xml" href="http://feed.cnblogs.com/blog/u/48388/category/195725/rss"/><entry><id>http://www.cnblogs.com/SmartBizSoft/archive/2009/10/08/1578942.html</id><title type="text">Searcharoo源码学习日志（二）</title><summary type="text">Searcharoo第二版相对第一版做了很多改动，如将之前的基于当前站点的文件索引换成了基于Internet的网络爬行器、新增了HtmlDocument对象作为中间文档对象用于暂存文档信息、增加对已访问页面的判断处理、新增使用HttpWebRequest对象去获取Internet文档内容、新增去除页面内容中的脚本块样式块等功能。</summary><published>2009-10-07T18:19:00Z</published><updated>2009-10-07T18:19:00Z</updated><author><name>Yin.P</name><uri>http://www.cnblogs.com/SmartBizSoft/</uri></author><link rel="alternate" href="http://www.cnblogs.com/SmartBizSoft/archive/2009/10/08/1578942.html"/><link rel="alternate" type="text/html" href="http://www.cnblogs.com/SmartBizSoft/archive/2009/10/08/1578942.html"/><content type="text">Searcharoo第二版相对第一版做了很多改动，如将之前的基于当前站点的文件索引换成了基于Internet的网络爬行器、新增了HtmlDocument对象作为中间文档对象用于暂存文档信息、增加对已访问页面的判断处理、新增使用HttpWebRequest对象去获取Internet文档内容、新增去除页面内容中的脚本块样式块等功能。</content></entry><entry><id>http://www.cnblogs.com/SmartBizSoft/archive/2009/10/06/1578543.html</id><title type="text">Searcharoo源码学习日志（一）</title><summary type="text">Searcharoo源码学习系列文章将会对这套开源搜索引擎的各个版本（主要是前几个版本，因为关于搜索技术的变化更新主要体现在前几个版本，后面的版本主要是一些扩展和展现方式的改进）源代码进行简单的介绍，包括组成这个搜索引擎的各部分及其在各版本中的发展过程。从上一篇文章中我们可以大概了解到Searcharoo是一套比较简单且易于上手学习的搜索引擎开源项目。从这篇文章开始我们就要从细节来学习这套搜索引擎源代码。</summary><published>2009-10-06T10:10:00Z</published><updated>2009-10-06T10:10:00Z</updated><author><name>Yin.P</name><uri>http://www.cnblogs.com/SmartBizSoft/</uri></author><link rel="alternate" href="http://www.cnblogs.com/SmartBizSoft/archive/2009/10/06/1578543.html"/><link rel="alternate" type="text/html" href="http://www.cnblogs.com/SmartBizSoft/archive/2009/10/06/1578543.html"/><content type="text">Searcharoo源码学习系列文章将会对这套开源搜索引擎的各个版本（主要是前几个版本，因为关于搜索技术的变化更新主要体现在前几个版本，后面的版本主要是一些扩展和展现方式的改进）源代码进行简单的介绍，包括组成这个搜索引擎的各部分及其在各版本中的发展过程。从上一篇文章中我们可以大概了解到Searcharoo是一套比较简单且易于上手学习的搜索引擎开源项目。从这篇文章开始我们就要从细节来学习这套搜索引擎源代码。</content></entry><entry><id>http://www.cnblogs.com/SmartBizSoft/archive/2009/09/29/1576626.html</id><title type="text">Searcharoo —— 一个适合学习研究的搜索引擎项目</title><summary type="text">这次我要介绍一套开源的搜索引擎项目，名字为Searcharoo，这个项目来自CodeProject，同时也有自己的一个网站（http://www.searcharoo.net/），在网站中可以下载其源码也可以看到每个版本间演化的详细介绍。这套搜索引擎不像Lucene和Nutch那样复杂，代码少很多，因此我认为它非常适合用于初学搜索技术。</summary><published>2009-09-29T13:49:00Z</published><updated>2009-09-29T13:49:00Z</updated><author><name>Yin.P</name><uri>http://www.cnblogs.com/SmartBizSoft/</uri></author><link rel="alternate" href="http://www.cnblogs.com/SmartBizSoft/archive/2009/09/29/1576626.html"/><link rel="alternate" type="text/html" href="http://www.cnblogs.com/SmartBizSoft/archive/2009/09/29/1576626.html"/><content type="text">这次我要介绍一套开源的搜索引擎项目，名字为Searcharoo，这个项目来自CodeProject，同时也有自己的一个网站（http://www.searcharoo.net/），在网站中可以下载其源码也可以看到每个版本间演化的详细介绍。这套搜索引擎不像Lucene和Nutch那样复杂，代码少很多，因此我认为它非常适合用于初学搜索技术。</content></entry><entry><id>http://www.cnblogs.com/SmartBizSoft/archive/2009/06/16/1503938.html</id><title type="text">基于Lucene.NET的文件搜索工具</title><summary type="text">本文要介绍的是利用Lucene.NET写的一个简单的文档搜索器。实现最基本的索引和搜索功能。编写这个小工具的初衷之一是因为我收集的专业资料文档越来越多，有时想要在计算机中找到自己想要的文档却不知道自己之前把那些资料放到了什么地方，而且现在的硬盘越来越大，目录结构也越来越复杂，常常要花很多时间去查找自己想要的资料。有了这个搜索工具，只要定期重新建立索引，就可以方便快速地找到自己想要的东西，其次是因为正好这段时间想花时间了解一下Lucene.NET这个开源库学习一下搜索引擎的原理</summary><published>2009-06-15T16:34:00Z</published><updated>2009-06-15T16:34:00Z</updated><author><name>Yin.P</name><uri>http://www.cnblogs.com/SmartBizSoft/</uri></author><link rel="alternate" href="http://www.cnblogs.com/SmartBizSoft/archive/2009/06/16/1503938.html"/><link rel="alternate" type="text/html" href="http://www.cnblogs.com/SmartBizSoft/archive/2009/06/16/1503938.html"/><content type="text">本文要介绍的是利用Lucene.NET写的一个简单的文档搜索器。实现最基本的索引和搜索功能。编写这个小工具的初衷之一是因为我收集的专业资料文档越来越多，有时想要在计算机中找到自己想要的文档却不知道自己之前把那些资料放到了什么地方，而且现在的硬盘越来越大，目录结构也越来越复杂，常常要花很多时间去查找自己想要的资料。有了这个搜索工具，只要定期重新建立索引，就可以方便快速地找到自己想要的东西，其次是因为正好这段时间想花时间了解一下Lucene.NET这个开源库学习一下搜索引擎的原理</content></entry></feed>
