搜索引擎(中国香港)
Internet网是一个庞大丰富的信息资源库,但在这个资源库里手工寻找某类信息如同大海捞针。为此,科信软件公司开发了“中文网页搜索引擎”。 “中文网页搜索引擎” 主要应用于中文信息网站,是一种高性能、高效率的网页搜索引擎。该系统包括两个部分:网页资源索引,网页资源检索。网页资源索引部分运用机器人技术遍历 Internet,自动收集中文网页资源,将其分类,存放于系统数据库中。网页资源检索部分向用户提供简单检索、复杂检索和主题目录检索等多种检索方式; 能完成模糊匹配、检索结果集中再检索等复杂搜索技术。
1. “网页资源索引”部分所具功能 :
●支持多种中文字符集,同时支持GB2312,HZ,UTF-8,BIG5等多种中文字符集。
●从初始IP开始自动遍历Internet.
●高度的网页索引率,用户可以提交用户的URL到系统数据库中。
●支持对违禁网站的屏蔽。
●先进的中文文本单词分割技术。
●准确的主题辩识能力。
●完善的数据库维护功能,数据库中不包含冗余数据。
●提供完善的主题目录维护工具。
2. “网页资源检索”部分所具功能 :
●支持简单检索,复杂检索,检索结果集中再检索等检索功能。
●支持完全一致检索,模糊匹配检索等检索功能。
●支持通配符。
●支持与,或,非3中布尔检索条件。
●支持主题目录检索
3.产品性能:
●高度可移植性
本系统为实现可移植性,利用Java语言开发。在Java语言的支持下,实现了独立于操作系统的高可移植性,使得本系统可不加修改运行于NT或Unix系统上。
● 高服务效率
本系统利用了当前世界最先进的Servlet技术,实现多线程并发,使系统的运行效率大大高于CGI等多进程并发技术。
● 高数据库访问效率
数据库访问采取了链接池技术,使每一个服务请求提交给Web服务器之后,不需专门来建立与数据库的链接,从链接池中取来一个已准备好的链接即可安全使用。
● 系统资源的高利用率
Servlet是基于多线程并发的应用服务器技术,相较多进程并发的技术,对系统的资源消耗小,可充分利用已有的硬件资源。
● 广泛的数据库服务平台
使用Oracle数据库,可广泛应用于各种硬件平台,从PC到高端服务器,都能使应用数据库高效率的运作。