首页 | 政府动态 | 高层论坛 | 发展与规划 | 国际参考 | 政策法规 | 国内经验 | 项目直通车 | 厂商风云 | 政府网站 | 协同政务 | 城市应急
 博客 | 电子民主 | 网站测评 | 网站规划 | 绩效评估 | 信息化咨询 | 专家言论 | 研究报告 | 专题集萃 | 方案中心 | 学术动态 | 论坛
 
您现在的位置: 首页 >> 方案中心 >> 信息门户 >> 文章正文
天宇:政府门户网站搜索引擎系统
出处:电子政务工程服务网      日期:2006-6-16 保存本文

 系统简介

    互联网作为“第四媒体”已成为人们生活中不可或缺的信息获取的手段。不少企事业、政府机关与信息服务提供商纷纷构建内容丰富的网站,但却缺乏建立一条有效的信息提供途径,这样导致的直接后果就是浏览者在庞大的网站上不知道如何在短时间内找到自己需要或最感兴趣的内容,于是很快就失去耐心,离开这个网站。

    天宇CGWSE网站搜索引擎就是基于以上问题,对网站内所有内容进行全文检索的站内搜索引擎,这样浏览者只需在搜索框中输入自己感兴趣的内容,点击一下开始搜索,网站内所有和被搜索内容相关的信息就会立刻呈现出来。建立网站搜索引擎系统是网站提高信息提供能力的最有效途径。

    系统工作流程


    系统功能概述

     页面采集

     网站内各种网页信息的采集,如HTML页面,XML页面,由程序自动生成的页面、电子文档附件等,进行页面采集;另外,系统可以方便抓取网站后台数据库的页面(JSP, ASP, CGI);
    支持繁体页面(BIG5码)的采集,并自动转换为标准的简体码(GB码),支持unicode码集;
    系统根据用户设定的时间,自动采集网站上最新的页面内容。

    页面处理

    系统自动对采集的网页内容进行全文索引、页面内容摘要,方便用户进行全文检索;
对于采集下来的WEB页面,由CGRS全文数据库进行统一管理,成分保障了海量页面内容的存储效率与检索速度。

    内容搜索

    系统提供多种途径的页面检索方式,包括任意字、词、语句的全匹配检索、模糊检索、距离检索、逻辑检索、二次检索,方便用户精确定位搜索的内容,提高了用户检索的效率;
    搜索结果系统进行智能化的页面排序;
    网页快照:对于搜索的结果,页面会以高光显示,方便用户获取需要的信息内容。

    系统特点

    网页采集全面

   适应网站内容格式的多变性,能完整地获取需要采集的页面,遗漏少,网页采集内容的完整性在99%以上。
   信息采集快

   系统通过多线程处理技术,可以同时启动多个搜索器,快速高效地对目标站点进行页面采集。
   高效搜索

   除特别指定搜索内容外,系统默认搜索所有网页的正文部分,这样不但可以提高搜索速度而且过滤掉大量无关信息,提高了有效命中率。
   网站历史内容备份

   系统提供网站上所有的网页采集下来,并保存到全文数据库中,起到对网站历史页面进行存档与备份的作用,而其他的搜索引擎系统仅仅提供页面的连接。
 

需 求 信 息 反 馈
* 姓 名: 采购 代理 合作 咨询
* 电 话: 联系厂商 联系经销商
  EMail:
  传 真:
  手 机:
  公 司:
  职 务:
  城 市:     
相关文章 推荐文章
·思一兵:网站群建设需要内容保障机制
·建立基于“网站群”理念的政府门户网站发展观
 
  国脉咨询
网站测评 网站规划 绩效评估
信息化咨询 培训与会议
北京:010-82619783 82609185
上海:021-61117291 50899737
 
 
文章TOP排行
 
 
·国家电子政务工程建设项目验收
·关于政府网站服务供应链的再探
·如何提高地方政府网站内容保障
·政府网站应当建立“特色”建设
·关于政府网站服务“供应链”的
·公众服务体系不能成为“信息孤
·我国政府门户网站的顶层设计
 
 
 
最新文章
 
 
·天宇:政府门户网站群搜索引擎
·安信天元:统一身份认证管理系
·安信天元:统一用户信息管理系
·用最少的人力做到更高的效率
·网站内容管理解决方案
·电子政务解决方案
·易宝:JAVA的电子政务系统
·网景盛世:政府网站群发布检测
·网景盛世:政府网站群监管解决
 
 
 
关于我们 | 广告服务 | 成功客户 | 合作媒体 | 网站历史 | 免责声明 | 投稿指南 | 联系我们
国脉信息化发展研究中心、国脉互联政府网站评测研究中心
电子政务工程服务网版权所有 京ICP证050758号
网站系统由: turboCMS提供技术支持