信息资源整合平台解决方案

1、信息资源整合平台简介

信息资源建设与发布平台是北京成邦系统技术有限公司自主研发的基于非结构化文档管理的大型智能化内容管理系统,它是一套基于网络平台上用于知识仓库创建、生产、管理、维护和发布的全面解决方案。该平台采用流行的B/S浏览器检索方式和先进的三层架构,能够同时管理文字、图片、多媒体等信息,并提供全文检索服务,支持网页的可配置动态发布,是一个面向内容管理、发布、增值利用的平台,是各类机构建设数字图书馆、文献信息系统、开展信息服务的理想平台。

2、信息资源整合平台组成

《信息资源整合平台》由管理子系统、前台数据展示和数据采集子系统组成。


3信息资源整合平台功能

管理子系统实现对资源新增、修改、删除以及发布一整套流程化的功能;数据采集子系统实现对参建单位数据的批量采集和数据筛选等功能;资源数据展示实现对资源的统一检索、资源数据的多样化展示、资源的在线浏览、资源下载以及对资源和访问量的分析并形成分析报告,为决策者提供依据。系统配置灵活、组网方便,操作、维护和扩展简单。本系统主要功能内容如下:

1)灵活性的资源库及资源配置,扩展和维护更方便

2)多样化的权限设置,满足个性化需求

3)精确化的Web日志,辅助管理层决策

4)智能化的数据深层处理,减少人工成本


4、核心技术优势

1lucene.net

采用的大数据检索技术是lucene.net创建索引,可实现在千万级数据搜索1s之内。

2)盘古分词

采用盘古分词是对一个中英文分词组件,并提供字典维护,可适应各个行业。

3)贝叶斯算法

采用贝叶斯算法对文本内容的精简提炼,从长篇文章中自动提取关键词和关键段落,构成摘要内容,方便用户快速预览文本内容,提高工作效率。可处理大多数文件格式,包括word 文件、PDF 文件、HTML 文件等,能够准确高效地从这些文件中提取文本进行摘要。

4K-means算法

采用K-means算法自动地分析采集过来的所有信息,根据内容概念来把相似的文档聚类到一起,同时完全自动化的生成类别的标题,并提供自动的热点生成和自动的热点趋势分析。

5KNN算法

采用KNN算法可以自动地对文档进行分类,赋予文档一个预先定义的类别主题词,便于电子文档的组织,不需人工干预。



5、信息资源整合平台界面图