时时彩平台搭建app

  • <tr id='qGeDLf'><strong id='qGeDLf'></strong><small id='qGeDLf'></small><button id='qGeDLf'></button><li id='qGeDLf'><noscript id='qGeDLf'><big id='qGeDLf'></big><dt id='qGeDLf'></dt></noscript></li></tr><ol id='qGeDLf'><option id='qGeDLf'><table id='qGeDLf'><blockquote id='qGeDLf'><tbody id='qGeDLf'></tbody></blockquote></table></option></ol><u id='qGeDLf'></u><kbd id='qGeDLf'><kbd id='qGeDLf'></kbd></kbd>

    <code id='qGeDLf'><strong id='qGeDLf'></strong></code>

    <fieldset id='qGeDLf'></fieldset>
          <span id='qGeDLf'></span>

              <ins id='qGeDLf'></ins>
              <acronym id='qGeDLf'><em id='qGeDLf'></em><td id='qGeDLf'><div id='qGeDLf'></div></td></acronym><address id='qGeDLf'><big id='qGeDLf'><big id='qGeDLf'></big><legend id='qGeDLf'></legend></big></address>

              <i id='qGeDLf'><div id='qGeDLf'><ins id='qGeDLf'></ins></div></i>
              <i id='qGeDLf'></i>
            1. <dl id='qGeDLf'></dl>
              1. <blockquote id='qGeDLf'><q id='qGeDLf'><noscript id='qGeDLf'></noscript><dt id='qGeDLf'></dt></q></blockquote><noframes id='qGeDLf'><i id='qGeDLf'></i>
                400-6966-109
                数据库涉密信息检查系统

                数据库涉密信息检查系统

                背景

                近年来,国家党政机关和企业的泄密事件呈上升趋势。其主要原因之一是在大数据、云计算背景下,越来越多的数据集中到数∮据中心数据库中集中存储,数据分散在不同的海量数据库表中,形成了海量、大数据、分布式等新的特点。

                1)        数据中心数据库存储数据量越来越大,一般达到50T以上;

                2)         数据中心数据库存储数据种类越来越多,包括结构化数据、非结构化数据、图片、文本、音视频数据等常常呈现的特点。


                这些新的特←点使保密工作者采用传统的检查手段所不能胜任的;因此必须依据新形势、新特点适时创造新的数据库检查工具才能应对数据资产集中化和大数据化所带来的严峻安全挑战。

                基于当前对数据库(结构化和非结构化数据库)、文本信息、图片、网页的保密检查成为瓶颈已成为现实的一个保密监管难题,为了解决对数据库内的涉密信息进行高效快速检查的现实需求,国家保密局提出了“数据库保密检查工具研制”这一科研项目,时时彩平台公司以其雄厚的技术能力通过项目答辩承担了该项国家级科研任务(项目编号:BMKY2016B11-3)。本产品就是基于科研任务的要求而研制开发的。

                需求

                需要用新的技术手段实现对数据库进行高效涉密数据检查。具体需求如下。

                1)        检查范围广。包括结构化数据库、非结构化数据库、云计算的虚拟机和压缩文件、大数据集群系统、服务器系统等

                2)        检查效率高。需要快速对高达100T的数据库进行保密检查,检查效率是传统方式的100-1000

                3)        检查类型多。需要对数据库中涉及到的多种文本文件(WordPDF等)、图片文件中的数据进行数据敏感性检查

                4)        检查精度高。需要能在海量数据库内容中精准定位涉密信息或数据,误报率低

                5)        多种检查方法。需要提供多种检查算法,能从多维度定位目标数据系统。

                功能概述


                系统采用大数据技术创新性地用于数据库涉密信息检查,能有效达到以下目标。

                1)        高效采集。大数据Sqoop技术实现数据的分布式采集。

                2)        高效分析。大数据MapReduce技术实现对数据库内容的快速分析和检查

                3)        精准定位。结合检查专家库,快速对政务敏感信息定位,并能生成详尽的分析报告

                产品形态

                该设备为1U软硬件一体便携式设备,非常方便主管部门携带检查。

                1

                n  重量小于10KG,采用便携式设计,方便检查人员的移动检查

                n  采用100M/1000M自适应网络,高性能X86服务器(自强XEON5以上CPU32G内存、1T硬盘)

                n  使用时,直接接入用户的核心交换机,通过配置必要的数据库参数和访问控制权限,系统进行自动的数据采集、分析和检查

                n  采用内存数据库实现中间结果数据存储,一旦检查完成或系统撤离检查现场,则自动断电或重启,用户数据自动销毁,达到检查不留痕、数据不带走的安全要求

                n  检查结果现场生成报表和自动打印检查结果;用户和检查主管部门同时确认生效,避免事后抵赖。

                产品部署

                数据库保密检查系统安装★部署方便,只需要保证与被检查数据库网络可达即可;出于检查效率的考虑,建议采用千兆及以上网络环境。

                具体部署见下图。

                产品部署

                系统功能

                (一) 检查关键字设置


                n  采用智能语义样本分〖析方式,通过机器学习自动生成检查关键字

                n  采用多维度语义智能分析方式智能扩充和完善检查关键字

                (二) 高效、快速检查


                n  采用分布式大数据平台,对采集到的所有数据库海量信息进行分布式检查,检查效率高达传统检查效率的200-300

                n  支持对数据库服务器中的所有文本文档(WordPDF等)的涉密信息检查

                n  支持对数据库服务器中的所有图片文件的涉密信息检查

                (三) 涉密信息自动消除


                    对检查出的涉密信息提供三种方式,能最大限度防止涉密信息的进一步泄露。

                n  加密处理:对检查出的涉密信息采用密码算法进行加密处理

                n  格式保密保护:对检查出的涉密信息进行格式保留保护处理,能在保证原有信息的格式不被破坏的情况下,保护数据的敏感性

                n  替换处理:对检查出的涉密信息采用特殊字符替换的方式进行处理

                (四) 多维度检查结果呈现:横向对比,纵向对比

                 

                (五) 详尽的检查报告

                    检查完成后将会生成详尽的检查报告,用于指导下一步的整改工作

                系统亮点及特色

                (一) 图片ω敏感文字识别:系统能够自动对嵌入到图像中的文字进行检索、提取并作出警示。该系统根据设定的关键词,对使用手机拍摄、扫描、复印、屏幕截图等方式获取的多种格式ω 的图像(包括pngjpgjpegbmptif等格式)进行处理,以达到检查图像中嵌入的文字是否违规、泄密之目的,系统识别率高,定位精准:识别精度达到80%以上。

                (二) 行业语义智能匹配:时时彩平台语义识别团队通过对部队,军工,政府涉密语义的分析,发现涉密信息不能仅仅由主要的几个关键词来识别,而是关键词和若干要素词组合才能形成涉密语义的分析。比如:文件中仅仅有装备这个词就认为是涉密信息的错误概率就比较大,但是装备与数字/英文结合的文字说明是涉密信息的可能性就比较大。又比如:包含演习这个词未必涉密,但是演习与15///营的数字结合说明是涉密信息的可能性就很大,采用这种专利技术,准确率可以提高200%

                (三) 智能语义分析:智能语义分析是将非结构化或半结构化的自然语言文本转化为计算机可深层处理的结构化信息、并进行分类、分析的软件平台。通俗地说,语义分析系统“阅读”文本,自动生成语义标签、管理标签、关系标签(当有大批量文本时),并可进一步“分析”形成分析报告。

                系统性能

                1)        关系型主流数据库系统OracleSQL Server

                2)        国产主流数据库南大通用、人大金仓、虚谷等

                3)        非关系型主流数据库MongoDBRedisHbase

                4)        文档数据库DominoDomino文档数据库为分布式部署,如需全面检查数据库内容,需要在Domino客户端部署客户端检查程序,实现对客户端的检查,需要用户ID和密码)

                5)        采集3000/15分钟,分析3000/小时

                关键技术

                1)        sqoop采集技术:通过分布式数据抓取技术,实现数据高效采集.

                2)        impala内存分布式分析技术:基于大数据架构的内存分布式检索技术,使得检索性能高于普通数据库的50倍以上。

                3)        基于上下文的TextRank智能分词技术:基于图的排序算法TextRank实现对文本内容进行分析处理★,形成关键字和文档摘要。

                4)        保密行业同义词库:对不同行业的涉密关键字基于同义、近义属性算法进行智能扩充搜索,极大提高了检索命中率。

                5)        Lucene全文检索组件技术:采用高性能、可伸缩的信息搜索(IR)库,实现涉密关键字高效索引和搜索能力。

                6)        数据库表自动过滤技术:根据数据库的表自动调用检查策略,过滤掉非数据表,无记录表,非文本字段等,提升△检查速度。

                7)        深度迭代筛选技术:采用二次筛选功能(对第一次命中数据建立二级缓存)、集成普通筛选和智能语义筛选。

                8)        关键字样本学习技术:根据用户提供的样本文档⊙,形成关键字库。

                9)        语法、语义识别技术:采用智能语义组合技术,更精确识别涉密信息。

                回归分析技术:采用机器学习算法进行回归分析,使得涉密样本集准确度不断提升。




                Copyright ? 北京时时彩平台通信科技股份有限公司版权所有

                网站建设: 企业邮箱

                400-6966-109
                北京时时彩平台通信科技股份有限公司