• 收藏
  • 加入书签
添加成功
收藏成功
分享

探索研究专卖打假打私情报信息数据系统的建立

吕若飞 赵如茜
  
大通媒体号
2025年19期
1银川市烟草专卖局(公司),专卖监督管理科(专卖稽查支队),宁夏银川市新昌东路50号 750000 2宁夏区烟草专卖局(公司),专卖监督管理处,宁夏银川市新丝路8号750000

摘  要:近年来,假私非烟草制品传统的交易形态已发生根本改变,取而代之的是利用互联网进行贩售的新型交易形态,对打假打私工作提出了新的挑战。基于以上问题,探索建立专卖打假打私情报数据系统,已显得十分迫切而重要。本文围绕多个维度,以大数据分析处理的框架为指导,对基于大数据的专卖打假打私情报数据系统的构建进行了研究,分析了其功能和构成,并提出了应用技术和措施。

关键词:打假打私数据库;大数据;烟草专卖;情报信息

1 建立专卖打假打私情报信息数据系统必要性

通过研究MySQL数据库等主流数据库类型,探索建立一套完整的数据采集、数据处理、数据加工、数据归档、数据查询、数据关联等涉烟数据治理全流程管理功能,对采集的不同数据源通过自动提取或导入数据库进行数据筛选、数据转化、数据清洗和标签标注处理,形成涉烟案件类型分类,达到建立“专卖打假打私情报信息数据系统”的目的,满足在处理各类案件数据的便捷化需求,同时通过建立数据分析模型实现对涉烟刑事案件中以各类途径提取的人流、物流、资金流进行数据关联分析。

2 数据采集汇聚

2.1 数据采集方式

数据采集工作主要侧重三个方面,一是确定数据采集范围需覆盖烟草网、互联网和社会面的大量数据,对不断出现的新行业数据应及时纳入采集范围;二是建立了统一的数据采集标准,针对不同采集内容的数据规范,不同系统采集的数据存在异构问题,必须要经过对标转换后才能实现融合;三是明确采集分工职责,重点解决不同业务口、不同层级多头重复采集或均不采集等历史问题。

采取基础管理静态采集数据,主动履行管理职能,采集管理对象及管理对象相关的基础资料数据,以及技术手段动态采集数据。依据法律法规、政策文件,针对互联网、烟草网等,实时采集、按需采集、精细采集,对网络原始数据流量实时处理、解析、获取。

2.2 数据资源目录

根据数据标签类型,制定数据资源目录,采集人员按照目录进行针对性采集。

2.3 建立数据治理机制

通过实现数据溯源、数据影响性等分析功能,确定数据的分级分类,能够对数据记录、字段、数据集、数据来源进行精细化的数据权限控制。建设贯穿全流程的质量管理,设定质量检测规则,从事前、事中、事后对数据质量进行质量检查、问题发现、监测跟踪和分析应用。从数据接入、数据处理、数据资源、数据质量、数据对账等多个维度展开对数据的运维管理工作。

3 MySQL搭建数据库

3.1 MySQL

MySQL是一个关系型数据库管理系统,所使用的SQL语言是用于访问数据库的最常用标准化语言。该数据库可以对数据进行保存,也可以对其数据进行检索,查询等。MySQL数据库支持多个操作系统,如:Windows、Linux、Mac OS等,支持多线程,可以充分的利用CPU资源,它能够作为一个单独的应用程序应用在客户端服务器网络环境中,也可以作为一个库嵌入到其他的软件中并提供多种语言支持。

3.2 确定数据库框架

完成数据库搭建,下一步需确定数据库框架,便于后续整体搭建运行。

应用的整体框架,共分3个访问终端以及功能、数据、技术3个应用架构。同时,我们考虑了应用的迭代和演进性,设计了预留API接口和相关框架及模块,以便于后期技术的整合。

功能架构方面,构建了访问门户、智能案件侦办、线索分析等8个系统模块。

技术架构方面,构建了内外部基础库、主题库、知识库(以分析模型为依托),涵盖67项数据信息,形成了大数据平台,用以实现数据对比、分析、加工服务。

数据架构方面,涵盖数据采集层、储存层、处理层、应用服务层等11个技术层面和要点。

3.3 搭建数据库

本文选取使用MySQL搭建数据库,首先对数据库进行安装,并设置root用户密码。安装完成后,使用命令行工具连接MySQL。在命令行窗口中输入以下命令:

mysql -u root -p

其中“root”为MySQL的超级管理员账号,执行该命令后会提示输入密码,输入设置的root用户的密码即可。连接成功后,会看到MySQL的命令行工具。在连接MySQL的命令行工具中,执行以下命令来创建一个新的数据库:

CREATE DATABASE database_name;

其中“database_name”为新建数据库的名称,可以根据实际需求进行修改。在数据库中,需要创建表来存储数据。以下是创建一个名为“users”的表的命令:

CREATE TABLE users(

Id INT UNSIGNED NOT NULL AUTO_INCREMENT,

username VARCHAR(30) NOT NULL,

password VARCHAR(50) NOT NULL,

email VARCHAR(50) NOT NULL,

reg_date TIMESTAMP,

PRIMARY KEY(id)

);

这个表包含了4个字段:id、username、password和email,分别为用户ID、用户名、密码和电子邮件地址。其中id字段为整数类型,自动递增;其他三个字段是VARCHAR类型。reg_date字段是时间戳类型,用于记录用户的注册时间。PRIMARY KEY指定了id字段为主键。在表创建完成后,可以向表中添加数据。以下是向users表中添加一行数据的命令:

INSERT INTO users(username,password,email,reg_date)

VALUES(‘user1’,’password’,’user1@example.com’,NOW());

这个命令向users表中插入了一行数据,包含了4个字段的值,分别是:'user1'、'password1'、'user1@example.com'和当前时间。在表中添加数据后,可以使用SELECT命令查询并获取数据。以下是一条查询users表中所有行数据的命令:

SELECT * FROM users;

下一步进行表的导入,输入命令:

CREATE TABLE `零售户市场监管档案` (

`许可证号` VARCHAR ( 255 ) DEFAULT NULL,

`企业名称字号` VARCHAR ( 255 ) DEFAULT NULL,

`经营地址` VARCHAR ( 255 ) DEFAULT NULL,

`经营者姓名` VARCHAR ( 255 ) DEFAULT NULL,

`经营者身份证号码` VARCHAR ( 255 ) DEFAULT NULL,

`联系电话` VARCHAR ( 255 ) DEFAULT NULL,

`订货电话` VARCHAR ( 255 ) DEFAULT NULL,

`当前生效状态` VARCHAR ( 255 ) DEFAULT NULL,

`地缘情况` VARCHAR ( 255 ) DEFAULT NULL,

`实际经营者姓名` VARCHAR ( 255 ) DEFAULT NULL,

`实际经营者地址` VARCHAR ( 255 ) DEFAULT NULL,

`实际经营者电话` VARCHAR ( 255 ) DEFAULT NULL,

`经度` VARCHAR ( 255 ) DEFAULT NULL,

`纬度` VARCHAR ( 255 ) DEFAULT NULL,

`客户等级管理` VARCHAR ( 255 ) DEFAULT NULL

) ENGINE = INNODB DEFAULT CHARSET = utf8;

对零售户市场监管档案进行导入,同理,分别对资源目录中涉及的数据进行分批次导入。

3.4 建立关联模型

3.4.1 数据查询模型

为了能够查询历史案件涉案人是否与零售户有关联,建立数据查询模型,采用物理模型进行关联性设置,以“零售户许可证号”作为信息关联要素,进行多表关联。

对存在“非法经营案涉及5万元以上经营户”中,涉及持证零售户的人员进行查询。输入命令:

SELECT

`零售许可证`.`零售户许可证2018年以后`.*,

`零售许可证`.`零售户许可证2018年以后`.`负责人(经营者)姓名`,

`重点人员`.`非法经营案涉及5万元以上经营户`.*,

`重点人员`.`非法经营案涉及5万元以上经营户`.`负责人(经营者)姓名`,

`零售许可证`.`烟草专卖零售许可证人员信息`.*,

`零售许可证`.`烟草专卖零售许可证人员信息`.`负责人(经营者)姓名`

FROM

`零售许可证`.`零售户许可证2018年以后`

INNER JOIN

`重点人员`.`非法经营案涉及5万元以上经营户`

ON

`零售许可证`.`零售户许可证2018年以后`.`负责人(经营者)姓名` = `重点人员`.`非法经营案涉及5万元以上经营户`.`负责人(经营者)姓名`

INNER JOIN

`零售许可证`.`烟草专卖零售许可证人员信息`

ON

`重点人员`.`非法经营案涉及5万元以上经营户`.`负责人(经营者)姓名` = `零售许可证`.`烟草专卖零售许可证人员信息`.`负责人(经营者)姓名`

WHERE

`零售许可证`.`零售户许可证2018年以后`.`负责人(经营者)姓名` = "王xx"

对“非法经营案涉及5万元以上经营户”中,涉及持证零售户的“零售许可证号”进行查询。输入命令:

SELECT

`零售许可证`.`零售户许可证2018年以后`.*,

`零售许可证`.`零售户许可证2018年以后`.`零售许可证编号`,

`重点人员`.`非法经营案涉及5万元以上经营户`.*,

`重点人员`.`非法经营案涉及5万元以上经营户`.`许可证号`,

`零售许可证`.`烟草专卖零售许可证人员信息`.*,

`零售许可证`.`烟草专卖零售许可证人员信息`.`许可证号`

FROM

`零售许可证`.`零售户许可证2018年以后`

INNER JOIN

`重点人员`.`非法经营案涉及5万元以上经营户`

ON

`零售许可证`.`零售户许可证2018年以后`.`零售许可证编号` = `重点人员`.`非法经营案涉及5万元以上经营户`.`许可证号`

INNER JOIN

`零售许可证`.`烟草专卖零售许可证人员信息`

ON

`重点人员`.`非法经营案涉及5万元以上经营户`.`许可证号` = `零售许可证`.`烟草专卖零售许可证人员信息`.`许可证号`

WHERE

`零售许可证`.`零售户许可证2018年以后`.`零售许可证编号` = 640181101226

3.4.2 数据分析模型

针对涉烟案件重点人员的银行交易流水开发资金流向分析模型,主要研究如何从微信钱包、财付通、支付宝、银行流水或者其他软件、平台包含的海量交易数据中将人工筛选经验以算法的形式进行表现,实现程序化、便捷化提取关键信息的功能,然后通过提取的关键交易信息与信息流、物流信息进行对照,以确定上、下线及固定交易全过程的违法交易证据。从“交易对手、时间、金额、频率、交易类型”五个维度,将交易类型“转出/转入”作为网状结构图的路径,将涉案人员双方的交易金额和频次进行总计,均展示在网状图中。同时将比对筛选后的数据以表格形式进行展现。

针对物流寄递环节设计物流寄递分析模型,根据重点关注人员信息,通过收发地地址、手机号码、人员户籍地、收发快递次数等多维度关键要素的分析、关联和筛选,建立同城及异地快递寄递分析异常模型,对涉嫌利用物流快递实施违法犯罪人员进行跟踪。物流分析结合涉烟犯罪特性,提取与涉烟犯罪相关的关键物流要素,例如与涉烟犯罪重点人物流往来、涉及涉烟犯罪重点关注物品。实现快递详情查看、快递流向分析、快递信息倒推、共同收件人统计分析、共同寄件人统计分析、托运内容分析等功能,从而追溯整个犯罪链上下游信息。

针对信息流数据,对信息流中包含的人员信息、场所位置信息、通话记录信息、基站信息等数据信息进行常见数据格式分析,确定其中的关键字段信息,通过在IBM SPSS、IBM I2及火眼金睛等数据分析软件中建立数据分析模型的方式,对信息流中相关信息进行自动关联分析,以确定人员关系、交易位置、仓储场所等对下一步案件侦办有价值的线索。

4 低代码平台设计

操作端模块主要有系统管理(用户管理、角色管理)、案件查询(电子烟案件、假私烟案件、物流寄件案件、电子取证云端(预设模块)、电子烟监管、零售户查询、营销系统客户信息(预设模块)、组网查询(资金组网、物流组网) 六个模块,并将查询功能进行细化和设计,与服务器端口进行连接,实现数据传输,同时对操作页面进行美化,专卖人员可使用分配账号直接使用,为后续案件侦办提供便利。

5 下一步发展方向

(一)数据资源有效整合,服务业务应用。专卖打假打私情报数据系统后期可通过在区局内网服务器架设或构建,进一步扩大数据库涵盖的数据范围,汇聚烟草业务数据、公安数据、政务和社会资源,对烟草情报业务进行系统整合与平台应用,提高资源利用效能,为打击涉烟类违法犯罪提供基础信息支撑。

(二)全面研判导侦,拓展线索来源。依托云计算、大数据技术,对数据进行分类分析和关联挖掘。通过建立可靠数据模型,批量挖掘线索,全面分析全区涉烟违法犯罪案件的数据,研究变化趋势,强化科技导侦,拓展案件线索来源。

(三)规范工作流程,全程全要素闭环运作。实现全程可回溯、可评估,对督办案件和协查线索实施流程监控,提高工作效率,落实工作责任。按规定在时效期内对督办案件、协查线索下发及交办指令等的反馈情况实时跟踪管理,即时评估工作质效。

参考文献

[1]符鹏.互联网涉烟案件的监管[J].重庆与世界(学术版).2013,(12).6-7,26.

[2]仉琦,党玉松,陈军.互联网涉烟违法行为新途径—建设大数据研判中心构想[J].卷宗,2018,8(36):297-298.DOI:10.3969/j.issn.1005-4669.2018.36.278.

[3]苟文博,于强.基于MySQL的数据管理系统设计与实现[J].电子设计工程,2017(06):62-65.

*本文暂不支持打印功能

monitor