跳到主要内容

子域名前缀过滤器

概述

程序可以通过识别采集结果的子域名前缀,根据用户设置的规则,去决定采集到的数据是否需要存储;

为了防止软件采集到大量泛解析子域名,我们可通过自定义允许的子域名前缀白名单,来进行过滤存储! 仅当采集结果中的子域名的前缀,属于“子域名前缀白名单”中定义的数据时,才会被保存,否则将被系统自动过滤!

什么是子域名前缀?
doc.msray.cn 该子域名的前缀就是"doc"。
xxx.www.abc.com 该子域名前缀就是"xxx"
user.msray.cn 域名的前缀就是"user"。

运用场景

1:需求实例1-想要采集二级域名,但是不想采集到一大堆的泛解析垃圾二级域名

2:需求实例2-如果结果是二级域名,则仅存储大概率是论坛网站的域名

3:需求实例3-如果结果是二级域名,则仅存储大概率是个人博客的网站域名

使用建议

如非必要,不建议使用任何过滤器。开启过滤器将针对每个结果进行判断操作,消耗更多的时间从而影响效率!当前过滤器对效率的影响程度为:中

界面说明

Alt text

配置说明

该过滤器,已经默认设定好了经常出现的大量子域名前缀数据,一般情况下无需修改!仅需设置是否启用即可!