跳到主要内容

网站IP归属国家/区域过滤器

概述

什么是IP归属国家/区域?

每个能正常访问的网站域名,都会解析到服务器IP,而每个服务器IP,都根据IP段的规划特征,可以得出所属的国家区域信息。我们利用IP数据库,即可查询到网站所属的服务器归属地。

运用场景

  • 需求实例1:仅采集网站服务器在日本的网站。
  • 需求实例2:仅采集网站服务器不属于中国大陆的网站。

界面

3.0.4版本后,过滤器已经不是独立存在了,已经集成到了过滤方案中,所以我们可以在过滤方案中配置。 功能导航: 软件菜单-》【过滤规则配置】-》【新增过滤方案】-》【归属区域】,如图:

归属区域过滤器

使用建议

如非必要,不建议使用任何过滤器。开启过滤器将针对每个结果进行判断操作,消耗更多的时间从而影响效率!当前过滤器对效率的影响程度为:中

配置说明

【启用状态】:分为“开启”与“关闭”。 只有选择了“启用”,该过滤器才会在方案中生效!

【判断类型】:分为“包含”与”不含“两种。 如果选择包含,则采集结果必须要满足网站服务器IP归属地属于规则值中的某一项内容,才会被存储,否则会被过滤;如果选择不包含,则采集结果必须满足网站服务器IP归属地不属于规则值中的所有内容,才会被存储;

【规则值】:则是设置网站服务器IP归属地属于的区域。比如:“中国”、”香港“、”台湾“、”美国“、”日本“;

规则值需要自行添加配置。可以一个或者多个。可以点击新增,然后输入需要的值,然后回车键或者点击空白地方实现添加,然后点击保存按钮即可保存配置!

备注:创建了过滤器后,就可以在任务引擎参数配置中,指定选择使用我们创建的过滤方案了。

注意

部分网站ip,可能因为IP数据库更新不及时或者不完整的原因,导致查询不到IP的归属国家或区域或者误判等!

示例

本次以只采集IP归属地非中国大陆的网站为例:

判断类型: 不含

规则值: 中国

别忘了点击“保存”按钮!