基本版数据库|服务细则|误植域名数据源 | WhoisXML API

基础版数据库

样本

数据可用性

订阅类型 描述
每日更新 通常情况下 UTC 时间下午 6:00 前可用。特殊情况下,由于来自其他渠道的每日数据源所生成的输入数据可能需要更多时间,因此数据会在 8 小时后生成。
每周更新 每周从周日开始。上周的数据文件将于每周一晚上 8 点(UTC)提供。
每月更新 上个月的数据文件将在该月第二天晚上 8 点(世界标准时间)提供。

命名约定

订阅类型 描述
每日更新 typosquatting.YYYY-MM-DD.daily.full.basic.csv
每周更新 typosquatting.YYYY-MM-DD.weekly.full.basic.csv ,其中日期对应于星期日,这是数据包含在文件中的最后一天;因此,一周被认为是从文件名中的上一个星期一开始,以文件名中的星期日结束,并且文件在文件名中的日期之后的下一个星期一发布。
每月更新 typosquatting.YYYY-MM-DD.monthly.full.basic.csv ,其中日期对应于下个月第一天,因此 2020 年 7 月的数据位于文件夹typosquatting.2020-08-01.monthly.full.basic.csv


请注意,每周和每月数据是通过关联相应的每日数据并添加第一个字段“日期”而得出的。

CSV 结构

基本版数据文件是逗号分隔的值文件,没有文本分隔符。这些文件使用 DOS/Windows 样式的行终止符 (CR+LF)。第一行是包含字段名称的标题行。每行有四个或五个字段,具体取决于订阅类型:

字段 描述
date 监测到该组的日期(仅在每周和每月文件中)。
group_number 给定日期内组的序号(如果是每日订阅,则在文件内)。
group_member_number 组内域名的序号。
total_no_of_grp_members 组内的组成员数量。
domain 域名
domain_utf 域名转录为统一代码;仅适用于具有国家(非英语)字符的域名。


例如,两个相邻的组,编号为 1058 和 1059,分别有 3 名和 5 名成员,在文件中显示为:

...
1058,1,3,slut.bar,
1058,2,3,slut.events,
1058,3,3,slut.red,
1059,1,5,worldthinkcreativity.online,
1059,2,5,worldthinkcreativity.org,
1059,3,5,worldthinkcreativity.com,
1059,4,5,worldthinkcreativity.info,
1059,5,5,xn--wrkdthinkcreativity-g5c.net,wırkdthinkcreativity.net
...

列表中的最后一个域名的第二个字母是非英语字符(不带点的“i”),如非空最后一个字段中所示。在每周或每月的文件中,一组的行看起来:

...
2020-08-17,3,1,9,app1e1d05.com,
2020-08-17,3,2,9,app1e1d09.com,
2020-08-17,3,3,9,app1e1d03.com,
2020-08-17,3,4,9,app1e1d04.com,
2020-08-17,3,5,9,app1e1d02.com,
2020-08-17,3,6,9,app1e1d01.com,
2020-08-17,3,7,9,app1e1d07.com,
2020-08-17,3,8,9,app1e1d08.com,
2020-08-17,3,9,9,app1e1d06.com,
...

注意,这些文件中组的日期和序号(前两个字段)是唯一标识该组的信息。