摘要:本文提出一种使用基于三元符的URL公共模式集来检测恶意URL的方法,该方法首先将URL公共模式提取转换成URL的域名、路径名和文件名三个段的公共模式的拼接,然后通过以三元符为词项的动态倒排索引加快每个段的公共模式的计算,最后使用基于倒排索引检索的URL公共模式匹配被检测URL,以判定其是否是恶意的。而且,该方法支持基于Jaccard的随机域名检测技术来检测包含随机域名的恶意URL。大量的实验表明本方法具有较好的性能和扩展性。
关键词:恶意URL检测,公共模式,三元符,倒排索引