轻量级的自学习网页分类方法
摘要:提出了一种自学习的轻量级网页分类方法SLW。SLW首次引入了访问关系的概念,使其具有反馈和自学习的特点。SLW从已有的恶意网页集合出发,自动发现可信度低的用户和对应的访问关系,从而进一步利用低可信度用户对其他网页的访问关系来发现位置的恶意网址集合。实验结果表明,在相同数据集上,相比于传统检测方法,SLW犯法可以显著提高恶意网页检测效果,大幅降低平均检测时间。
关键词:黑名单;访问关系;恶意网页;网页评价