|
|
|
随着互联网金融的快速发展, 如何快速有效地发现钓鱼网页是保障用户金融安全的前提条件,针对钓鱼
网页与真实网页布局结构相似的特点,本文提出了基于页面布局相似性的钓鱼网页发现方法 , 该方法首先抽取
出网页中带链接属性的标签作为特征,然后基于该特征提取网页标签序列分支来标识网页;接着通过网页标签序
列树对齐算法将网页标签序列树的对齐转换成网页标签序列分支的对齐,使二维的树结构转换成一维的字符串结
构,最后通过生物信息学 BLOSUM62 编码的替换矩阵快速计算对齐分值,从而提高钓鱼网页的检测效果, 一系
列的仿真实验表明文中方法可行, 并具有较高的准确率和召回率。
|