当前显示
56-60 of 132
[摘要]
随着互联网金融的快速发展, 如何快速有效地发现钓鱼网页是保障用户金融安全的前提条件,针对钓鱼
网页与真实网页布局结构相似的特点,本文提出了基于页面布局相似性的钓鱼网页发现方法 , 该方法首先抽取
出网页中带链接属性的标签作为特征,然后基于该特征提取网页标签序列分支来标识网页;接着通过网页标签序
列树对齐算法将网页标签序列树的对齐转换成网页标签序列分支的对齐...
[摘要]
针对分布式流处理系统中当输入数据的键值呈现倾斜分布时工作节点负载不均衡的问题,提出一种适应元组分布倾斜的流划分策略。该策略使用lossy counting算法计算键值出现的频率,以区分热键和非热键,同时,在数据源节点上维护一个多维向量,以记录每个工作节点的负载。当一个键值为热键的流元组到达后,数据源节点查询每个节点的负载,然后将该元组发送给负载最小的节点进行处理。在集成了该流划分策略的分布式...
[摘要]
大数据移动互联网时代的到来,让我们身处数据洪流之中,数据之大使得我们对数据进行高效实时处理的需求也变得越来越迫切,促使国内外的研究团队开发出了许多流处理应用。为了提高流处理应用的性能,这些流处理应用底层实现都采用了各种各样复杂的流处理算子优化技术。本文在调研学习这些流处理应用的基础上,概括总结了其中最常见的八种流处理算子优化技术,并结合实际例子,分别从性能收益、安全条件、动态性等方面详细介绍...
[摘要]
[摘要]