结果过滤
李玉冰 [分类] 数据分析系统及工具 • [标签] Pandas,Numpy • 2021-10-18
[摘要] 本文分享了Pandas和Numpy对数据集的一些基本操作,对这些基本操作有条理地进行总结。分享内容见附件,目录如下:
姜萍 [分类] 网络基础知识 • [标签] • 2020-12-21
[摘要] 主要记录了AS组织信息、AS link关系、BGP路由信息等数据的一些来源,以及这些数据集的格式说明。主要包括routeviews BGP RIB路由表原始数据、routeviews collector peers信息、AS级拓扑/连接关系、IPv4 AS链接信息、AS组织/排名等信息、pe...
李侗格 [分类] 期刊和会议 • [标签] 网络流量分析 • 2020-12-20
[摘要] 一、异常检测概述异常(Anomaly),是指目标数据集中与正常模式的统计特征明显不一致的数据模式,在很多领域的数据分析中都是一个比较常见的现象。造成数据异常的活动多种多样,比如金融数据中的信用卡欺诈,网络数据中的网络攻击等。按照数据具体表现形式,异常可以分为以下三:点异常(Pointanomaly)...
李白杨 [分类] 期刊和会议 • [标签] • 2020-11-11
[摘要] 清华大学计算机网络技术前沿研讨会 参会纪要参会人:李白杨,马小青10月24日参加了清华大学计算机系举办的网络技术研讨会暨 “计算未来“ 博硕论坛063期,共有 两位企业嘉宾和七位来自清华计算机系的博士生 分享其工作。会议议题内容整理如下:附回放地址。1. 旷视 Brain++ 计算平台体系架构报告人...
冀琳 [分类] 数据分析系统及工具 • [标签] • 2020-10-20
[摘要] 首先阐释了大数据的5个V: Volume:数据量大,包括采集、存储和计算的量都非常大。大数据的起始计量单位至少是PVariety:种类和来源多样化。包括结构化、半结构化和非结构化数据Velocity:数据增长速度快,处理速度也快,时效性要求高。比如搜索引擎要求几分钟前的新闻能够被用户查询到,个性化推...