结果过滤


当前显示 1-5 of 34
 | 

调研分享:Pandas和Numpy对数据集的基本操作

李玉冰         [分类] 数据分析系统及工具  •   [标签] Pandas,Numpy   •   2021-10-18

[摘要]  本文分享了Pandas和Numpy对数据集的一些基本操作,对这些基本操作有条理地进行总结。分享内容见附件,目录如下:


BGP相关数据汇总

姜萍         [分类] 网络基础知识  •   [标签]    •   2020-12-21

[摘要]   主要记录了AS组织信息、AS link关系、BGP路由信息等数据的一些来源,以及这些数据集的格式说明。主要包括routeviews BGP RIB路由表原始数据、routeviews collector peers信息、AS级拓扑/连接关系、IPv4 AS链接信息、AS组织/排名等信息、pe...


异常检测数据集与属性调研

李侗格         [分类] 期刊和会议  •   [标签] 网络流量分析   •   2020-12-20

[摘要]  一、异常检测概述异常(Anomaly),是指目标数据集中与正常模式的统计特征明显不一致的数据模式,在很多领域的数据分析中都是一个比较常见的现象。造成数据异常的活动多种多样,比如金融数据中的信用卡欺诈,网络数据中的网络攻击等。按照数据具体表现形式,异常可以分为以下三:点异常(Pointanomaly)...


清华大学计算机网络技术前沿研讨会 参会纪要

李白杨         [分类] 期刊和会议  •   [标签]    •   2020-11-11

[摘要]  清华大学计算机网络技术前沿研讨会 参会纪要参会人:李白杨,马小青10月24日参加了清华大学计算机系举办的网络技术研讨会暨 “计算未来“ 博硕论坛063期,共有 两位企业嘉宾和七位来自清华计算机系的博士生 分享其工作。会议议题内容整理如下:附回放地址。1. 旷视 Brain++ 计算平台体系架构报告人...


2020云栖大会-数据仓库前瞻技术与实践

冀琳         [分类] 数据分析系统及工具  •   [标签]    •   2020-10-20

[摘要]  首先阐释了大数据的5个V: Volume:数据量大,包括采集、存储和计算的量都非常大。大数据的起始计量单位至少是PVariety:种类和来源多样化。包括结构化、半结构化和非结构化数据Velocity:数据增长速度快,处理速度也快,时效性要求高。比如搜索引擎要求几分钟前的新闻能够被用户查询到,个性化推...


当前显示 1-5 of 34