结果过滤


当前显示 6-10 of 12
 | 

Flink中的Watermark机制

冀琳         [分类] 数据分析系统及工具  •   [标签]    •   2020-10-20

[摘要]  Watermark的概念 通常情况下由于网络或者系统等外部因素影响下,事件数据往往不能及时传输至FLink系统中,导致系统的不稳定而造成数据乱序到达或者延迟达到等问题,因此需要有一种机制能够控制数据处理的进度。 具体来讲,在创建一个基于时间的window后,需要确定属于该window的数据元...


百度大脑开放日互联网内容安全专场

冀琳         [分类] 基础算法  •   [标签]    •   2020-05-21

[摘要]  5月15日百度大脑开放日互联网内容安全专场分享了百度在内容安全方面的成果。 现在随着法规愈加健全,以及净网,护苗等行动,线上对网络的一些多媒体的内容进行管控。还有更加完善的管理规范,包括儿童个人信息网络保护规定,网络信息内容生态治理规定等等,这些规定的出台,让大家认识到,内容安全已经成为企业越来越需...


自组织映射网络(SOM)介绍

冀琳         [分类] 基础算法  •   [标签]    •   2020-05-21

[摘要]  1981年芬兰赫尔辛基大学的T.Kohonen教授提出一种自组织特征映射网(self-organizing feature map,简称SOM),又称Kohonen网,Kohonen认为,一个神经网络接受外界输入模式时,将会分为不同的对应区域,各区域对输入模式具有不同的响应特征,而且这个过程是自动完...


四室讨论班银行国企求职经验分享内容总结

冀琳         [分类] 基础算法  •   [标签]    •   2020-04-20

[摘要]  4月18日,四室讨论班,银行国企求职经验分享内容总结


pyspark 使用介绍

冀琳         [分类] 基础算法  •   [标签]    •   2020-04-19

[摘要]  在单机范围内的数据量下,使用python的pandas包就可以非常方便地完成数据批处理工作。但当数据量达到1G以上时,pandas处理起来就有些力不从心了,到数据量达到1T以上,只能以分块的方式存储在分布式系统上时,pandas就无能为力了。Hadoop生态下,原生的工具是MapReduce计算模型...


当前显示 6-10 of 12