黎明之道 黎明之道
4年前
Pandas数据载入与预处理(详细的数据Python处理方法)
Pandas数据载入与预处理对于数据分析而言,数据大部分来源于外部数据,如常用的CSV文件、Excel文件和数据库文件等。Pandas库将外部数据转换为DataFrame数据格式,处理完成后再存储到相应的外部文件
Wesley13 Wesley13
4年前
## 码出高效——小组代码规范
码出高效——小组代码规范编程规约一.命名风格1.代码中的命名不能以下划线、美元符号开头或结尾。反例:<fontcolorDC143Csize3\_name/$name/name&/name\_</font2.【强制】代码中的命名严禁使用拼音与英文混合的方式,更不
Wesley13 Wesley13
4年前
2020年要做的几件大事
“2020年将成体系化技术输出2019年全年“大数据技术与架构”累计发送文章304篇。原创127篇,原创率41.8%。技术方向包含了:实时计算技术方向:Flink、Spark、Kafka等离线计算技术方向:Hive、Hadoop、HDFS、Hbase等语言基础技术方向:
小白学大数据 小白学大数据
3个月前
利用Selenium和PhantomJS提升网页内容抓取与分析的效率
核心观点:效率的提升之道Selenium本身是一个自动化测试工具,用于模拟真实用户操作。直接使用它来爬虫可能会很慢。提升效率的关键在于,将其从“模拟视觉化用户”转变为“高性能的无头数据采集工具”。第一部分:为什么是Selenium无头模式?处理动态内容:
codigger codigger
2个月前
编程语言的“奇点”融合(上):凤凰涅槃与彩虹之桥
系列导读:在上一阶段的探索中,我们见证了从VimL到ObjectSense的工程化飞跃。而今天,讲述的是更野心的技术蓝图——PolyglotSingularity(多语言奇点)。这不仅仅是一门语言,而是一个试图融合多语言、跨平台、并让人类与AI高度协同的“
nginx中同一端口不同tls版本与加密套件
本文分享自天翼云开发者社区《》.作者:zn1.问题描述需要在nginx中使用2个域名同时监听443端口,域名a只允许使用tls1.2,域名b允许tls1.2,tls1.3。实际运行发现原生nginx无法实现nginx.conf配置如下workerproce
近屿智能 近屿智能
1个月前
招聘终极战场:AI重构首轮筛选的精准与效能革命
招聘终极战场:AI重构首轮筛选的精准与效能革命AI得贤招聘官国务院《关于深入实施“人工智能”行动的意见》明确划定:2027年,70%的岗位面试将由AI或智能体完成。当智能化浪潮不可逆地渗透企业运营,你的招聘体系是否仍停留在简历海投、人力初筛、凭感觉提问的
近屿智能 近屿智能
1个月前
告别“感觉选人”:AI重构招聘的效率、精准与体验闭环
告别“感觉选人”:AI重构招聘的效率、精准与体验闭环AI得贤招聘官“AIHR到底有什么价值?”这是很多HR的困惑。但真正值得警惕的,不是对AI价值的迷茫,而是招聘中的主观判断正带来失控风险——简历越收越多、面试轮次越长,最终选人却难逃“我觉得这个人还可以
Flink 与Flink可视化平台StreamPark教程(DataStreamApi基本使用)
本文分享自天翼云开发者社区《》,作者:lnDataStreamApidataStreamApi是一切的基础,处于调度flink程序处理任务的起点。Flink有非常灵活的分层API设计,其中的核心层就是DataStream/DataSetAPI。由于新版本已
Flink 与Flink可视化平台StreamPark教程(时间相关 1)
本文分享自天翼云开发者社区《》,作者:ln水位线与窗口对于流式数据,时间是一个重要的标识。在flink的事件时间语义下,我们不依赖系统时间,而是基于数据自带的时间戳去定义了一个时钟,用来表示当前时间的进展。于是每个并行子任务都会有一个自己的逻辑时钟,它的前