Irene181 Irene181
3年前
新书上市 | 世界名校数据挖掘经典《斯坦福数据挖掘教程(第3版)》
《斯坦福数据挖掘教程(第3版)》上架之后,这是我们第一次整篇文章介绍这本书。这本书相当受欢迎(前两个版本累计销量超过5万册),尤其是受学校青睐——在此也说声抱歉,出于出版时间的原因,很多学校依然采用了旧版作为教材;同时也请知悉,新版已上架,正在使用这本书作为教材的学校可以考虑更新了。实际上,这本书已经在大家面前出过2次镜了,一次是2020年图灵奖
黎明之道 黎明之道
3年前
天池比赛数据挖掘心电图特征工程
Task3特征工程3.1学习目标学习时间序列数据的特征预处理方法学习时间序列特征处理工具Tsfresh(TimeSeriesFresh)的使用3.2内容介绍数据预处理时间序列数据格式处理加入时间步特征time特征工程时间序列特征构造特征筛选使用tsfresh进行时间序列特征处理
黎明之道 黎明之道
3年前
天池比赛数据挖掘心电图数据分析
Task2数据分析2.1EDA目标EDA的价值主要在于熟悉数据集,了解数据集,对数据集进行验证来确定所获得数据集可以用于接下来的机器学习或者深度学习使用。当了解了数据集之后我们下一步就是要去了解变量间的相互关系以及变量与预测值之间的存在关系。引导数据科学从业者进行数据处理以及特征工程的步骤,使数据集的结构和特征集让接下来的预测问
黎明之道 黎明之道
3年前
天池比赛数据挖掘心电图模型融合
Task5:模型融合5.1学习目标学习融合策略完成相应学习打卡任务5.2内容介绍https://mlwave.com/kaggleensemblingguide/https://github.com/MLWave/KaggleEnsembleGuide模型融合是比赛后期一个重要的环节,大体来说有如下的类型方式。1
Wesley13 Wesley13
3年前
IP地理位置定位系统之定位系统研发
IP地理位置定位系统是一个街道级别的、实时的IP地理位置查询系统。该系统采用超高精度IP实时定位技术,通过网络测量和大数据挖掘,对IP的地理位置和相关属性进行测量,在无需硬件支持的条件下,即可对被探测目标终端IP完成定位。定位系统的研发核心是IP地理位置定位算法,包含如何划分IP所属功能块和地域块、设计IP定位算法、采用什么样的相似度比较策略、IP地理位
大数据建模、分析、挖掘技术应用
时间2022年8月5日—2022年8月9日北京(同时转线上直播)(5日报到,6日9日上课)课程第一天一、大数据概述二、大数据处理架构Hadoop三、分布式文件系统HDFS四、分布式数据库HBase第二天五、MapReduce六、Spark七、IPythonNotebook运行PythonSpark程序八、PythonSpark集成开发环境第三
大数据建模、分析、挖掘技术应用
1.掌握大数据建模分析与使用方法。2.掌握大数据平台技术架构。3.掌握国内外主流的大数据分析与BI商业智能分析解决方案。4.掌握大数据分析在搜索引擎、广告服务推荐、电商数据分析、金融客户分析方面的应用。5.掌握主流的基于大数据Hadoop和Spark、R的大数据分析平台架构和实际应用。6.掌握基于Hadoop大数据平台的数据挖掘和数据仓库分布
大数据建模、分析、挖掘技术
随着《关于印发促进大数据发展行动纲要的通知》发布,各类型数据呈现出了指数级增长,数据成了每个组织的命脉。今天所产生的数据比过去几年所产生的数据大好几个数量级,企业有了能够轻松访问和分析数据以提高性能的新机会,如何从数据中获取价值显得尤为重要,也是大数据相关