大数据
课程安排 一、大数据概述 二、大数据处理架构Hadoop 三、分布式文件系统HDFS 四、分布式数据库HBase 五、MapReduce 六、Spark 七、IPythonNotebook运行PythonSpark程序 八、PythonSpark集成开发环境 九、PythonSpark决策树二分类与多分类 十、PythonSpark支持向量机 十一
黎明之道 黎明之道
3年前
天池比赛数据挖掘心电图数据分析
Task2数据分析2.1EDA目标EDA的价值主要在于熟悉数据集,了解数据集,对数据集进行验证来确定所获得数据集可以用于接下来的机器学习或者深度学习使用。当了解了数据集之后我们下一步就是要去了解变量间的相互关系以及变量与预测值之间的存在关系。引导数据科学从业者进行数据处理以及特征工程的步骤,使数据集的结构和特征集让接下来的预测问
Stella981 Stella981
3年前
ClickHouse数据库数据定义手记
前提前面一篇文章已经很详细地介绍了ClickHouse中每种数据类型的定义和基本使用,这篇文章会详细地介绍ClickHouse中的DDL和DML,很多操作区别于传统的DBMS,特别是代价巨大的DELETE和UPDATE操作。接下来开始吧💪💪❝一般情况下,笔者建议ClickHouse的关键字全用大写,这
Stella981 Stella981
3年前
Android实现炫酷SVG动画效果
svg是目前十分流行的图像文件格式了,svg严格来说应该是一种开放标准的矢量图形语言,使用svg格式我们可以直接用代码来描绘图像,可以用任何文字处理工具打开svg图像,通过改变部分代码来使图像具有交互功能,并可以随时插入到HTML中通过浏览器(如火狐浏览器)来观看。使用svg格式可让你设计激动人心的、高分辨率的Web图形页面。svg格式具备目前网络流行的
Stella981 Stella981
3年前
ElasticSearch 创建索引、插入数据、修改数据、删除数据
创建索引PUTdemoindex返回{"demoindex":{"settings":{"index":{"routing":{"allocation":{"incl
Stella981 Stella981
3年前
PostgreSQL数据库透明数据加密概述
最近一段时间,一直在和PostgreSQL社区合作开发TDE(Transparentdataencryption,透明数据加密)。研究了一些密码学相关的知识,并利用这些知识和数据库相结合。本文将会以数据库内核开发角度,从以下3个维度和大家讲述TDE。1.数据库当前面临的威胁模型2.加密策略描述,当前PostgreSQL社区目前的设计状态以及
Wesley13 Wesley13
3年前
mysql树状数据的数据库设计
0树状数据的分类我们在mysql数据库设计的时候,会遇到一种树状的数据.如公司下面分开数个部门,部门下面又各自分开数个科室,以此形成树状的数据.关于树状的数据,按层级数大致可分为一下两类:分类特点固定数量层级层级数量固定,每一层级都有各自的意义,如集团分公司部门科室,省市区等可变数量层级层级数量不固定,前几层级
Easter79 Easter79
3年前
Tensorflow.cifar_数据下载过程(数据输出)
1、环境:Win7x64、python3.7x64、tensorflow1.14、CPUi59400F2、3、 3.1、cifar10,没有数据,全新下载,下到默认目录(C:\\Users\\Administrator\\tensorflow\_datasets),全过程控制台输出:(20190903)"C:\ProgramF
十月飞翔 十月飞翔
2年前
路由协议分为哪几类
首先路由协议分两类:1.静态路由协议手动写目的和下一跳,大量路由数目的时候不适合使用,因为命令写起来比较复杂,多线路的时候选路死板不够灵活.2.第二种是动态路由协议,可以根据自己的算法决定选择合适的路径动态路由协议分两类:内部网关协议.igp:1.内部协议分两类,一类是距离矢量协议目前
京东云开发者 京东云开发者
10个月前
重新认识Elasticsearch-一体化矢量搜索引擎
前言2023哪个网络词最热?我投“生成式人工智能”一票。过去一年大家都在拥抱大模型,所有的行业都在做自己的大模型。就像冬日里不来件美拉德色系的服饰就会跟不上时代一样。这不前段时间接入JES,用上好久为碰的RestHighLevelClient包。心血来潮再