大数据
课程安排 一、大数据概述 二、大数据处理架构Hadoop 三、分布式文件系统HDFS 四、分布式数据库HBase 五、MapReduce 六、Spark 七、IPythonNotebook运行PythonSpark程序 八、PythonSpark集成开发环境 九、PythonSpark决策树二分类与多分类 十、PythonSpark支持向量机 十一
黎明之道 黎明之道
4年前
天池比赛数据挖掘心电图数据分析
Task2数据分析2.1EDA目标EDA的价值主要在于熟悉数据集,了解数据集,对数据集进行验证来确定所获得数据集可以用于接下来的机器学习或者深度学习使用。当了解了数据集之后我们下一步就是要去了解变量间的相互关系以及变量与预测值之间的存在关系。引导数据科学从业者进行数据处理以及特征工程的步骤,使数据集的结构和特征集让接下来的预测问
Wesley13 Wesley13
3年前
mysql数据库读写分离 数据同步
分布式开发的一些问题总结我是用了两个xp(一个主的,一个从的)的系统测试成功的,linux系统我也做测试了,没有成功,不过我想我所遇到的问题是同一个问题,xp下的可以成功,linux下的应该也可以成功,稍候会测试,然后更新结果!PS:刚测试了下linux可以同步成功,主服务器是xp,从服务器是centos,可以成功。例:A机器192.16
Wesley13 Wesley13
3年前
MySQL数据库之DDL(数据定义语言)
1.MySQL数据库之DDL创建、删除、切换(1)查看所有数据库showdatabases;(2)切换数据库use数据库名;(3)创建数据库createdatabase数据库名;(4)删除数据库dropdatabase数据库名;2.My
Stella981 Stella981
3年前
PostgreSQL数据库透明数据加密概述
最近一段时间,一直在和PostgreSQL社区合作开发TDE(Transparentdataencryption,透明数据加密)。研究了一些密码学相关的知识,并利用这些知识和数据库相结合。本文将会以数据库内核开发角度,从以下3个维度和大家讲述TDE。1.数据库当前面临的威胁模型2.加密策略描述,当前PostgreSQL社区目前的设计状态以及
Wesley13 Wesley13
3年前
mysql树状数据的数据库设计
0树状数据的分类我们在mysql数据库设计的时候,会遇到一种树状的数据.如公司下面分开数个部门,部门下面又各自分开数个科室,以此形成树状的数据.关于树状的数据,按层级数大致可分为一下两类:分类特点固定数量层级层级数量固定,每一层级都有各自的意义,如集团分公司部门科室,省市区等可变数量层级层级数量不固定,前几层级
Easter79 Easter79
3年前
Tensorflow.cifar_数据下载过程(数据输出)
1、环境:Win7x64、python3.7x64、tensorflow1.14、CPUi59400F2、3、 3.1、cifar10,没有数据,全新下载,下到默认目录(C:\\Users\\Administrator\\tensorflow\_datasets),全过程控制台输出:(20190903)"C:\ProgramF
Python进阶者 Python进阶者
1年前
Python网络爬虫存储数据时,只有一页数据,后面的数据会把前面的数据覆盖?
大家好,我是Python进阶者。一、前言前几天在Python最强王者交流群【ZXS】问了一个Python网络爬虫实战问题。问题如下:我遇到了一个问题:【就是在存储数据时,只有一页数据,后面的数据会把前面的数据覆盖,而不是全部的数据】,【思路】:通过解析到的
数据治理之构建数据资产目录
本文分享自天翼云开发者社区《》,作者:徐东一、引言现如今,数据已经成为企业实现业务价值的关键。随着大数据技术的发展,企业对于数据的收集、分析和利用越来越重视。其中,数据资产化已经成为企业数据管理的重要趋势,它能帮助企业更好地发掘和利用数据中的价值,从而提升
数据治理之数据资产健康度量
本文分享自天翼云开发者社区《》,作者:徐东随着数据量的不断增加,数据治理已经成为了企业管理里不可或缺的一环。数据治理可以帮助我们更好地进行数据的管理和使用,从而提升数据的质量和价值,同时也能够保证数据的安全和合规。一、数据治理面临的问题数据治理中主要面临的