大数据
课程安排 一、大数据概述 二、大数据处理架构Hadoop 三、分布式文件系统HDFS 四、分布式数据库HBase 五、MapReduce 六、Spark 七、IPythonNotebook运行PythonSpark程序 八、PythonSpark集成开发环境 九、PythonSpark决策树二分类与多分类 十、PythonSpark支持向量机 十一
Stella981 Stella981
3年前
ClickHouse数据库数据定义手记
前提前面一篇文章已经很详细地介绍了ClickHouse中每种数据类型的定义和基本使用,这篇文章会详细地介绍ClickHouse中的DDL和DML,很多操作区别于传统的DBMS,特别是代价巨大的DELETE和UPDATE操作。接下来开始吧💪💪❝一般情况下,笔者建议ClickHouse的关键字全用大写,这
Stella981 Stella981
3年前
ElasticSearch 创建索引、插入数据、修改数据、删除数据
创建索引PUTdemoindex返回{"demoindex":{"settings":{"index":{"routing":{"allocation":{"incl
Stella981 Stella981
3年前
PostgreSQL数据库透明数据加密概述
最近一段时间,一直在和PostgreSQL社区合作开发TDE(Transparentdataencryption,透明数据加密)。研究了一些密码学相关的知识,并利用这些知识和数据库相结合。本文将会以数据库内核开发角度,从以下3个维度和大家讲述TDE。1.数据库当前面临的威胁模型2.加密策略描述,当前PostgreSQL社区目前的设计状态以及
Wesley13 Wesley13
3年前
mysql树状数据的数据库设计
0树状数据的分类我们在mysql数据库设计的时候,会遇到一种树状的数据.如公司下面分开数个部门,部门下面又各自分开数个科室,以此形成树状的数据.关于树状的数据,按层级数大致可分为一下两类:分类特点固定数量层级层级数量固定,每一层级都有各自的意义,如集团分公司部门科室,省市区等可变数量层级层级数量不固定,前几层级
Easter79 Easter79
3年前
Tensorflow.cifar_数据下载过程(数据输出)
1、环境:Win7x64、python3.7x64、tensorflow1.14、CPUi59400F2、3、 3.1、cifar10,没有数据,全新下载,下到默认目录(C:\\Users\\Administrator\\tensorflow\_datasets),全过程控制台输出:(20190903)"C:\ProgramF
数据治理之数据资产健康度量
本文分享自天翼云开发者社区《》,作者:徐东随着数据量的不断增加,数据治理已经成为了企业管理里不可或缺的一环。数据治理可以帮助我们更好地进行数据的管理和使用,从而提升数据的质量和价值,同时也能够保证数据的安全和合规。一、数据治理面临的问题数据治理中主要面临的
天翼云电脑和企业安全 “锁”了!
每家企业的核心系统和关键信息是企业顺利运作、不断发展的关键。数字化转型浪潮涌来,海量信息在云上高速流动,如何为“核心信息”加一把“安全锁”,成为许多企业关注的重点。天翼云电脑配备多项安全防控措施,可有效提升企业信息安全防控水平。天翼云电脑水印,企业信息防控再加码在企业信息安全防控过程中,涉及到员工的关键环节该怎么做?天翼云给出了解决方案——水印。通过天翼云电
数据治理之数据分类分级
本文分享自天翼云开发者社区《》,作者:徐东为了更好地保护数据安全、提高数据管理效率、确保数据合规性,企业需要对数据进行分类分级,根据数据的密级和敏感程度制定不同的管理和使用策略,尽可能做到有差别和针对性的防护,避免敏感数据的防护不足,非敏感数据的过度防护。
数据治理之构建数据资产目录
本文分享自天翼云开发者社区《》,作者:徐东一、引言现如今,数据已经成为企业实现业务价值的关键。随着大数据技术的发展,企业对于数据的收集、分析和利用越来越重视。其中,数据资产化已经成为企业数据管理的重要趋势,它能帮助企业更好地发掘和利用数据中的价值,从而提升