大数据
课程安排 一、大数据概述 二、大数据处理架构Hadoop 三、分布式文件系统HDFS 四、分布式数据库HBase 五、MapReduce 六、Spark 七、IPythonNotebook运行PythonSpark程序 八、PythonSpark集成开发环境 九、PythonSpark决策树二分类与多分类 十、PythonSpark支持向量机 十一
黎明之道 黎明之道
4年前
天池比赛数据挖掘心电图数据分析
Task2数据分析2.1EDA目标EDA的价值主要在于熟悉数据集,了解数据集,对数据集进行验证来确定所获得数据集可以用于接下来的机器学习或者深度学习使用。当了解了数据集之后我们下一步就是要去了解变量间的相互关系以及变量与预测值之间的存在关系。引导数据科学从业者进行数据处理以及特征工程的步骤,使数据集的结构和特征集让接下来的预测问
Stella981 Stella981
3年前
ClickHouse数据库数据定义手记
前提前面一篇文章已经很详细地介绍了ClickHouse中每种数据类型的定义和基本使用,这篇文章会详细地介绍ClickHouse中的DDL和DML,很多操作区别于传统的DBMS,特别是代价巨大的DELETE和UPDATE操作。接下来开始吧💪💪❝一般情况下,笔者建议ClickHouse的关键字全用大写,这
Stella981 Stella981
3年前
ElasticSearch 创建索引、插入数据、修改数据、删除数据
创建索引PUTdemoindex返回{"demoindex":{"settings":{"index":{"routing":{"allocation":{"incl
Stella981 Stella981
3年前
LiveVideoStackCon 2017 Day 1精彩回顾
10月20日北京,一年一度的LiveVideoStackCon2017音视频技术大会在北京丽亭华苑酒店举行,会议甄选多媒体开发领域最新技术实践与应用案例,大会设立9大专题、1场技术培训,超过50场技术分享,近400位来自教育、视频会议、社交、游戏、电商、安防、金融、物联网等行业的工程师、技术负责人以及高端行业用户、产品与项目负责人、分析师、投资人、媒体人齐
Stella981 Stella981
3年前
Kubernetes 下零信任安全架构分析
作者杨宁(麟童)阿里云基础产品事业部高级安全专家刘梓溪(寞白)蚂蚁金服大安全基础安全安全专家李婷婷(鸿杉)蚂蚁金服大安全基础安全资深安全专家简介零信任安全最早由著名研究机构Forrester的首席分析师约翰.金德维格在2010年提出。零信任安全针对传统边界安全架构思想进行了重新评估和审视,并对安全架构思路给出了新的建议。
Stella981 Stella981
3年前
PostgreSQL数据库透明数据加密概述
最近一段时间,一直在和PostgreSQL社区合作开发TDE(Transparentdataencryption,透明数据加密)。研究了一些密码学相关的知识,并利用这些知识和数据库相结合。本文将会以数据库内核开发角度,从以下3个维度和大家讲述TDE。1.数据库当前面临的威胁模型2.加密策略描述,当前PostgreSQL社区目前的设计状态以及
Wesley13 Wesley13
3年前
mysql树状数据的数据库设计
0树状数据的分类我们在mysql数据库设计的时候,会遇到一种树状的数据.如公司下面分开数个部门,部门下面又各自分开数个科室,以此形成树状的数据.关于树状的数据,按层级数大致可分为一下两类:分类特点固定数量层级层级数量固定,每一层级都有各自的意义,如集团分公司部门科室,省市区等可变数量层级层级数量不固定,前几层级
Easter79 Easter79
3年前
Tensorflow.cifar_数据下载过程(数据输出)
1、环境:Win7x64、python3.7x64、tensorflow1.14、CPUi59400F2、3、 3.1、cifar10,没有数据,全新下载,下到默认目录(C:\\Users\\Administrator\\tensorflow\_datasets),全过程控制台输出:(20190903)"C:\ProgramF
“翼”马当先!混合云价值影响力领导者!
3月22日,由中国信息通信研究院、中国通信标准化协会、弗若斯特沙利文联合主办的“2024云计算价值影响力矩阵发布会暨产业分析师闭门会”在京召开。面对新形势下的产业发展动向,业界专家和企业代表进行了深入探讨和分享。中国电信天翼云资深研发专家刘超发表题为《国云数字化底座助力数字经济高质量发展》的演讲,分享了在大模型和国产化的时代背景下,天翼云以全栈云服务和能力体系赋能行业、助推数字经济发展的成功经验。