Stella981 Stella981
3年前
Spark Graphx
Graphx   概述      SparkGraphX是一个分布式图处理框架,它是基于Spark平台提供对图计算和图挖掘简洁易用的而丰富的接口,极大的方便了对分布式图处理的需求。      众所周知·,社交网络中人与人之间有很多关系链,例如Twitter、Facebook、微博和微信等,这些都是大数据产生的地方都需要图计算,现
Stella981 Stella981
3年前
Excel中的xls、xlsx、xlsm混合文件,看我用Python如何统一处理......
点击上方“Python爬虫与数据挖掘”,进行关注回复“书籍”即可获赠Python从入门到进阶共10本电子书今日鸡汤洞房昨夜停红烛,待晓堂前拜舅姑。引言Python语言,近几年在办公自动化这一领域来说,真的超级火爆!用它做批量处理确实比VBA要方便很多。前面的文章,我们已经讲述了如何将do
Wesley13 Wesley13
3年前
DTCC2019第十届中国数据库技术大会将于5月在北京召开
作为国内顶级的数据领域技术盛会,10年来,DTCC见证了国内数据库技术的迅猛发展,各种分布式数据库、NoSQL、NewSQL技术异军突起,与Oracle、DB2等分庭抗礼,甚至大有超越之势。在这种背景下,ITPUB将组织历时半年的数据领域评选活动,向大家展现对数据领域起到了重大推动与贡献作用的热点技术、企业与技术专家。会议时间:2019050808
Stella981 Stella981
3年前
Python大数据分析(二):大数据技术基础
文章目录(一)Linux系统和大数据(二)Hadoop(1)Hadoop包含哪些模块?(2)Hadoop的生态成员(3)哪些人在使用Hadoop?(三)Spark(1)Scala(2)RDD(3)主件(四)云计算(1)虚拟化技术
解锁数据潜力,天翼云TeleDB为企业数智蝶变添力赋能!
近日,第15届中国数据库技术大会(DTCC2024)在北京召开。大会以“自研创新数智未来”为主题,重点围绕向量数据库与向量检索技术实践、数据治理与数据资产管理、云原生数据库开发与实践、特定场景下的数据库管理与优化、大数据平台建设等内容展开分享和探讨。天翼云数据库产品线首席技术官李跃森、天翼云资深研发专家胡彬参会,分享了天翼云在数据库领域的产品布局、技术创新与实践应用。
Python进阶者 Python进阶者
2年前
手把手教你使用HttpCanary抓取手机App上的视频
大家好,我是皮皮。前言前几天在Python交流群里边有个叫【A꯭ғ꯭ᴛ꯭ᴇ꯭ʀ꯭ᴀʟʟ.】的粉丝问了一个有趣的问题,他需要抓取某款App上的视频,下图是他的问题。讲真,一开始我也束手无策,不过这次【愚石:专注流量增长数据挖掘】大佬给出了一个方案,以后再也不用担心抓不到视频了,下面一起来看看吧。需求背景现在粉丝想要抓取这款App上的视频数据,这个软件有电
Kubernetes 资源拓扑感知调度优化
作者星辰算力团队,星辰算力平台基于深入优化云原生统一接入和多云调度,加固容器运行态隔离,挖掘技术增量价值,平台承载了腾讯内部的CPU和异构算力服务,是腾讯内部大规模离线作业、资源统一调度平台。背景问题源起近年来,随着腾讯内部自研上云项目的不断发展,越来越多的业务开始使用云原生方式托管自己的工作负载,容器平台的规模因此不断增大。以Kubernetes
四儿 四儿
10个月前
语音数据集:开启智能语音技术的新篇章
随着人工智能技术的飞速发展,语音数据集在推动智能语音技术的进步中发挥着越来越重要的作用。语音数据集是训练和优化语音识别、语音合成等智能语音技术的关键资源,对于提高语音技术的准确性和自然度具有重要意义。一、语音数据集的重要性语音数据集是智能语音技术的基石。通