Wesley13 Wesley13
3年前
11张图了解HDFS的架构设计
HDFS介绍HDFS是一个适合部署在廉价机器上的,具有高度容错性的,高吞吐量的分布式文件系统。HDFS的设计理念支持超大规模数据集运行在HDFS上的应用具有很大的数据集。HDFS上的一个典型文件大小一般都在G字节至T字节。因此,HDFS被设计成支持大文件存储,能在一个集群里扩展到
Stella981 Stella981
3年前
SparkML(1)环境构建
工欲善其事必先利其器,我们先搭建好我们的开发环境。安装配置好Docker首先,我们需要Docker。毕竟我们的重点并不是在安装配置spark上面,怎么简便,怎么做是最好的啦。不过为了适用尽量多的场景,我们会配置一个单机集群,同时配置Pycharm远程调试。安装Docker的步骤,网上已经有很多了,我们这里贴一个基于Cent
Stella981 Stella981
3年前
Spring Cloud Spring Boot mybatis分布式微服务云架构(四十六)使用RabbitMQ(1)
MessageBroker与AMQP简介MessageBroker是一种消息验证、传输、路由的架构模式,其设计目标主要应用于下面这些场景:消息路由到一个或多个目的地消息转化为其他的表现方式执行消息的聚集、消息的分解,并将结果发送到他们的目的地,然后重新组合相应返回给消息用户
Stella981 Stella981
3年前
OPPO百万级高并发mongodb集群性能数十倍提升优化实践(下篇)
 mongodb内核、wiredtiger存储引擎、rocksdb存储引擎相关源码分析详见(后续持续更新):https://github.com/y123456yz/readingandannotatemongodb3.6.1(https://www.oschina.net/action/GoToLink?urlhttps%3A%2F%2
Stella981 Stella981
3年前
ASP.NET Core应用程序容器化、持续集成与Kubernetes集群部署(二)
在上文中(https://www.oschina.net/action/GoToLink?urlhttps%3A%2F%2Fsunnycoding.cn%2F2018%2F10%2F07%2Fdockerizeaspnetcorecicdwithazuredevopsandkubernetespart1%2F)我介绍了ASP.NET
Stella981 Stella981
3年前
Kubernetes YAML最佳实践和策略
Kubernetes工作负载最常用YAML格式的文件来定义。YAML的问题之一就是很难描述清单文件之间的约束或关系。如果你希望检查是否已从受信任的注册表中提取部署到群集中的所有映像,该怎么办?如何防止没有Pod安全策略的工作负载提交到集群?集成静态检查可以在更接近开发生命周期的时间内捕获错误和违反策略的行为。并且由于改善了资源定义
Stella981 Stella981
3年前
Kubernetes Pod OOM 排查日记
一、发现问题在一次系统上线后,我们发现某几个节点在长时间运行后会出现内存持续飙升的问题,导致的结果就是Kubernetes集群的这个节点会把所在的Pod进行驱逐OOM;如果调度到同样问题的节点上,也会出现Pod一直起不来的问题。我们尝试了杀死Pod后手动调度的办法(label),当然也可以排除调度节点。但是在一段时间后还会复现,我们通过监控
Stella981 Stella981
3年前
Gru:一个单节点支持10W+的长连接集群解决方案
Github项目名称为Gru,取自《卑鄙的我》项目地址:https://github.com/sumory/gru(https://www.oschina.net/action/GoToLink?urlhttps%3A%2F%2Fgithub.com%2Fsumory%2Fgru)示例webchat:https://git
Stella981 Stella981
3年前
Redis官网——如何利用Redis做服务器集群的分布式锁
链接:http://redis.io/topics/distlock(https://www.oschina.net/action/GoToLink?urlhttp%3A%2F%2Fredis.io%2Ftopics%2Fdistlock)原理很简单,一段时间内轮询加锁的key重点,不同语言的开源实现Beforedescribingth
天翼云完成首个国产化万卡训练,MFU达到国内领先水平!
天翼云自研国内首个单集群万卡国产化全功能预训练云服务平台发布上线,并完成万卡规模Llama3.1405B大模型训练。Llama3.1405B作为4000亿参数的模型,在息壤训推服务平台的支持下经过多轮优化,MFU达到国内领先水平;另外,700亿参数模型Llama270B在万卡规模下完成训练,MFU也处于业界领先水平。