ElasticSearch深度分页详解
1前言ElasticSearch是一个实时的分布式搜索与分析引擎,常用于大量非结构化数据的存储和快速检索场景,具有很强的扩展性。纵使其有诸多优点,在搜索领域远超关系型数据库,但依然存在与关系型数据库同样的深度分页问题,本文就此问题做一个实践性
一种自平衡解决数据倾斜的分表方法
业界,规则引擎是一个非常普遍的技术类工具,也有很多非常优秀的开源工具,例如Drools等,它是一种嵌入在应用程序中的组件,主要解决易变逻辑和业务耦合的问题,把易变的规则从应用程序代码中分离出来,进而提升交付效率,降低应用程序维护和可扩展性成本
Stella981 Stella981
3年前
Knative Serving 健康检查机制分析
!file(https://oscimg.oschina.net/oscnet/4b90746591cf88fa47712a0755733b4bf2e.jpg)作者|  阿里云智能事业群技术专家牛秋霖(冬岛)导读:从头开发一个Serverless引擎并不是一件容易的事情,今天咱们就从Knative的健康检查说起。通过健康检查这一个点来
Stella981 Stella981
3年前
ClickHouse和他的朋友们(6)MergeTree存储结构
上篇的 存储引擎技术进化与MergeTree(https://www.oschina.net/action/GoToLink?urlhttp%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMjM5NzAzMTY4NQ%3D%3D%26mid%3D2653934789%26idx%3D1%26sn%3D61dcd65a3b
Stella981 Stella981
3年前
Log Structured Merge Trees(LSM) 算法
十年前,谷歌发表了“BigTable”的论文,论文中很多很酷的方面之一就是它所使用的文件组织方式,这个方法更一般的名字叫LogStructuredMergeTree。LSM是当前被用在许多产品的文件结构策略:HBase,Cassandra,LevelDB,SQLite,甚至在mangodb3.0中也带了一个可选的LSM引擎(Wired
Stella981 Stella981
3年前
Selenium及Headless Chrome抓取动态HTML页面
一般的的静态HTML页面可以使用requests等库直接抓取,但还有一部分比较复杂的动态页面,这些页面的DOM是动态生成的,有些还需要用户与其点击互动,这些页面只能使用真实的浏览器引擎动态解析,Selenium和ChromeHeadless可以很好的达到这种目的。HeadlessChromeHeadlessChrome是Chrome
Stella981 Stella981
3年前
Ray,面向新兴AI应用的分布式框架
!(https://oscimg.oschina.net/oscnet/5875203a3c4d4977bf2aeaa6192e053c.png)下一代AI应用需要不断和环境进行交互,并且在交互中学习。这些应用暴露了新的系统需求:性能和弹性。本文提出了Ray解决上述问题。Ray实现了动态执行引擎,可以表达任务并行和actor模型计算任务。
Wesley13 Wesley13
3年前
InnoDB的内存结构和特性
!(https://oscimg.oschina.net/oscnet/e0c94d38fd342397046920668dc6d58aca1.png)常言说得好,每个成功男人背后都有一个为他默默付出的女人,而对于MySQL来说,这个“人”就是InnoDB存储引擎。MySQL区别于其他数据库的最为重要的特点就是其插件式的表存储
Stella981 Stella981
3年前
Flink01
1\.什么是Flink?1.14代大数据计算引擎第一代: MapReducer批处理Mapper,ReducerHadoop的MapReducer将计算分为两个阶段,分别为Map和Reducer.对于上层应用来说,就不得不想方设法去拆分算法,甚至于不得不在上层应用实现多个Job的串联,以完成一个完整
胖大海 胖大海
2年前
Docker容器简介及命令
使用Linux最好还是整个服务器,买太贵了,建议租一个,我用的是3A服务器docker简述Docker是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的镜像中,然后发布到任何流行的Linux或Windows操作系统的