MongoDB 存储引擎说明

Wesley13
• 阅读 857

#MongoDB 存储引擎说明

MongoDB 存储引擎可以插件化(3.0开始提供插件化API),根据不同的场景选择不同的存储引擎,跟Mysql有点类似。 MongoDB 常用存储引擎:WiredTigerMMAPv1In Memory

#MongoDB 存储引擎之WiredTiger

3.2版本开始WiredTiger已经是MongoDB的默认存储引擎。 WiredTiger支持文档级别的锁,检查点(checkpoint),压缩,等功能。企业版支持Rest加密。

##WiredTiger 特性 ####并发模型 WiredTiger带来最显著的改进之一就是锁粒度的细化,它通过MVCC(通过copyOnWrite的方式实现的多版本并发控制)实现了文档级别的锁(多个客户端可以并发的修改一个集合中多个不同的文档),大大提高了并发读写的性能。 ####数据压缩 WiredTiger带来的另一个显著提升是:通过使用高效的压缩算法对数据进行压缩,数据占用磁盘空间大大减少(最大能压缩80%的空间)。 压缩是以CPU计算为代价而减少了存储量,不过相比压缩带来的好处,牺牲这点CPU时间是值得的。 MongoDb支持对所有集合和索引(前缀)进行压缩。默认情况,WiredTiger通过snappy压缩算法对所有集合进行块压缩并对所有索引进行前缀压缩。Journal默认也会压缩。

####内存使用 MongoDB不仅利用WiredTiger内部缓存同时也利用文件系统缓存。在WiredTiger中可以自己指定内部缓存使用大小。 通过文件系统缓存,MongoDB自动使用所有未被WiredTiger缓存使用的或其他进程使用的空闲内存

####Snapshots和Checkpoints WiredTiger通过类似copyOnWrite的方式实现了多版本并发控制(MVCC):在一个操作开始时,WiredTiger会拷贝该时间点的事务数据快照(snapshot)。快照表示的是内存中数据的一份一致性的视图。WiredTiger也会以数据一致的方式将快照中的所有数据写到磁盘所有数据文件中,并且记录一个检查点(checkpoint),这个检查点还可以扮演恢复点(recovery points)的角色,当MongoDB崩溃重启后,MongoDB可以从最后有效的检查点进行恢复。

####Journaling 虽然说checkpoint已经可以用于MongoDB意外情况下的数据恢复,但是在WiredTiger中,Journaling仍然有存在的意义。如果MongoDB在两个checkpoints之间意外退出,只能恢复到上个checkpoint。而上次checkpoint以来的修改,则需要通过Journaling来进行恢复。

#MongoDB 存储引擎之MMAPv1

MMAPv1是MMAP的升级版,是MongoDB官方最初开发的存储引擎。 MMAPv1是3.2版本之前的默认存储引擎。

##MMAPv1特性 ####并发模型 MMAPv1很大一个问题是,锁粒度太粗,这严重影响了高并发下的读写性能。在version < 2.2的时候,只支持进程级别锁,即一个mongod实例一个锁。而2.2<= version < 2.8的时候,支持库级别锁,即一个DB一个锁。3.0 <= version的时候,支持集合级别的锁,即一个collection一个锁。 ####内存使用 MMAPv1存储引擎使用内存映射文件的方式将所有的数据文件映射到内存中(至少要保证热数据(索引,数据及系统其它开销)都能装进内存),然后操作系统会托管所有数据刷新磁盘,以及管理内存页交换。MMAPv1会尽可能的使用系统中的所有空闲内存作为其缓存。 ####Journal MongoDB默认情况下会将所有修改先刷写到一个磁盘上的journal日志文件中,然后再刷写数据文件(刷写journaling相比刷写数据文件更为频繁)。Journaling因为是采用顺序写的方式,减少了随机IO,并且因为数据会先写到这个预写日志中,当MongoDB意外崩溃,重启时可以根据这个journaling文件进行数据恢复。

#MongoDB 存储引擎之In Memory

企业版才支持的存储引擎 默认存储在内存中 推荐在复制集中设置多个In Memory引擎节点+多个WiredTiger引擎的Hide节点存储,Hide节点主要用来做数据热备,保证数据不会丢失。

##In Memory特性 ####并发模型 in-memory存储引擎使用文档级别锁来控制并发写操作,因此,多个客户端可以同时修改集合中不同的文档。

####内存使用 in-memory存储引擎需要将其所有数据(包括索引,oplog如果mongod是副本集的成员的话,等等)保存在内存中。通过–inMemorySizeGB或storage.inMemory.engineConfig.inMemorySizeGB 指定使用的内存大小,而上述的数据必须适合这个大小。否则,当一个写操作导致数据超出了指定的内存大小,MongoDB就会返回错误。

####持久化 因为In-Memory存储引擎将所有数据都保存在内存中(除了一些元数据和诊断数据),所以In-Memory不存在数据刷写到磁盘的流程,因此也没有Journaling之类的机制和日志文件。

####部署架构 如果只是单机部署以In-Memory作为存储引擎的MongoDB,由于数据不会持久化,如果作为数据库来考虑,对于大多数应用来说,这都是无法接受的。好在In-Memory也可以作为副本集或分片集群的一部分。比如,部署2台In-Memory节点作为主从节点,再部署一台WiredTiger作为隐藏的从节点,构成一个副本集,两台In-Memory节点承担业务的读写请求,另外一台WiredTiger则对用户透明,只作为从节点复制数据。这样既保留了In-Memory的低延迟读写特性,又使得数据不至于在In-Memory节点挂掉后彻底丢失。

存储引擎配置

通过mongod启动的时候指定参数--storageEngine或在配置文件中配置storage.engine

对比图解:

MongoDB 存储引擎说明

点赞
收藏
评论区
推荐文章
blmius blmius
3年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
Stella981 Stella981
3年前
MongoDB journal 与 oplog,究竟谁先写入?
MongoDBjournal与oplog,谁先写入?最近经常被人问到,本文主要科普一下MongoDB里oplog以及journal这两个概念。journaljournal是MongoDB存储引擎层的概念,目前MongoDB主要支持mmapv1、wiredtiger、mongorocks等存储引擎,都支持配
Wesley13 Wesley13
3年前
MySQL数据库表设计规范
一、数据库设计1、一般都使用INNODB存储引擎,除非读写比率<1%,才考虑使用MYISAM存储引擎;其他存储引擎请在DBA的建议下使用。2、Storedprocedure(包括存储过程,函数,触发器)对于MYSQL来说还不是很成熟,没有完善的出错记录处理,不建议使用。3、UUID(),USER()这样的
Stella981 Stella981
3年前
OPPO百万级高并发mongodb集群性能数十倍提升优化实践(下篇)
 mongodb内核、wiredtiger存储引擎、rocksdb存储引擎相关源码分析详见(后续持续更新):https://github.com/y123456yz/readingandannotatemongodb3.6.1(https://www.oschina.net/action/GoToLink?urlhttps%3A%2F%2
Stella981 Stella981
3年前
MongoDB(引擎)关于存储引擎 WiredTiger storage engine
WiredTiger(https://www.oschina.net/action/GoToLink?urlhttps%3A%2F%2Flink.jianshu.com%3Ft%3Dhttp%3A%2F%2Fwww.wiredtiger.com%2F)在3.2版本成为mongodb的默认存储引擎。所以这里讲的就是WiredTiger了。Doc
Wesley13 Wesley13
3年前
00:Java简单了解
浅谈Java之概述Java是SUN(StanfordUniversityNetwork),斯坦福大学网络公司)1995年推出的一门高级编程语言。Java是一种面向Internet的编程语言。随着Java技术在web方面的不断成熟,已经成为Web应用程序的首选开发语言。Java是简单易学,完全面向对象,安全可靠,与平台无关的编程语言。
Wesley13 Wesley13
3年前
MongoDB存储引擎、索引 原
wiredTiger    MongoDB从3.0开始引入可插拔存储引擎的概念。目前主要有MMAPV1、WiredTiger存储引擎可供选择。在3.2版本之前MMAPV1是默认的存储引擎,其采用linux操作系统内存映射技术,但一直饱受诟病;3.4以上版本默认的存储引擎是wiredTiger,相对于MMAPV1其有如下优势:读写操作
Wesley13 Wesley13
3年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
Wesley13 Wesley13
3年前
mysql储存引擎
Mysql数据库常用存储引擎数据库存储引擎:是数据库底层软件组织,数据库管理系统(DBMS)使用数据引擎进行创建、查询、更新和删除数据。不同的存储引擎提供不同的存储机制、索引技巧、锁定水平等功能,使用不同的存储引擎,还可以获得特定的功能。现在许多不同的数据库管理系统都支持多种不同的数据引擎。MySQL的核心就是插件式存储引擎。
Python进阶者 Python进阶者
1年前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这