MongoDB
是一个基于分布式文件存储的数据库。由 C++ 语言编写。旨在为 WEB 应用提供可扩展的高性能数据存储解决方案。MongoDB
是一个介于关系数据库和非关系数据库之间
的产品,是非关系数据库当中功能最丰富,最像关系数据库的。 MongoDB 将数据存储为一个文档,数据结构由键值(key=>value)对组成。MongoDB 文档(BSON)类似于 JSON 对象。字段值可以包含其他文档,数组及文档数组。
###前言 NoSQL最普遍的解释是“非关联型的”,强调Key-Value Stores
和文档数据库
的优点,而不是单纯的反对RDBMS。
###关系型数据库
关系型数据库:指采用了`关系模型`来组织数据的数据库。
关系模型指的就是二维表格模型,而一个关系型数据库就是由二维表及其之间的联系所组成的一个数据组织。
关系型数据库的优点:
1. 容易理解:二维表结构是非常贴近逻辑世界的一个概念,关系模型相对网状、层次等其他模型来说更容易理解
2. 使用方便:通用的SQL语言使得操作关系型数据库非常方便
3. 易于维护:丰富的完整性(实体完整性、参照完整性和用户定义的完整性)大大减低了数据冗余和数据不一致的概率
关系型数据库存在的问题:
1. 网站的用户并发性非常高,往往达到每秒上万次读写请求,对于传统关系型数据库来说,硬盘I/O是一个很大的瓶颈
2. 网站每天产生的数据量是巨大的,对于关系型数据库来说,在一张包含海量数据的表中查询,效率是非常低的
3. 在基于web的结构当中,数据库是最难进行横向扩展的,当一个应用系统的用户量和访问量与日俱增的时候,
数据库却没有办法像web server和app server那样简单的通过添加更多的硬件和服务节点来扩展性能和负载能力。
当需要对数据库系统进行升级和扩展时,往往需要停机维护和数据迁移。
4. 性能欠佳:在关系型数据库中,导致性能欠佳的最主要原因是多表的关联查询,以及复杂的数据分析类型的复杂SQL报表查询。
为了保证数据库的ACID特性,必须尽量按照其要求的范式进行设计,关系型数据库中的表都是存储一个格式化的数据结构。
数据库事务必须具备ACID特性:
ACID分别是`Atomic原子性`,`Consistency一致性`,`Isolation隔离性`,`Durability持久性`。
###非关系型数据库
非关系型数据库都是针对某些特定的应用需求出现的,因此,对于该类应用,具有极高的性能。
依据结构化方法以及应用场合的不同,主要分为以下几类:
1. 面向`高性能并发读写`的`key-value数据库`:
key-value数据库的主要特点是具有极高的并发读写性能
Key-value数据库是一种以键值对存储数据的一种数据库,类似Java中的map。
可以将整个数据库理解为一个大的map,每个键都会对应一个唯一的值。
主流代表为Redis, Amazon DynamoDB, Memcached,Microsoft Azure Cosmos DB和Hazelcast
2. 面向`海量数据访问`的`面向文档数据库`:
这类数据库的主要特点是`在海量的数据中可以快速的查询数据`
文档存储通常使用内部表示法,可以直接在应用程序中处理,主要是`JSON`。
JSON文档也可以作为纯文本存储在键值存储或关系数据库系统中。
主流代表为MongoDB,Amazon DynamoDB,Couchbase,Microsoft Azure Cosmos DB和CouchDB
3. 面向搜索数据内容的`搜索引擎`:
搜索引擎是专门用于`搜索数据内容`的NoSQL数据库管理系统。
主要是用于`对海量数据进行近实时的处理和分析处理`,可用于`机器学习和数据挖掘`
主流代表为Elasticsearch,Splunk,Solr,MarkLogic和Sphinx
4. 面向可扩展性的`分布式`数据库(列存储数据库):
这类数据库的主要特点是具有很强的`可拓展性`
普通的关系型数据库都是以行为单位来存储数据的,擅长以行为单位的读入处理,比如特定条件数据的获取。
因此,关系型数据库也被成为面向行的数据库。
相反,面向列的数据库是以列为单位来存储数据的,擅长以列为单位读入数据。
这类数据库想解决的问题就是传统数据库存在可扩展性上的缺陷,
这类数据库可以`适应数据量的增加以及数据结构的变化`,将数据存储在记录中,能够容纳大量动态列。
由于列名和记录键不是固定的,并且由于记录可能有数十亿列,因此可扩展性存储可以看作是二维键值存储。
主流代表为Cassandra,HBase,Microsoft Azure Cosmos DB,Datastax Enterprise和Accumulo
关系型与非关系型数据库的比较
1. 成本:Nosql数据库简单易部署,基本都是开源软件,
不需要像使用Oracle那样花费大量成本购买使用,相比关系型数据库价格便宜。
2. 查询速度:Nosql数据库将数据存储于缓存之中,而且不需要经过SQL层的解析,
关系型数据库将数据存储在硬盘中,自然查询速度远不及Nosql数据库。
3. 存储数据的格式:Nosql的存储格式是key,value形式、文档形式、图片形式等等,
所以可以存储基础类型以及对象或者是集合等各种格式,而数据库则只支持基础类型。
4. 扩展性:关系型数据库有类似join这样的多表查询机制的限制导致扩展很艰难。
Nosql基于键值对,数据之间没有耦合性,所以非常容易水平扩展。
5. 持久存储:Nosql不使用于持久存储,海量数据的持久存储,还是需要关系型数据库
6. 数据一致性:非关系型数据库一般强调的是数据最终一致性,
不像关系型数据库一样强调数据的强一致性,从非关系型数据库中读到的有可能还是处于一个中间态的数据,
Nosql不提供对事务的处理。
MongoDB 基础概念
SQL术语/概念
MongoDB术语/概念
解释/说明
database
database
数据库
table
collection(一张表)
数据库表/集合
row
document(一组数据)
数据记录行/文档
column
field
数据字段/域
index
index
索引
table joins
表连接,MongoDB不支持
primary key
primary key
主键,MongoDB自动将_id字段设置为主键
MongoDB 数据类型
数据类型
描述
String
字符串。存储数据常用的数据类型。在 MongoDB 中,UTF-8 编码的字符串才是合法的。
Integer
整型数值。用于存储数值。根据你所采用的服务器,可分为 32 位或 64 位。
Boolean
布尔值。用于存储布尔值(真/假)。
Double
双精度浮点值。用于存储浮点值。
Min/Max keys
将一个值与 BSON(二进制的 JSON)元素的最低值和最高值相对比。
Array
用于将数组或列表或多个值存储为一个键。
Timestamp
时间戳。记录文档修改或添加的具体时间。
Object
用于内嵌文档。
Null
用于创建空值。
Symbol
符号。该数据类型基本上等同于字符串类型,但不同的是,它一般用于采用特殊符号类型的语言。
Date
日期时间。用 UNIX 时间格式来存储当前日期或时间。你可以指定自己的日期时间:创建 Date 对象,传入年月日信息。
Object ID
对象 ID。用于创建文档的 ID。
Binary Data
二进制数据。用于存储二进制数据。
Code
代码类型。用于在文档中存储 JavaScript 代码。
Regular expression
正则表达式类型。用于存储正则表达式。
基本语法
use 数据库名称 //如果数据库不存在则自动创建
db.集合名称.insert(数据); //插入数据
db.集合名称.find(); //查询全部
db.集合名称.find({name:'aaa'}); //按条件查询
db.集合名称.findOne({name:'aaa'}) //返回指定条件的第一条数据
db.集合名称.find().limit(3) //返回指定条数数据
db.集合名称.update({_id:"1"},{$set:{age:NumberInt(2000)}}) //更新数据
db.集合名称.remove({name:'小明'}) //删除数据
db.集合名称.count({name:"aaa"}) //统计条数
db.集合名称.find({content:/^加班/}) //模糊查询(以'加班'开头的content)
db.集合名称.find({ "field" : { $gt: value }}) // 大于: field > value
db.集合名称.find({ "field" : { $lt: value }}) // 小于: field < value
db.集合名称.find({ "field" : { $gte: value }}) // 大于等于: field >= value
db.集合名称.find({ "field" : { $lte: value }}) // 小于等于: field <= value
db.集合名称.find({ "field" : { $ne: value }}) // 不等于: field != value
db.集合名称.find({userid:{$in:["aaa","bbb"]}}) //包含
db.集合名称.find({userid:{$nin:["aaa","bbb"]}}) //不包含
db.集合名称.find({$and:[ {visits:{$gte:1000}} ,{visits:{$lt:2000} }]}) //条件连接
$or:[ { },{ },{ } ]
db.集合名称.update({_id:"1"},{$inc:{visits:NumberInt(1)}}) //列值增长
Java使用MongoDb
依赖
<dependency>
<groupId>org.mongodb</groupId>
<artifactId>mongodb‐driver</artifactId>
<version>3.6.3</version>
</dependency>
入门
public class MongoDemo {
public static void main(String[] args) {
MongoClient client=new MongoClient("192.168.184.134"); //创建连接
MongoDatabase spitdb = client.getDatabase("spitdb"); //打开数据库
MongoCollection<Document> spit = spitdb.getCollection("spit"); //获取集合
//插入数据
Map<String,Object> map=new HashMap();
map.put("content","我要吐槽");
map.put("userid","aaa");
map.put("visits",123);
map.put("publishtime",new Date());
Document document=new Document(map);
spit.insertOne(document); //插入数据
//查询数据
BasicDBObject bson=new BasicDBObject("userid","aaa");
BasicDBObject bson=new BasicDBObject("visits",newBasicDBObject("$gt",1000) ); //构建查询条件
FindIterable<Document> documents = spit.find(bson); //查询记录获取文档集合
for(Document document:documents){
System.out.println("内容:"+ document.getString("content"));
System.out.println("用户ID:"+document.getString("userid"));
System.out.println("浏览量:"+document.getInteger("visits"));
}
client.close(); //关闭连接
}
}