前言
MongoDB是由C++语言编写的非关系型数据库,是一个基于分布式文件存储的开源数据库系统,其内容存储形式类似JSON对象,非常适合 JSON 数据存储,故受到广大爬虫程序员的青睐。现在,我们就来看看Python3下MongoDB的存储操作。
准备工作
请确保已经安装好了MongoDB并启动了服务。可以参考https://www.helloworld.net/p/2e9Jf76hvgFAD 请确保安装了python,若不会,请www.baidu.com
开始
Python想要操作MongoDB需要 MongoDB 驱动,这里我们使用 pymongo 驱动来连接. ::: warning 以下每一步操作都是基于前一步完成的 :::
安装pymongo
这里我们使用pip来安装
> pip install pymongo
出现上图说明安装成功,这里我使用的时豆瓣的pip源比较快,若问如何换pip源请www.baidu.com
连接MongoDB
#简单的无密码连接
> import pymongo
> mongo_client = pymongo.MongoClient('127.0.0.1', 27017)
#有密码连接
import pymongo
mongo_client = pymongo.MongoClient('127.0.0.1', 26666)
mongo_auth = mongo_client.admin #或 mongo_client['admin'] admin为authenticationDatabase
mongo_auth.authenticate('用户名', '密码')
判断是否连接成功
>print(mongo_client.server_info()) #判断是否连接成功
创建数据库
创建数据库需要使用 MongoClient 对象,上一步我们已经连接了MongoDB并创建了MongoClient 对象mongo_client,所以直接使用mongo_client创建数据库。
#创建一个名为“testdb”的数据库
> mydb = mongo_client['testdb']
::: warning 在 MongoDB 中,数据库只有在内容插入后才会创建! 就是说,数据库创建后要创建集合(数据表)并插入一个文档(记录),数据库才会真正创建。 :::
判断数据库是否已存在
dblist = mongo_client.list_database_names()
if "testdb" in dblist:
print("数据库已存在!")
创建集合(表)
MongoDB 中的集合类似 SQL 的表。
#创建一个名为“testcol”的集合
> mycol=mydb["testcol"]
CURD操作
1、插入单条数据 insert_one()
mydict = { "name": "Immortal", "age": "28","sex":"man"}
mycol.insert_one(mydict)
执行输出结果为:
<pymongo.results.InsertOneResult object at 0x00000225C0FEBB48>
2、插入多条数据 insert_many()
info1 = { "name": "Jhon", "age": "28","sex":"man"}
info2 = { "name": "zhangsan", "age": "29","sex":"man"}
insert_list = [info1, info2]
mycol.insert_many(insert_list)
3、删除一条数据 delete_one() delete_one() 方法来删除一个文档,该方法第一个参数为查询对象,指定要删除哪些数据。
#删除 name 字段值为 "Jhon" 的文档
> mycol.delete_one({"name":"Jhon"})
4、删除多条数据 delete_many()
#删除 name 字段值为 "Jhon" 的所有文档
> mycol.delete_many({"name":"Jhon"})
::: warning delete_many() 方法如果传入的是一个空的查询对象,则会删除集合中的所有文档 ::: 5、删除集合(表)drop()
> mycol.drop()
6、修改一条数据update_one() update_one()方法可以这样理解:update_one({查询条件},{更新内容});
> mycol.update_one({"name":"Jhon"},{"$set":{"name":"zhangsan"}})
7、修改多条数据update_many()
#查找所有以 z 开头的 name 字段,并将匹配到所有记录的 age 字段修改为 123
> mycol.update_many({"name":{"$regex":"^z" }}, {"$set":{"age":"123"}})
8、查询一条数据find_one()
> mycol.find_one()
9、查询集合中所有数据
> for x in mycol.find():
> print(x)
10、查询指定字段的数据 我们可以使用 find() 方法来查询指定字段的数据,将要返回的字段对应值设置为 1。
> for x in mycol.find({},{ "_id": 0, "name": 1, "age": 1 }):
> print(x)
11、根据指定条件查询
> for x in mycol.find({ "name": "zhangsan" }):
> print(x)
12、返回指定条数记录
> for x in mycol.find().limit(3):
> print(x)
结束
此文大量参考:https://zhuanlan.zhihu.com/p/51171906以及https://www.runoob.com/python3/python-mongodb.html