介绍
SQLAlchemy是一个基于Python实现的ORM框架。该框架建立在 DB API之上,使用关系对象映射进行数据库操作,简言之便是:将类和对象转换成SQL,然后使用数据API执行SQL并获取执行结果,并把获取的结果转为python对象。其中发sql到mysql服务器,从mysql服务器拿结果都是借助其他工具来完成的,例如pymysql.
- Engine,框架的引擎
- Connection Pooling ,数据库连接池
- Dialect,选择连接数据库的DB API种类
- Schema/Types,架构和类型
- SQL Exprression Language,SQL表达式语言
SQLAlchemy本身无法操作数据库,其必须以来pymsql等第三方插件,Dialect用于和数据API进行交流,根据配置文件的不同调用不同的数据库API,从而实现对数据库的操作,如:
MySQL-Python
mysql+mysqldb://<user>:<password>@<host>[:<port>]/<dbname>
pymysql
mysql+pymysql://<username>:<password>@<host>/<dbname>[?<options>]
MySQL-Connector
mysql+mysqlconnector://<user>:<password>@<host>[:<port>]/<dbname>
cx_Oracle
oracle+cx_oracle://user:pass@host:port/dbname[?key=value&key=value...]
更多:http://docs.sqlalchemy.org/en/latest/dialects/index.html
单表
单表的创建
import datetime
import time
from sqlalchemy.ext.declarative import declarative_base
from sqlalchemy import create_engine
from sqlalchemy import Column
from sqlalchemy import Integer, String, Date
from sqlalchemy.orm import sessionmaker
Base = declarative_base()
engine = create_engine(
"mysql+pymysql://root:123456@127.0.0.1:3306/test?charset=utf8",
encoding='utf8',
max_overflow=0,
pool_size=5,
pool_timeout=20,
pool_recycle=-1
)
class User(Base):
# __tablename__ 字段必须有,否则会报错
__tablename__ = 'user'
# 不同于django model 会自动加主键,sqlalchemy需要手动加主键
id = Column(Integer, primary_key=True)
name = Column(String(32), nullable=False)
# 时间类型的default的默认值需要使用datetime.date.today(), 但是使用flask-sqlalchemy的时候使用datetime.date.today
date = Column(Date, default=datetime.date.today())
def create_table():
# 创建所有的表,表如果存在也不会重复创建,只会创建新的表,而且sqlalchemy默认不支持修改表结构
# 要想和django orm一样能修改表结构并反映到数据库需要借助第三方组件
Base.metadata.create_all(engine)
def drop_table():
# 删除所有的表
Base.metadata.drop_all(engine)
单表的增删改查
# 增加
# user = User(name='jack')
# session.add(user)
# session.commit()
# session.close()
# # 增加多条
# user_list = [User(name='a'), User(name='b'), User(name='c')]
# session.add_all(user_list)
# session.commit()
# 查
# result 是一个列表,里面存放着对象
# result = session.query(User).all()
# for item in result:
# print(item.name)
# 查询最后加all() 得到的是一个存放对象的列表,不加all() 通过print 打印出的是sql语句
# 但是结果仍是一个可迭代的对象,只不过对象的__str__ 返回的是sql语句,迭代的时候里面的对象
# 是一个类元组的对象,可以使用下标取值,也可以通过对象的`.`方式取值
# result = session.query(User.name, User.date).filter(User.id>3)
# for item in result:
# print(item[0], item.date)
# 条件查询
from sqlalchemy import and_, or_,func
## 逻辑查询
r0 = session.query(User).filter(User.id.in_([1, 2]))
r1 = session.query(User).filter(~User.id.in_([1, 2]))
r2 = session.query(User).filter(User.name.startswith('j'), User.id>2)
r3 = session.query(User).filter(
or_(
User.id>3,
and_(User.name=='jack', User.id<2)
)
)
## 通配符
r4 = session.query(User).filter(User.name.like('%j'))
r5 = session.query(User).filter(~User.name.like('%j'))
## limit 和django orm 一样都是通过索引来限制
r6 = session.query(User)[0:4]
## 排序, 排序一般是倒数第二的位置,倒数第一是limit
r7 = session.query(User).order_by(User.id.desc())
## 分组和聚合
r8 = session.query(func.max(User.id)).group_by(User.name).all()
# 改, 得到的结果是收到影响的记录条数
# r9 = session.query(User).filter(User.id==2).update({'name': User.name + User.name.concat('hh')}, synchronize_session=False)
# 删除
session.query(User).delete()
## 子查询
session.query(User).filter(User.id.in_(session.query(User.id).filter(User.name.startswith('j'))))
session.commit()
# 这边的close并不是真实的关闭连接,而是完成终止事务和清除工作
session.close()
连表
两张表
创建表
import datetime
import time
from sqlalchemy.ext.declarative import declarative_base
from sqlalchemy import create_engine
from sqlalchemy import Column
from sqlalchemy import Integer, String, Date
from sqlalchemy import ForeignKey
from sqlalchemy.orm import sessionmaker
Base = declarative_base()
engine = create_engine(
"mysql+pymysql://root:123456@127.0.0.1:3306/test?charset=utf8",
encoding='utf8',
max_overflow=0,
pool_size=5,
pool_timeout=20,
pool_recycle=-1
)
class User(Base):
# __tablename__ 字段必须有,否则会报错
__tablename__ = 'user'
# 不同于django model 会自动加主键,sqlalchemy需要手动加主键
id = Column(Integer, primary_key=True)
name = Column(String(32), nullable=False)
# 时间类型的default的默认值需要使用datetime.date.today(), 但是使用flask-sqlalchemy的时候使用datetime.date.today
date = Column(Date, default=datetime.date.today())
# 因为外键的sh设置更偏向于数据库底层,所以这里使用了表名,而不是类名
depart_id = Column(Integer, ForeignKey('department.id'))
class Department(Base):
__tablename__ = 'department'
id = Column(Integer, primary_key=True)
# 默认的nullable 是True
title = Column(String(32), nullable=False)
查询
# 默认根据在类里面定义的外键进行on, 此时得到的结果是[(userobj, departmnetobj),()] 这种形式,默认是inner join
r1 = session.query(User, Department).join(Department).all()
r2 = session.query(User.name, Department.title).join(Department, Department.id==User.depart_id).all()
# 有了 isouter 参数,inner join 就变成 left join
r3 = session.query(User.name, Department.title).join(Department, Department.id==User.depart_id, isouter=True).all()
relationship
现在问题来了,想要查name是jack所属的部门名,两种方式
分两次sql查询
user = session.query(User).filter(User.name == 'jack').first() title = session.query(Department.title).filter(Department.id == user.depart_id).first().title
一次连表查询
r1 = session.query(Department.title).join(User).filter(User.name == 'jack').first().title print(r1)
这样的方式在python代码的级别貌似没有django的方便,django 的 orm 拿到一个对象obj, obj.deaprtment.title 就能拿到结果。sqlalchemy也有类似功能,通过relationship来实现。
# 注意,导入的是relationship,而不是relationships
from sqlalchemy.orm import relationship
class Department(Base):
__tablename__ = 'department'
id = Column(Integer, primary_key=True)
# 默认的nullable 是True
title = Column(String(32), nullable=False)
# 如果backref 的那张表和这张表是一对一关系,加上一个uselist=False参数就行
user = relationship("User", backref='department')
class User(Base):
# __tablename__ 字段必须有,否则会报错
__tablename__ = 'user'
# 不同于django model 会自动加主键,sqlalchemy需要手动加主键
id = Column(Integer, primary_key=True)
name = Column(String(32), nullable=False)
# 时间类型的default的默认值需要使用datetime.date.today(), 但是使用flask-sqlalchemy的时候使用datetime.date.today
date = Column(Date, default=datetime.date.today())
# 因为外键的sh设置更偏向于数据库底层,所以这里使用了表名,而不是类名
depart_id = Column(Integer, ForeignKey('department.id'))
# 神奇的一点是,SQLAlchemy会根据关系的对应情况自动给关系相关属性的类型
# 比如这里的Department下面的user自动是一个list类型,而User由于设定了外键的缘故
# 一个user最多只能应对一个用户,所以自动识别成一个非列表类型
# 这样写两个relationship比较麻烦,在设置了外键的一边使用relationship,并且加上backref参数
# department = relationship("Department")
session_factory = sessionmaker(engine)
session = session_factory()
user = session.query(User).first()
print(user.department)
department = session.query(Department).first()
print(department.user)
有了relationship,不仅查询方便,增加数据也更方便。
# 增加一个用户ppp,并新建这个用户的部门叫IT
## 方式一
# d = Department(title='IT')
# session.add(d)
# session.commit() # 只有commit之后才能取d的id
#
# session.add(User(name='ppp', depart_id=d.id))
# session.commit()
## 方式二
# session.add(User(name='ppp', department=Department(title='IT')))
# session.commit()
# 增加一个部门xx,并在部门里添加员工:aa/bb/cc
# session.add(Department(title='xx', users=[User(name='aa'), User(name='bb'),User(name='cc')]))
# session.commit()
三张表
创建表
from sqlalchemy.orm import relationship
from sqlalchemy.ext.declarative import declarative_base
from sqlalchemy import create_engine
from sqlalchemy import Column
from sqlalchemy import Integer, String, Date
from sqlalchemy import ForeignKey, UniqueConstraint, Index
class Student(Base):
__tablename__ = 'student'
id = Column(Integer, primary_key=True)
name = Column(String(32), index=True, nullable=False)
course_list = relationship('Course', secondary='student2course', backref='student_list')
class Course(Base):
__tablename__ = 'course'
id = Column(Integer, primary_key=True)
title = Column(String(32), index=True, nullable=False)
class Student2Course(Base):
__tablename__ = 'student2course'
id = Column(Integer, primary_key=True, autoincrement=True)
student_id = Column(Integer, ForeignKey('student.id'))
course_id = Column(Integer, ForeignKey('course.id'))
__table_args__ = (
UniqueConstraint('student_id', 'course_id', name='uix_stu_cou'), # 联合唯一索引
# Index('student_id', 'course_id', name='stu_cou'), # 联合索引
)
查询
查询方式和只有两张表的情况类似,例如查询jack选择的所有课
# obj = session.query(Student).filter(Student.name=='jack').first()
# for item in obj.course_list:
# print(item.title)
创建一个课程,创建2学生,两个学生选新创建的课程
# obj = Course(title='英语')
# obj.student_list = [Student(name='haha'),Student(name='hehe')]
#
# session.add(obj)
# session.commit()
执行原生sql
方式一
# 查询
# cursor = session.execute('select * from users')
# 拿到的结果是一个ResultProxy对象,ResultProxy对象里套着类元组的对象,这些对象可以通过下标取值,也可以通过对象.属性的方式取值
# result = cursor.fetchall()
# 添加
cursor = session.execute('INSERT( INTO users(name) VALUES(:value)', params={"value": 'wupeiqi'})
session.commit()
print(cursor.lastrowid)
方式二
import pymysql
conn = engine.raw_connection()
cursor = conn.cursor(pymysql.cursors.DictCursor)
cursor.execute(
"select * from user"
)
result = cursor.fetchall()
# 结果是一个列表,列表里面套着的对象就是原生的字典对象
print(result)
cursor.close()
conn.close()
多线程情况下的sqlalchemy
在每个线程内部创建session并关闭session
session_factory = sessionmaker(engine)
def task(i):
# 创建一个会话对象,没错仅仅是创建一个对象这么简单
session = session_factory()
# 执行query语句的时候才会真真去拿连接去执行sql语句,如果没有close那么没有空闲连接就会等待
result = session.execute('select * from user where id=14')
for i in result:
print(i.name)
time.sleep(1)
# 必须要close,这里的close可以理解为关闭会话,把链接放回连接池
# 如果注释掉这一句代码,程序会报错QueuePool limit of size 5 overflow 0 reached, connection timed out, timeout 20
session.close()
if __name__ == '__main__':
for i in range(10):
t = Thread(target=task, args=(i,))
t.start()
结果是每5个一起打印
在全局创建一个特殊的session,各个线程去使用这个特殊的session
from sqlalchemy.orm import scoped_session
session_factory = sessionmaker(engine)
session = scoped_session(session_factory)
def task(i):
result = session.execute('select * from user where id=14')
for i in result:
print(i.name)
time.sleep(1)
session.remove()
if __name__ == '__main__':
for i in range(10):
t = Thread(target=task, args=(i,))
t.start()
scoped_session 这个类还真是神奇,名字竟然还不是大写,而且原先的session有的,这个类实例化的对象也会有。我们第一反应是继承,其实它也不是继承。它的实现原理是这样的 执行导入语句的from sqlalchemy.orm import scoped_session
的时候,点进去看源码发现执行了一个scoping.py的文件。
最终self.registry()就是session_factory() 对象,而且是线程隔离的,每个线程有自己的会话对象