最近有人私信我,说postgresql 没有希望,好吧, 其实我倒是觉得,与其说他没有希望,不如好好的了解他后,在说出点什么,而不是人云亦云,然后就么有希望,在我的印象里面 MYSQL 10年前也有人和我说这样的话,当时我没听,就上车了,然后就开车到了现在。
其实 Postgresql 和别的数据库还真有点不一样,他和操作系统本身绑定的比较紧,所以postgresql 的系统内核参数、共享内存和信号量,kernel parameters, shared memory, and semaphores。
系统中的进程可以是独立的,也可以是协作的。独立的自然是没有什么好说的,但如果是协作则必然这个进程会受到其他进程的影响。进程间的通信则变得异常的重要,Linux内核提供了不同类型的IPC机制,PostgreSQL使用System V和POSIX IPC机制。其中这些机制包含了
- 共享内存允许进程共享它们的部分虚拟地址空间。
2. 信号量允许进程同步执行。
3.消息允许进程向任意进程发送格式化的数据流。
PostgreSQL要求操作系统提供进程间通信(IPC)特性,特别是共享内存和信号量。
进程之间的信息的共享是可以通过共享内存段来进行的,对于新的进程请求,内核将创建一个共享内存段,并将其映射到请求进程的地址空间的数据段。当一个进程的数据需要与另一个进程共享时,第一个进程只需将数据写入共享内存段。一旦写入,数据就可用于第二个进程。POSIX共享内存文件是由安装在/dev/shm.上的tmpfs文件系统提供的。信号量在IPC系统中起着同步工具的作用,通过它我们可以确保一个临界区被进程通过互斥的方式访问。通过一个变量或抽象数据类型,用于控制进程间通信中多个进程对公共资源的访问。
PostgreSQL将缓存块保存在称为“共享缓冲区”的内存区域,并在多个后端进程之间共享。PostgreSQL实例使用的共享缓冲区由System V共享内存或POSIX配置。当使用System V信号量时,PostgreSQL为每个允许连接(max_connections)、允许自动真空辅助进程(autovacuum worker进程)和允许后台进程(max_worker_processes)使用一个信号量,每组16个。
每个这样的集合还将包含一个包含第17个信号量,用来检测与其他应用程序使用的信号量集合的冲突。
所以作为系统的共享的内存的设置,对于POSTGRESQL 所在的服务器是比较重要的。参数SEMMNI决定了系统上可以同时存在的信号量集的数量限制。因此,这个参数必须至少是ceil((max_connections + autovacuum+ max_workers + max_worker_processes + 5) / 16)。如果 SEMMNI 参数设置的量小,问题通常用semget函数的“No space left on device”来显示。
sysctl -a | grep -i "kernel.shm"
下图是一些系统的参数的介绍和一些配置的建议
本文分享自微信公众号 - AustinDatabases(AustinDatabases)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。