PostgreSQL及中国用户会简介

主讲人李元佳 galy

数据库分类

商业数据库: Oracle, DB2, SQLserver, Sybase… 开源数据库: MySQL, PostgreSQL, Firebird, SQLite, Apache Derby…

PostgreSQL沿革

类BSD许可的，面向对象的，关系型数据库管理系统。

MIT –> Ingres –> Postgres –> PostgreSQL ( 同源的还有SQLserver等 )

支持SQL2008标准的大部分功能特性，是各种RDBMS的SQL方言中最贴近标准的。

PostgreSQL简介

主讲人萧少聪 Scott.Siu

用户与进程

postgreSQL中用户与进程的联系

注意在上图中，不管是workmem还是sharebuffer，每个page都是8KB大小。

复制流程

stream replica的流程如下：

client --> postgres --> WAL (not file)--> slave --> (return OK) --> master --> commit

在master上的流程细节如下：

client --> write-ahead log(WAL) buffer --> commit --> (async/fsync~~160%) --> WAL Files (16MB * 132个)
   ^
   |--> share buffer  --> bgwriter --> db files
             ^                            |
             |--        check point     <-- ## 安装

linux: 注意使用独立的非root用户来安装启动pgsql。在version9.1后，可以跟SElinux结合使用，提高安全性。
win: 只能在NTFS文件系统上创建表空间。
窗口统一式安装，可以方便的安装stack builder套件。

/opt/PostgreSQL/9.1/
    |
    |--> bin/
    |--> doc/
    |--> include/
    |--> lib/
    |--> share/
    |--> install/
    |--> data/
           |--> base/		存放table和index的ID号
           |--> global/
           |--> pg_clog/	运行日志
           |--> pg_xlog/	WAL日志
           |--> pg_tblspc/	表空间ID，实质为到真实数据目录的软连接
           |--> postgresql.conf
           |--> pg_hba.conf

创建

使用bin/initdb命令；
修改data/pg_hba.conf里的连接地址段和登录权限；
修改data/postgresql.conf里的监听网卡。

启动与停止

使用bin/pg_ctl命令。其停止命令可指定三种类型：

smart模式，即等待全部client连接断开后停止；
fast模式，即直接回滚全部尚未完成的事务后停止；
immediate模式，即立刻中止全部进程。

配置说明

work_mem:
并不是每个client连接的postgres进程分配一个work mem，而是SQL每一次的排序work使用一个work mem。包括join和order by。如果没有排序，就不用work mem。如果一条sql里同时使用了N次排序，那么就要使用N个work mem。所以理想的使用方法不是提供太大的work mem来排序，而是尽量缩小需要排序的数据大小，设置为4/8MB即可。
该配置是可以online修改的。命令如下：
SET work_mem = 2048; SET work_mem = ‘2MB’; 上面两条命令等价。可以看书其计量单位为1KB，且类型为字符串，所以在自定义计量时需要用引号。
share_buffers:
理论上为机器物理内存的40%大小。实际测试显示大于8GB后，性能不会有相应的提升，即可认为最大设置到8GB。
temp_buffers:
无修改意义
max_prepared_transactions:
并发事务数
maintenance_work_mem:
vacuum、create index、alter table add foreign key等管理命令使用的work_mem，建议设置1G。因为这些命令经常涉及全表扫描。

postgreSQL的数据集概念

                      DataBase Cluster
                             |
                   |---------|---------|
                   |         |         |
                 user     database   tablespace
                             |
                           schema

这里的cluster不是HA cluster，而是数据集。
一个database里可以有多个schema，一个user可以有多个schema的管理权限，但一个schema只能归属于一个user。
默认有一个template0为schema的基础，不可修改，在template0基础上有template1，可以修改。实际创建schema时就是复制template1出来。创建user时，一般都会再创建一个同名的schema，并规定该schema的所属人为该user。这样在pgsql连接到database后，其默认schema即为该同名schema。

备份与恢复

备份

pg_dump命令，使用-s指定只备份数据结构，-t指定只备份数据内容。

基于时间点的备份恢复

select pg_start_backup(‘FullBackup’);
tar zcvf full_backup/week1.tgz /opt/PostgreSQL/9.1/data/
select pg_stop_backup();
tar zxvf full_backup/week1.tgz -C /
echo ‘restore_command=”cp %f %p”’ > data/recovery.conf

PostgreSQL中国用户会DBA2000培训计划北京第一课笔记