PostgreSQL
PostgreSQL
PG简介
PostgreSQL 是一个免费的对象-关系数据库服务器(ORDBMS),在灵活的BSD许可证下发行。
PostgreSQL 开发者把它念作 post-gress-Q-L。
PostgreSQL 的 Slogan 是 “世界上最先进的开源关系型数据库”。
“开源界的Oracle”,去O首选。
PostgreSQL官网
PostgreSQL中文社区
http://www.postgres.cn/v2/home
全球数据库排行
国产数据库排行
PG的历史
PostgreSQL最初设想于1986年,当时被叫做Berkley Postgres Project。
该项目一直到1994年都处于演进和修改中,直到开发人员Andrew Yu和Jolly Chen在Postgres中添加了一个SQL(Structured Query Language,结构化查询语言)翻译程序,该版本叫做Postgres95,在开放源代码社区发放。
开始以社区的形式运作。
1996年,再次对Postgres95做了较大的改动,并将其作为PostgresSQL6.0版发布。该版本的Postgres提高了后端的速度,包括增强型SQL92标准以及重要的后端特性(包括子选择、默认值、约束和触发器)。
2005年,发布8.0版本,开始支持windows系统环境
PostgreSQL 9.0 :支持64位windows系统,异步流数据复制、Hot Standby;
PostgreSQL 9.1 :支持数据同步复制,unlogged tabels、serializable snapshot isolation、FDW 外部表。
此版本后,PostgreSQL 开始得到中国多个行业用户的关注,开始有应用于电信、保险、制造业等边缘系统。
目前生产环境主流的版本是PostgreSQL 12。
2021-09-30,PostgreSQL全球开发组宣布,功能最为强大的开源数据库,PostgreSQL 14版本正式发布!
开源许可独特性
PG是纯社区的。
(Postgres遵守BSD许可证发行)却使开发者们得以获取源代码并进一步开发系统。
BSD许可协议(英语:Berkeley Software Distribution license)是自由软件中使用最广泛的许可协议之一。BSD就是遵照这个许可证来发布,也因此而得名 BSD许可协议。
众所周知,MySQL被Oracle所控制,MySQL同时使用了GPL和一种商业许可(称为双重许可)。
GPL(General Public license)是公共许可,遵循了GPL的软件是公共的。如果某软件使用了GPL软件,那么该软件也需要开源,如果不开源,就不能使用GPL软件,这和是否把该软件商用与否是没关系的。
如果无法满足GPL,就需要获得商业许可,通过与Oracle公司联系,制定解决方案,受Oracle公司约束。
同为开源软件,PostgreSQL源码使用自由友好、商业应用不受任何公司实体所控制,而MySQL则在一定程度上有所限制。
与MySQL对比
PostgreSQL相对于MySQL的优势
- 在SQL的标准实现上要比MySQL完善,而且功能实现比较严谨。
- 对表连接支持较完整,优化器的功能较完整,支持的索引类型很多,复杂查询能力较强。
- PG主表采用堆表存放,MySQL采用索引组织表,能够支持比MySQL更大的数据量。
- PG的主备复制属于物理复制,相对于MySQL基于binlog的逻辑复制,数据的一致性更加可靠,复制性能更高,对主机性能的影响也更小。
- PostgreSQL支持JSON和其他NoSQL功能,如本机XML支持和使用HSTORE的键值对。它还支持索引JSON数据以加快访问速度,特别是10版本JSONB更是强大。
- PostgreSQL完全免费,而且是BSD协议,如果你把PostgreSQL改一改,然后再拿去卖钱,也没有人管你,这一点很重要,这表明了PostgreSQL数据库不会被其它公司控制。相反,MySQL现在主要是被Oracle公司控制。
MySQL相对于PG的优势
innodb的基于回滚段实现的MVCC机制,相对PG新老数据一起存放的基于XID的MVCC机制,是占优的。新老数据一起存放,需要定时触 发VACUUM,会带来多余的IO和数据库对象加锁开销,引起数据库整体的并发能力下降。而且VACUUM清理不及时,还可能会引发数据膨胀。
MySQL采用索引组织表,这种存储方式非常适合基于主键匹配的查询、删改操作,但是对表结构设计存在约束。
MySQL的优化器较简单,系统表、运算符、数据类型的实现都很精简,非常适合简单的查询操作。
MySQL相对于PG在国内的流行度更高,PG在国内显得就有些落寞了。
MySQL的存储引擎插件化机制,使得它的应用场景更加广泛,比如除了innodb适合事务处理场景外,myisam适合静态数据的查询场景。
总结
从应用场景来说,PG更加适合严格的企业应用场景(比如金融、电信、ERP、CRM),但不仅仅限制于此,PostgreSQL的json,jsonb,hstore等数据格式,特别适用于一些大数据格式的分析;而MySQL更加适合业务逻辑相对简单、数据可靠性要求较低的互联网场景(比如google、facebook、alibaba),当然现在MySQL的在innodb引擎的大力发展,功能表现良好。
安装PostgreSQL
下载安装
访问官网下载地址
https://www.postgresql.org/download/
.png)
可以看到第4步的安装步骤命令:
1 | 导入yum源 |
修改postgres账号密码
PostgreSQL安装成功之后,会默认创建一个名为postgres的Linux用户,初始化数据库后,会有名为postgres的数据库,来存储数据库的基础信息,例如用户信息等等,相当于MySQL中默认的名为mysql数据库。
postgres数据库中会初始化一名超级用户postgres
为了方便我们使用postgres账号进行管理,我们可以修改该账号的密码。
1 | 通过su命令切换linux用户为postgres会自动进入命令行 |
配置远程访问
1、linux开放5432端口
1 | sudo firewall-cmd --add-port=5432/tcp --permanent |
2、修改IP绑定
1 | 修改配置文件 |
3、允许所有IP访问
1 | 修改配置文件 |
4、重启PostgreSQL服务
1 | 重启PostgreSQL服务 |
PostgreSQL命令行
登录
1 | psql -h IP地址 -U 用户名 -d 数据库 -p 端口地址 // -U 是大写 |
数据库操作
1 | 创建数据库 |
数据库表操作
数据类型
创建表格时每列都必须使用数据类型。PotgreSQL中主要有三类数据类型:
- 数值数据类型
- 字符串数据类型
- 日期/时间数据类型
常见数值类型包括:
名字 | 存储长度 | 描述 | 范围 |
---|---|---|---|
smallint | 2 字节 | 小范围整数 | -32768 到 +32767 |
integer | 4 字节 | 常用的整数 | -2147483648 到 +2147483647 |
bigint | 8 字节 | 大范围整数 | -9223372036854775808 到 +9223372036854775807 |
decimal | 可变长 | 用户指定的精度,精确 | 小数点前 131072 位;小数点后 16383 位 |
numeric | 可变长 | 用户指定的精度,精确 | 小数点前 131072 位;小数点后 16383 位 |
real | 4 字节 | 可变精度,不精确 | 6 位十进制数字精度 |
double | 8 字节 | 可变精度,不精确 | 15 位十进制数字精度 |
字符串字符串类型包括:
- char(size),character(size):固定长度字符串,size 规定了需存储的字符数,由右边的空格补齐;
- varchar(size),character varying(size):可变长度字符串,size 规定了需存储的字符数;
- text:可变长度字符串。
日期/时间:
表示日期或时间的数据类型有:
- timestamp:日期和时间;
- date:日期,无时间;
- time:时间;
其他数据类型类型还有布尔值 boolean (true 或 false),货币数额 money 和几何数据等。
表操作
1 | 创建表 |
主键自增
PostgreSQL 使用序列来标识字段的自增长,数据类型有 smallserial、serial 和 bigserial 。这些属性类似于 MySQL 数据库支持的 AUTO_INCREMENT 属性。
SMALLSERIAL、SERIAL 和 BIGSERIAL 范围:
伪类型 | 存储大小 | 范围 |
---|---|---|
SMALLSERIAL |
2字节 | 1 到 32,767 |
SERIAL |
4字节 | 1 到 2,147,483,647 |
BIGSERIAL |
8字节 | 1 到 922,337,2036,854,775,807 |
示例
1 | 创建表 |
Schema模式
PostgreSQL 模式(SCHEMA)可以看着是一个表的集合。
一个模式可以包含视图、索引、数据类型、函数和操作符等。
相同的对象名称可以被用于不同的模式中而不会出现冲突,例如 schema1 和 myschema 都可以包含名为 mytable 的表。
使用模式的优势:
允许多个用户使用一个数据库并且不会互相干扰。
将数据库对象组织成逻辑组以便更容易管理。
第三方应用的对象可以放在独立的模式中,这样它们就不会与其他对象的名称发生冲突。
模式类似于操作系统层的目录,但是模式不能嵌套。
1 | 创建schema: |
备份PostgreSQL
如果您在生产环境中使用PostgreSQL,请务必采取预防措施以确保用户的数据不会丢失。
备份和恢复单数据库
备份
PostgreSQL提供了pg_dump
实用程序来简化备份单个数据库的过程。 必须以对要备份的数据库具有读取权限的用户身份运行此命令。
1、以postgres
用户身份登录:sudo su - postgres
2、通过运行以下命令将数据库的内容转储到文件中。替换dbname
为要备份的数据库的名称:
1 | pg_dump dbname > dbname.bak |
生成的备份文件dbname.bak
可以使用scp
传输到另一台主机,也可以存储在本地以供以后使用。
恢复
要演示恢复丢失的数据,请删除示例数据库并在其位置创建一个空数据库。
使用psql
恢复数据库:
1 | psql test < dbname.bak |
备份格式有几种选择:
*.bak
:压缩二进制格式*.sql
:明文转储*.tar
:tarball
注意:默认情况下,PostgreSQL将忽略备份过程中发生的任何错误。这可能导致备份不完整。要防止这种情况,您可以使用-1
选项运行pg_dump
命令。 这会将整个备份过程视为单个事务,这将在发生错误时阻止部分备份。
备份和恢复所有数据库
由于pg_dump
一次只创建一个数据库的备份,因此它不会存储有关数据库角色或其他群集范围配置的信息。 要存储此信息并同时备份所有数据库,可以使用pg_dumpall
。
创建备份文件:
1 | pg_dumpall > pg_backup.bak |
从备份还原所有数据库:
1 | psql -f pg_backup.bak postgres |
示例:
1 | 备份数据库 |
用户操作
命令行用户操作:
1 | 创建用户并设置密码 |
角色操作
在PostgreSQL 里没有区分用户和角色的概念,”CREATE USER” 为 “CREATE ROLE” 的别名,这两个命令几乎是完全相同的,唯一的区别是”CREATE USER” 命令创建的用户默认带有LOGIN属性,而”CREATE ROLE” 命令创建的用户默认不带LOGIN属性。
角色属性:
属性 | 说明 |
---|---|
login | 只有具有 LOGIN 属性的角色可以用做数据库连接的初始角色名。 |
superuser | 数据库超级用户 |
createdb | 创建数据库权限 |
createrole | 允许其创建或删除其他普通的用户角色(超级用户除外) |
replication | 做流复制的时候用到的一个用户属性,一般单独设定。 |
password | 在登录时要求指定密码时才会起作用,比如md5或者password模式,跟客户端的连接认证方式有关 |
inherit | 用户组对组员的一个继承标志,成员可以继承用户组的权限特性 |
创建用户时赋予角色属性
如果要在创建角色时就赋予角色一些属性,可以使用下面的方法。
首先切换到postgres 用户。
创建角色bella 并赋予其CREATEDB 的权限。
1 | postgres=# CREATE ROLE bella CREATEDB ; |
创建角色renee 并赋予其创建数据库及带有密码登录的属性。
1 | postgres=# CREATE ROLE renee CREATEDB PASSWORD 'abc123' LOGIN; |
给已存在用户赋予各种权限
赋予登录权限
1 | postgres=# ALTER ROLE bella WITH LOGIN; |
赋予renee 创建角色的权限
1 | postgres=# ALTER ROLE renee WITH CREATEROLE; |
控制台常用命令总结
1 | 设置密码 |