数据库表连接


数据库表连接

关系型数据库最难的地方,就是建模(model)。

错综复杂的数据,需要建立模型,才能储存在数据库。所谓”模型”就是两样东西:实体(entity)+ 关系(relationship)。

实体指的是那些实际的对象,带有自己的属性,可以理解成一组相关属性的容器。关系就是实体之间的联系,通常可以分成”一对一”、”一对多”和”多对多”等类型。

数据库表连接的简单解释 | 图文并茂,通俗易懂

在关系型数据库里面,每个实体有自己的一张表(table),所有属性都是这张表的字段(field),表与表之间根据关联字段”连接”(join)在一起。所以,表的连接是关系型数据库的核心问题。

表的连接分成好几种类型。

  • 内连接(inner join)
  • 外连接(outer join)
  • 左连接(left join)
  • 右连接(right join)
  • 全连接(full join)

以前,很多文章采用维恩图(两个圆的集合运算),解释不同连接的差异。

数据库表连接的简单解释 | 图文并茂,通俗易懂

数据库表连接的简单解释 | 图文并茂,通俗易懂

数据库表连接的简单解释 | 图文并茂,通俗易懂

数据库表连接的简单解释 | 图文并茂,通俗易懂

上周,我读到一篇文章,认为还有比维恩图更好的解释方式。我发现确实如此,换一个角度解释,更容易懂。

所谓”连接”,就是两张表根据关联字段,组合成一个数据集。问题是,两张表的关联字段的值往往是不一致的,如果关联字段不匹配,怎么处理?比如,表 A 包含张三和李四,表 B 包含李四和王五,匹配的只有李四这一条记录。

很容易看出,一共有四种处理方法。

  • 只返回两张表匹配的记录,这叫内连接(inner join)。
  • 返回匹配的记录,以及表 A 多余的记录,这叫左连接(left join)。
  • 返回匹配的记录,以及表 B 多余的记录,这叫右连接(right join)。
  • 返回匹配的记录,以及表 A 和表 B 各自的多余记录,这叫全连接(full join)。

下图就是四种连接的图示。我觉得,这张图比维恩图更易懂,也更准确。

数据库表连接的简单解释 | 图文并茂,通俗易懂

上图中,表 A 的记录是 123,表 B 的记录是 ABC,颜色表示匹配关系。返回结果中,如果另一张表没有匹配的记录,则用 null 填充。

这四种连接,又可以分成两大类:内连接(inner join)表示只包含匹配的记录,外连接(outer join)表示还包含不匹配的记录。所以,左连接、右连接、全连接都属于外连接。

这四种连接的 SQL 语句如下。

SELECT * FROM A  
INNER JOIN B ON A.book_id=B.book_id;

SELECT * FROM A
LEFT JOIN B ON A.book_id=B.book_id;

SELECT * FROM A
RIGHT JOIN B ON A.book_id=B.book_id;

SELECT * FROM A
FULL JOIN B ON A.book_id=B.book_id;

上面的 SQL 语句还可以加上where条件从句,对记录进行筛选,比如只返回表 A 里面不匹配表 B 的记录。

SELECT * FROM A
LEFT JOIN B
ON A.book_id=B.book_id
WHERE B.id IS null;

另一个例子,返回表 A 或表 B 所有不匹配的记录。

SELECT * FROM A
FULL JOIN B
ON A.book_id=B.book_id
WHERE A.id IS null OR B.id IS null;

此外,还存在一种特殊的连接,叫做”交叉连接”(cross join),指的是表 A 和表 B 不存在关联字段,这时表 A(共有 n 条记录)与表 B (共有 m 条记录)连接后,会产生一张包含 n x m 条记录的新表(见下图)。

数据库表连接的简单解释 | 图文并茂,通俗易懂


文章作者: ghf
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 ghf !
评论
 上一篇
三十而立 三十而立
三十而立 《论语·为政》中说:“三十而立。”指年至三十,学有成就。我从小读了很多书,但都是一些乱七八糟的书。后来上错了大学,耽误了学业,学术上没什么成绩,大部时间都用来思考宇宙和人生了。三十岁对于一个男人来说是一个矛盾的年龄。三十岁的男人,
2019-11-14
下一篇 
十大基础实用算法 十大基础实用算法
十大基础实用算法算法一:快速排序算法 快速排序是由东尼·霍尔所发展的一种排序算法。在平均状况下,排序 n 个项目要Ο(nlogn) 次比较。在最坏状况下则需要Ο(n2) 次比较,但这种状况并不常见。事实上,快速排序通常明显比其他Ο(nlog
2019-10-14