1.内联结、外联结、左联结、右联结的含义及区别:
在讲mysql的join语法前还是先回顾一下联结的语法,呵呵,其实连我自己都忘得差不多了,那就大家一起温习吧(如果内容有错误或有疑问,可以来信咨询:陈朋奕 chenpengyi#gmail.com),国内关于mysql联结查询的资料十分少,相信大家在看了本文后会对mysql联结语法有相当清晰的了解,也不会被oracle的外联结的(“+”号)弄得糊涂了。
在sql标准中规划的(join)联结大致分为下面四种:
1. 内联结:将两个表中存在联结关系的字段符合联结关系的那些记录形成记录集的联结。
2. 外联结:分为外左联结和外右联结。
左联结a、b表的意思就是将表a中的全部记录和表b中联结的字段与表a的联结字段符合联结条件的那些记录形成的记录集的联结,这里注意的是最后出来的记录集会包括表a的全部记录。
右联结a、b表的结果和左联结b、a的结果是一样的,也就是说:
select a.name b.name from a left join b on a.id=b.id
和select a.name b.name from b right join a on b.id=a.id执行后的结果是一样的。
3.全联结:将两个表中存在联结关系的字段的所有记录取出形成记录集的联结(这个不需要记忆,只要是查询中提到了的表的字段都会取出,无论是否符合联结条件,因此意义不大)。
4.无联结:不用解释了吧,就是没有使用联结功能呗,也有自联结的说法。
这里我有个比较简便的记忆方法,内外联结的区别是内联结将去除所有不符合条件的记录,而外联结则保留其中部分。外左联结与外右联结的区别在于如果用a左联结b则a中所有记录都会保留在结果中,此时b中只有符合联结条件的记录,而右联结相反,这样也就不会混淆了。其实大家回忆高等教育出版社出版的《数据库系统概论》书中讲到关系代数那章(就是将笛卡儿积和投影那章)的内容,相信不难理解这些联结功能的内涵。
2. mysql联结(join)的语法
mysql支持select和某些update和delete情况下的join语法,具体语法上的细节有:
table_references:
table_reference [, table_reference] …
table_reference:
table_factor
| join_table
table_factor:
tbl_name [[as] alias]
[{use|ignore|force} index (key_list)]
| ( table_references )
| { oj table_reference left outer join table_reference
on conditional_expr }
join_table:
table_reference [inner | cross] join table_factor [join_condition]
| table_reference straight_join table_factor
| table_reference straight_join table_factor on condition
| table_reference left [outer] join table_reference join_condition
| table_reference natural [left [outer]] join table_factor
| table_reference right [outer] join table_reference join_condition
| table_reference natural [right [outer]] join table_factor
join_condition:
on conditional_expr | using (column_list)
上面的用法摘自权威资料,不过大家看了是否有点晕呢?呵呵,应该问题主要还在于table_reference是什么,table_factor又是什么?这里的table_reference其实就是表的引用的意思,因为在mysql看来,联结就是一种对表的引用,因此把需要联结的表定义为table_reference,同时在sql standard中也是如此看待的。而table_factor则是mysql对这个引用的功能上的增强和扩充,使得引用的表可以是括号内的一系列表,如下面例子中的join后面括号:
select * from t1 left join (t2, t3, t4) on (t2.a=t1.a and t3.b=t1.b and t4.c=t1.c)
这个语句的执行结果和下面语句其实是一样的:
select * from t1 left join (t2 cross join t3 cross join t4)
on (t2.a=t1.a and t3.b=t1.b and t4.c=t1.c)
这两个例子不仅让我们了解了mysql中table_factor和table_reference含义,同时能理解一点cross join的用法,我要补充的是在mysql现有版本中cross join的作用和inner join是一样的(虽然在sql standard中是不一样的,然而在mysql中他们的区别仅仅是inner join需要附加on参数的语句,而cross join不需要)。
既然说到了on语句,那就解释一下吧,on语句其实和where语句功能大致相当,只是这里的on语句是专门针对联结表的,on语句后面的条件的要求和书写方式和where语句的要求是一样的,大家基本上可以把on当作where用。
大家也许也看到了oj table_reference left outer join table_reference这个句子,这不是mysql的标准写法,只是为了和odbc的sql语法兼容而设定的,我很少用,java的人更是不会用,所以也不多解释了。
那下面就具体讲讲简单的join的用法了。首先我们假设有2个表a和b,他们的表结构和字段分别为:
表a:
id |
name |
1 |
tim |
2 |
jimmy |
3 |
john |
4 |
tom |
表b:
id |
hobby |
1 |
football |
2 |
basketball |
2 |
tennis |
4 |
soccer |
1. 内联结:
select a.name b.hobby from a, b where a.id = b.id,这是隐式的内联结,查询的结果是:
name |
hobby |
tim |
football |
jimmy |
basketball |
jimmy |
tennis |
tom |
soccer |
它的作用和 select a.name from a inner join b on a.id = b.id是一样的。这里的inner join换成cross join也是可以的。
2. 外左联结
select a.name from a left join b on a.id = b.id,典型的外左联结,这样查询得到的结果将会是保留所有a表中联结字段的记录,若无与其相对应的b表中的字段记录则留空,结果如下:
name |
hobby |
tim |
football |
jimmy |
basketball,tennis |
john |
|
tom |
soccer |
所以从上面结果看出,因为a表中的john记录的id没有在b表中有对应id,因此为空,但name栏仍有john记录。
3. 外右联结
如果把上面查询改成外右联结:select a.name from a right join b on a.id = b.id,则结果将会是:
name |
hobby |
tim |
football |
jimmy |
basketball |
jimmy |
tennis |
tom |
soccer |
这样的结果都是我们可以从外左联结的结果中猜到的了。
说到这里大家是否对联结查询了解多了?这个原本看来高深的概念一下子就理解了,恍然大悟了吧(呵呵,开玩笑了)?最后给大家讲讲mysql联结查询中的某些参数的作用:
1.using (column_list):其作用是为了方便书写联结的多对应关系,大部分情况下using语句可以用on语句来代替,如下面例子:
a left join b using (c1,c2,c3),其作用相当于下面语句
a left join b on a.c1=b.c1 and a.c2=b.c2 and a.c3=b.c3
只是用on来代替会书写比较麻烦而已。
2.natural [left] join:这个句子的作用相当于inner join,或者是在using子句中包含了联结的表中所有字段的left join(左联结)。
3.straight_join:由于默认情况下mysql在进行表的联结的时候会先读入左表,当使用了这个参数后mysql将会先读入右表,这是个mysql的内置优化参数,大家应该在特定情况下使用,譬如已经确认右表中的记录数量少,在筛选后能大大提高查询速度。
最后要说的就是,在mysql5.0以后,运算顺序得到了重视,所以对多表的联结查询可能会错误以子联结查询的方式进行。譬如你需要进行多表联结,因此你输入了下面的联结查询:
select t1.id,t2.id,t3.id
from t1,t2
left join t3 on (t3.id=t1.id)
where t1.id=t2.id;
但是mysql并不是这样执行的,其后台的真正执行方式是下面的语句:
select t1.id,t2.id,t3.id
from t1,( t2 left join t3 on (t3.id=t1.id) )
where t1.id=t2.id;
这并不是我们想要的效果,所以我们需要这样输入:
select t1.id,t2.id,t3.id
from (t1,t2)
left join t3 on (t3.id=t1.id)
where t1.id=t2.id;
在这里括号是相当重要的,因此以后在写这样的查询的时候我们不要忘记了多写几个括号,至少这样能避免很多错误(因为这样的错误是很难被开发人员发现的)。如果对上面内容有疑问可以来信查询:陈朋奕 chenpengyi#gmail.com,转载请注明出处及作者。