exist快还是innerjoin快（一直搞不清楚in和exists两者到底有什么区别）

挽旧未婚夫 2022-12-04 21:41:12

使用MySql查询数据时，一直搞不清楚in和exists两者到底有什么区别，今天总算搞清楚了。

大概规则如下：

当B表的数据集小于A表数据集时，用in优于exists。

select id from A where id in (select id from B)

当A表的数据集小于B表的数据集时，用exists优于in。

select id from A where id in(select id from B);

可以这么理解：in后面跟的是小表，exists后面跟的是大表

select * from A where id in (select id from B) 也可以写成 select id from B b left join select id from A a where a.id = b.id

小表驱动大表

为什么会这样呢，这里我们需要了解MySql的小表驱动大表。

我们在编写程序时，时常遇到循环嵌套的，最常见的莫过于两个for嵌套

例如

for(int i=0;i<10;i ){ for(int j=0;j<1000;j ){ } }

exist快还是innerjoin快（一直搞不清楚in和exists两者到底有什么区别）(1)

如果小的循环在外层，对于数据库连接来说就只连接10次，进行10000次操作。

如果1000在外，则需要进行1000次数据库连接，这样就相当浪费资源了。

MySql的join实现原理，以驱动表的数据为基础，“嵌套循环”去被驱动表匹配记录，例如：

select * from a join b on a.id =b.id

假设 a表1000000数据，b表100数据，这里有两个过程，b 表数据最少，查询引擎优化选择b为驱动表，循环b表的100条数据，跟a表的1000000数据去匹配，这个匹配的过程是B 树的查找过程，比循环取数要快的多。

需要注意的是a表字段id和b表字段id 都要建立索引。

总结：

小表驱动大表，in后面跟的是小表，exists后面跟的是大表。

由于笔者知识及水平有限,文中错漏之处在所难免,如有不足之处，欢迎交流。

免责声明：本文仅代表文章作者的个人观点，与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺，请读者仅作参考，并自行核实相关内容。文章投诉邮箱：anhduc.ph@yahoo.com