JOIN 原则 :
在使用写有 Join 操作的查询语句时有一条原则:
应该将条目少的表/子查询放在 Join 操作符的左边
原因是在 Join 操作的 Reduce 阶段,位于 Join 操作符左边的表的内容会被加载进内存,将条目少的表放在左边,
可以有效减少发生 OOM 错误的几率 。
Map Join Join 操作在 Map 阶段完成,不再需要Reduce,前提条件是需要的数据在 Map 的过程中可以访问到.