我知道Mrjob使用Hadoop Streaming.我也知道有一个插件可以将MongoDB与Hadoop Streaming一起使用.但是,我找不到任何将两者结合在一起的例子.
这(至少在理论上)是否可能?如果是这样,是否有相关的示例或教程?请注意,我愿意扩展Mrjob库甚至回到Boto.