阅读最新的spark kafka流媒体

 手机用户2502935287_564 发布于 2022-12-18 19:28

我希望只使用kafka读取火花流中的最新消息,但它也会获取过去的数据

如何在KafkaUtil中为spark设置auto.offset.reset

JavaPairReceiverInputDStream messages =
            KafkaUtils.createStream(jssc, args[0], args[1], topicMap);

如何将conf设置为仅获取当前消息.请举个例子.

在此先感谢,还有另一个线程

但还不够,请帮助我.提前致谢.

1 个回答
  • 您需要在KafkaUtils对象中使用此方法:

     def createStream[K, V, U <: Decoder[_], T <: Decoder[_]](
          jssc: JavaStreamingContext,
          keyTypeClass: Class[K],
          valueTypeClass: Class[V],
          keyDecoderClass: Class[U],
          valueDecoderClass: Class[T],
          kafkaParams: JMap[String, String],
          topics: JMap[String, JInt],
          storageLevel: StorageLevel
        )
    

    根据Spark版本,您不能使用java.有一个错误.

    如果您使用的是Spark 1.1.0,则需要在kafkaParams参数中添加以下属性:

    "auto.offset.reset","最大"

    另一种解决方法是随机生成groupId前缀,但这很糟糕.

    2022-12-18 19:30 回答
撰写答案
今天,你开发时遇到什么问题呢?
立即提问
热门标签
PHP1.CN | 中国最专业的PHP中文社区 | PNG素材下载 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有