Я пытаюсь подключить структурированную потоковую передачу Spark к kafka, и она выдает следующую ошибку:
Исключение в потоке «основной» java.lang.ClassNotFoundException: не удалось найти источник данных: kafka. Пожалуйста, найдите пакеты в ...
На основании документации я добавил требуемые зависимости
и мои серверы kafka и zookeeper работают. Не уверен, в чем проблема. Кроме того, я использую его таким образом
import spark.implicits._ val feedback =spark.readStream.format("kafka").option("kafka.bootstrap.servers", "localhost:2181").option("subscribe", "kafka_input_topic") .load().as[InputMessage].filter(_.lang.equals("en"))
Любая помощь приветствуется. Спасибо
"org.apache.spark" % "spark-sql-kafka-0-10_2.11" % SPARK_VERSION
в свой список зависимостей? (SPARK_VERSION — это заполнитель для вашей правильной версии искры). - person Yuval Itzchakov   schedule 11.02.2018<dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-sql-kafka-0-10_2.11</artifactId> <version>2.2.0</version> <scope>provided</scope> </dependency>
- person Rahul Kumar   schedule 11.02.2018