你必须确保以下内容 环境变量 在你的spark-env.sh中指向所有(!)节点上具有相同(!)版本的python二进制可执行文件:
如果当前未设置PYSPARK_PYTHON,请进行设置。 PYSPARK_PYTHON定义执行程序和驱动程序的可执行文件。当你只将PYSPARK_DRIVER_PYTHON设置为python3.5时,执行程序仍将使用默认的python可执行文件python2.7,这会引发你看到的exeception。