pyspark中spark初始化的一些操作

举报
developer_Li 发表于 2025/02/25 17:31:54 2025/02/25
【摘要】 spark初始化:class SpsrkConfigInit:@classmethoddef init_spark(cls):“”"初始化spark配置:return: SparkSession“”"# 设置 JAVA_HOME 环境变量os.environ[‘JAVA_HOME’] = ‘C:/Program Files/Huawei/jdk1.8.0_222’os.environ[‘PY...

spark初始化:
class SpsrkConfigInit:
@classmethod
def init_spark(cls):
“”"
初始化spark配置
:return: SparkSession
“”"
# 设置 JAVA_HOME 环境变量
os.environ[‘JAVA_HOME’] = ‘C:/Program Files/Huawei/jdk1.8.0_222’
os.environ[‘PYSPARK_PYTHON’] = ‘D:/users/xxx/AppData/Local/Programs/Python/Python310/python.exe’ #python解释器位置
# 设置日志级别
sc.setLogLevel(“WARN”)
# 创建 SparkSession
return (SparkSession.builder.appName(“SimpleApp”)
.config(“spark.master”, “local[*]”)
.config(“spark.jars”, “/tools/spark-3.5.4-bin-hadoop3/jars/mysql-connector-j-9.2.0.jar”) #连接mysql的驱动程序
.config(“spark.driver.extraClassPath”,
“/tools/spark-3.5.4-bin-hadoop3/jars/mysql-connector-j-9.2.0.jar”)
.config(“spark.debug.maxToStringFields”, “100”)
.config(“spark.local.dir”, “/users/xxx/PycharmProjects/spark/pythonProject1/temp/dir”)
.getOrCreate())

【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。