Solu:我把params驱动程序内存40G放在spark-submit中.
问:我的Spark集群由5个ubuntu服务器组成,每个服务器有80G内存和24个内核.
word2vec大约是10G newsdata.
我用这样的独立模式提交作业:
spark-submit –name trainNewsdata –ainNewsData –master spark:// master:7077 –executor-memory 70G –total-executor-cores 96 sogou.jar hdfs:// master:9000 / user / bd / newsdata / * hdfs:// master:9000 / user / bd / word2vecModel_newsdata
当我在spark中训练word2vec模型时,我发生了:
线程“main”中的异常java.lang.OutOfMemoryError:Java堆空间,
而且我不知道如何解决它,请帮帮我:)
最佳答案 我把params驱动程序内存40G放在spark-submit中,然后解决它.
本文发布于:2024-01-28 06:50:20,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/17063958255579.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |