word2vec的spark实现

阅读: 评论:0

word2vec的spark实现

word2vec的spark实现

Solu:我把params驱动程序内存40G放在spark-submit中.

问:我的Spark集群由5个ubuntu服务器组成,每个服务器有80G内存和24个内核.

word2vec大约是10G newsdata.

我用这样的独立模式提交作业:

spark-submit –name trainNewsdata –ainNewsData –master spark:// master:7077 –executor-memory 70G –total-executor-cores 96 sogou.jar hdfs:// master:9000 / user / bd / newsdata / * hdfs:// master:9000 / user / bd / word2vecModel_newsdata

当我在spark中训练word2vec模型时,我发生了:

线程“main”中的异常java.lang.OutOfMemoryError:Java堆空间,

而且我不知道如何解决它,请帮帮我:)

最佳答案 我把params驱动程序内存40G放在spark-submit中,然后解决它.

本文发布于:2024-01-28 06:50:20,感谢您对本站的认可!

本文链接:https://www.4u4v.net/it/17063958255579.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:word2vec   spark
留言与评论(共有 0 条评论)
   
验证码:

Copyright ©2019-2022 Comsenz Inc.Powered by ©

网站地图1 网站地图2 网站地图3 网站地图4 网站地图5 网站地图6 网站地图7 网站地图8 网站地图9 网站地图10 网站地图11 网站地图12 网站地图13 网站地图14 网站地图15 网站地图16 网站地图17 网站地图18 网站地图19 网站地图20 网站地图21 网站地图22/a> 网站地图23