Spark读写S3（AWS亚马逊中国区beijing）

阅读：评论：0

Spark读写S3（AWS亚马逊中国区）

因为中国区的region相对于其他国家是隔离的，所以在中国使用亚马逊S3需要单另设置endpoint来指定地区。

首先我们需要引入hadoop-2.7.2的lib中的hadoop-aws-2.7.2.jar，以及aws自己提供的sdk包：aws-java-sdk-1.7.4.jar

使用2.7.2的原因是由于hadoop2.7.2才支持s3。

接下来我们在程序中定义hadoopConfiguration配置option

sc.hadoopConfiguration.set("fs.s3a.access.key", "youraccesskey")
sc.hadoopConfiguration.set("fs.s3a.secret.key", "yoursecretkey")
sc.hadoopConfiguration.set("dpoint", "s3-north-1.amazonaws")
val myRdd = sc.textFile("s3a://your_bucket/")

本文发布于:2024-01-27 10:34:58，感谢您对本站的认可！

本文链接：https://www.4u4v.net/it/17063229001196.html

上一篇：转：关于亚马逊中国的界面风格

下一篇：亚马逊云服务（AWS）宣布Amazon Route 53在中国上线

标签：亚马逊中国 Spark beijing AWS

留言与评论（共有 0 条评论）