scala中的分布式数据集有?
RDD(Resilient Distributed Datasets)弹性分布式数据集,可以把RDD就可以看成是一个简单的"动态数组"(比如ArrayList),对其操作,也只需要 调用它的方法而已,和java中的ArrayList一样。但它与一般动态数组的区别在于:RDD是分布的。
弹性是指的是数据自动在内存和磁盘切换, task如果失败会进行特定次数的重试
Copyright © 广州京杭网络科技有限公司 2005-2025 版权所有 粤ICP备16019765号
广州京杭网络科技有限公司 版权所有