RDD行动操作
在Spark中,RDD(弹性分布式数据集)是核心抽象之一。RDD操作分为两类:转换操作(Transformations)和行动操作(Actions)。转换操作是惰性的,它们不会立即执行,而是记录如何从一个RDD转换到另一个RDD。而行动操作则会触发实际的计算,并将结果返回给驱动程序或存储到外部系统中。
在Spark中,RDD(弹性分布式数据集)是核心抽象之一。RDD操作分为两类:转换操作(Transformations)和行动操作(Actions)。转换操作是惰性的,它们不会立即执行,而是记录如何从一个RDD转换到另一个RDD。而行动操作则会触发实际的计算,并将结果返回给驱动程序或存储到外部系统中。