狠狠撸

2. val people = sc.textFile(“people.txt”).map(parseF) val A = people.filter(age <= 25) val A1 = A.map(A._3, 2000) val sumA1ByField3 = A1.reduceByKey( _+_ ) sumA1ByField.saveAsTextFile(“”) A A A1 A1

3. val B = people.filter(age > 25) val B1 = A.map(B._3, 3000) val sumA1ByField3 = B1.reduceByKey( _+_ ) val sumA1 = sumA1ByField.map(K, field2).reduceByKey( _+_ ) sumA1.saveAsTextFile(“”) B B B1 B1 sumA1 sumA1

5. textFile map filter_Bfilter_A map_A map_B ShuffleWriter Need Tagging Splitter with Buffer reduceByKey_A saveAsTextFile_A reduceByKey_B Map_B ShuffleReader Need De-Tagging ShuffleWriter reduceByKey_B ShuffleReader saveAsTextFile_B

狠狠撸

Multiquery optimization on spark

More Related Content

Multiquery optimization on spark