PlusAMP App Middleware - Details for Job 331350

Status: SUCCEEDED
Submitted: 2025/08/02 15:20:31
Duration: 0.1 s
Completed Stages: 3

Enable zooming

digraph G { subgraph clusterstage_512887 { label="Stage 512887"; subgraph cluster6288107 { label="Scan csv "; 3616122 [labelType="html" label="FileScanRDD [3616122] $anonfun$withThreadLocalCaptured$1 at FutureTask.java:264"]; 3616123 [labelType="html" label="MapPartitionsRDD [3616123] $anonfun$withThreadLocalCaptured$1 at FutureTask.java:264"]; } subgraph cluster6288103 { label="WholeStageCodegen (1)"; 3616124 [labelType="html" label="MapPartitionsRDD [3616124] $anonfun$withThreadLocalCaptured$1 at FutureTask.java:264"]; } subgraph cluster6288102 { label="InMemoryTableScan"; 3616125 [labelType="html" label="MapPartitionsRDD [3616125] $anonfun$withThreadLocalCaptured$1 at FutureTask.java:264"]; 3616126 [labelType="html" label="*(1) Project [CASE WHEN ((sector_id#94160398 = NA) OR (sector_id#94160398 = null)) THEN null ELSE cast(sector_id#94160398 as int) END AS sector_id#94160418, CASE WHEN (sort#94160399 = null) THEN null ELSE sort#94160399 END AS sort#94160419, CASE WHEN (description#94160400 = null) THEN null ELSE description#94160400 END AS description#94160423, CASE WHEN ((universe#94160401 = NA) OR (universe#94160401 = null)) THEN null ELSE cast(universe#94160401 as int) END AS universe#94160424]\n+- FileScan csv [sector_id#94160398,sort#94160399,description#94160400,universe#94160401] Batched: false, DataFilters: [], Format: CSV, Location: InMemoryFileIndex(1 paths)[file:/srv/plusamp/data/default/ea-market/curate/curate_sector.csv], PartitionFilters: [], PushedFilters: [], ReadSchema: struct<sector_id:string,sort:string,description:string,universe:string>\n [3616126] [Cached] $anonfun$withThreadLocalCaptured$1 at FutureTask.java:264"]; } subgraph cluster6301093 { label="InMemoryTableScan"; 3623579 [labelType="html" label="MapPartitionsRDD [3623579] toLocalIterator at SparkDataStreamBuilder.scala:39"]; 3623580 [labelType="html" label="MapPartitionsRDD [3623580] toLocalIterator at SparkDataStreamBuilder.scala:39"]; 3623581 [labelType="html" label="MapPartitionsRDD [3623581] toLocalIterator at SparkDataStreamBuilder.scala:39"]; } subgraph cluster6301081 { label="WholeStageCodegen (2)"; 3623582 [labelType="html" label="MapPartitionsRDD [3623582] toLocalIterator at SparkDataStreamBuilder.scala:39"]; } subgraph cluster6301080 { label="Exchange"; 3623586 [labelType="html" label="MapPartitionsRDD [3623586] toLocalIterator at SparkDataStreamBuilder.scala:39"]; } } 3616122->3616123; 3616123->3616124; 3616124->3616125; 3616125->3616126; 3616126->3623579; 3623579->3623580; 3623580->3623581; 3623581->3623582; 3623582->3623586; }

3616126

digraph G { subgraph clusterstage_512888 { label="Stage 512888"; subgraph cluster6301080 { label="Exchange"; 3623587 [labelType="html" label="ShuffledRowRDD [3623587] [Unordered] toLocalIterator at SparkDataStreamBuilder.scala:39"]; } subgraph cluster6301073 { label="WholeStageCodegen (3)"; 3623588 [labelType="html" label="MapPartitionsRDD [3623588] [Unordered] toLocalIterator at SparkDataStreamBuilder.scala:39"]; } subgraph cluster6301072 { label="InMemoryTableScan"; 3623589 [labelType="html" label="MapPartitionsRDD [3623589] [Unordered] toLocalIterator at SparkDataStreamBuilder.scala:39"]; 3623590 [labelType="html" label="*(3) Sort [sort#94160419 ASC NULLS FIRST, description#94160423 ASC NULLS FIRST], true, 0\n+- Exchange rangepartitioning(sort#94160419 ASC NULLS FIRST, description#94160423 ASC NULLS FIRST, 200), ENSURE_REQUIREMENTS, [id=#7533384]\n +- *(2) Project [sector_id#94354208, numcos#94354279, numdates#94354348, sort#94160419, description#94160423, universe#94354578, coverage#94354418]\n +- *(2) BroadcastHashJoin [sector_id#94354208], [sector_id#94160418], Inner, BuildLeft, false\n :- BroadcastExchange HashedRelationBroadcastMode(List(cast(input[0, int, true] as bigint)),false), [id=#7533377]\n : +- *(1) Project [CASE WHEN ((sector_id#94354027 = NA) OR (sector_id#94354027 = null)) THEN null ELSE cast(sector_id#94354027 as int) END AS sector_id#94354208, CASE WHEN ((numcos#94354030 = NA) OR (numcos#94354030 = null)) THEN null ELSE cast(numcos#94354030 as float) END AS numcos#94354279, CASE WHEN ((numdates#94354031 = NA) OR (numdates#94354031 = null)) THEN null ELSE cast(numdates#94354031 as float)... [3623590] [Cached] [Unordered] toLocalIterator at SparkDataStreamBuilder.scala:39"]; 3623591 [labelType="html" label="MapPartitionsRDD [3623591] [Unordered] toLocalIterator at SparkDataStreamBuilder.scala:39"]; 3623592 [labelType="html" label="MapPartitionsRDD [3623592] [Unordered] toLocalIterator at SparkDataStreamBuilder.scala:39"]; 3623593 [labelType="html" label="MapPartitionsRDD [3623593] [Unordered] toLocalIterator at SparkDataStreamBuilder.scala:39"]; } subgraph cluster6301071 { label="CollectLimit"; 3623594 [labelType="html" label="MapPartitionsRDD [3623594] [Unordered] toLocalIterator at SparkDataStreamBuilder.scala:39"]; 3623595 [labelType="html" label="MapPartitionsRDD [3623595] [Unordered] toLocalIterator at SparkDataStreamBuilder.scala:39"]; } } 3623587->3623588; 3623588->3623589; 3623589->3623590; 3623590->3623591; 3623591->3623592; 3623592->3623593; 3623593->3623594; 3623594->3623595; }

3623586,3623587

3623590

digraph G { subgraph clusterstage_512889 { label="Stage 512889"; subgraph cluster6301071 { label="CollectLimit"; 3623596 [labelType="html" label="ShuffledRowRDD [3623596] [Unordered] toLocalIterator at SparkDataStreamBuilder.scala:39"]; 3623597 [labelType="html" label="MapPartitionsRDD [3623597] [Unordered] toLocalIterator at SparkDataStreamBuilder.scala:39"]; } subgraph cluster6301102 { label="mapPartitionsInternal"; 3623598 [labelType="html" label="MapPartitionsRDD [3623598] [Unordered] toLocalIterator at SparkDataStreamBuilder.scala:39"]; } subgraph cluster6301103 { label="map"; 3623599 [labelType="html" label="MapPartitionsRDD [3623599] [Unordered] toLocalIterator at SparkDataStreamBuilder.scala:39"]; } } 3623596->3623597; 3623597->3623598; 3623598->3623599; }

3623595,3623596

Completed Stages (3)

Page:

Stage Id ▾	Pool Name	Description	Submitted	Duration	Tasks: Succeeded/Total	Input	Shuffle Read	Shuffle Write
512889	default	toStream at SparkDataStreamBuilder.scala:39 +details scala.collection.AbstractIterator.toStream(Iterator.scala:1431) plusamp.middleware.model.core.data.SparkDataStreamBuilder.$anonfun$stream$1(SparkDataStreamBuilder.scala:39) plusamp.scala.util.Profile$.time(Profile.scala:22) plusamp.middleware.model.core.data.SparkDataStreamBuilder.<init>(SparkDataStreamBuilder.scala:39) plusamp.middleware.graphql.datafile.SparkAccessor.$anonfun$retrieveData$3(SparkAccessor.scala:77) scala.util.Success.$anonfun$map$1(Try.scala:255) scala.util.Success.map(Try.scala:213) scala.concurrent.Future.$anonfun$map$1(Future.scala:292) scala.concurrent.impl.Promise.liftedTree1$1(Promise.scala:33) scala.concurrent.impl.Promise.$anonfun$transform$1(Promise.scala:33) scala.concurrent.impl.CallbackRunnable.run(Promise.scala:64) java.base/java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1128) java.base/java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:628) java.base/java.lang.Thread.run(Thread.java:829)	2025/08/02 15:20:31	10 ms	1/1		1313.0 B
512888	default	toLocalIterator at SparkDataStreamBuilder.scala:39 +details RDD: (3) Sort [sort#94160419 ASC NULLS FIRST, description#94160423 ASC NULLS FIRST], true, 0 +- Exchange rangepartitioning(sort#94160419 ASC NULLS FIRST, description#94160423 ASC NULLS FIRST, 200), ENSURE_REQUIREMENTS, [id=#7533384] +- (2) Project [sector_id#94354208, numcos#94354279, numdates#94354348, sort#94160419, description#94160423, universe#94354578, coverage#94354418] +- (2) BroadcastHashJoin [sector_id#94354208], [sector_id#94160418], Inner, BuildLeft, false :- BroadcastExchange HashedRelationBroadcastMode(List(cast(input[0, int, true] as bigint)),false), [id=#7533377] : +- (1) Project [CASE WHEN ((sector_id#94354027 = NA) OR (sector_id#94354027 = null)) THEN null ELSE cast(sector_id#94354027 as int) END AS sector_id#94354208, CASE WHEN ((numcos#94354030 = NA) OR (numcos#94354030 = null)) THEN null ELSE cast(numcos#94354030 as float) END AS numcos#94354279, CASE WHEN ((numdates#94354031 = NA) OR (numdates#94354031 = null)) THEN null ELSE cast(numdates#94354031 as float)... org.apache.spark.sql.Dataset.toLocalIterator(Dataset.scala:3000) plusamp.middleware.model.core.data.SparkDataStreamBuilder.$anonfun$stream$1(SparkDataStreamBuilder.scala:39) plusamp.scala.util.Profile$.time(Profile.scala:22) plusamp.middleware.model.core.data.SparkDataStreamBuilder.<init>(SparkDataStreamBuilder.scala:39) plusamp.middleware.graphql.datafile.SparkAccessor.$anonfun$retrieveData$3(SparkAccessor.scala:77) scala.util.Success.$anonfun$map$1(Try.scala:255) scala.util.Success.map(Try.scala:213) scala.concurrent.Future.$anonfun$map$1(Future.scala:292) scala.concurrent.impl.Promise.liftedTree1$1(Promise.scala:33) scala.concurrent.impl.Promise.$anonfun$transform$1(Promise.scala:33) scala.concurrent.impl.CallbackRunnable.run(Promise.scala:64) java.base/java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1128) java.base/java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:628) java.base/java.lang.Thread.run(Thread.java:829)	2025/08/02 15:20:31	68 ms	12/12		1313.0 B	1313.0 B
512887	default	toLocalIterator at SparkDataStreamBuilder.scala:39 +details RDD: *(1) Project [CASE WHEN ((sector_id#94160398 = NA) OR (sector_id#94160398 = null)) THEN null ELSE cast(sector_id#94160398 as int) END AS sector_id#94160418, CASE WHEN (sort#94160399 = null) THEN null ELSE sort#94160399 END AS sort#94160419, CASE WHEN (description#94160400 = null) THEN null ELSE description#94160400 END AS description#94160423, CASE WHEN ((universe#94160401 = NA) OR (universe#94160401 = null)) THEN null ELSE cast(universe#94160401 as int) END AS universe#94160424] +- FileScan csv [sector_id#94160398,sort#94160399,description#94160400,universe#94160401] Batched: false, DataFilters: [], Format: CSV, Location: InMemoryFileIndex(1 paths)[file:/srv/plusamp/data/default/ea-market/curate/curate_sector.csv], PartitionFilters: [], PushedFilters: [], ReadSchema: struct<sector_id:string,sort:string,description:string,universe:string> org.apache.spark.sql.Dataset.toLocalIterator(Dataset.scala:3000) plusamp.middleware.model.core.data.SparkDataStreamBuilder.$anonfun$stream$1(SparkDataStreamBuilder.scala:39) plusamp.scala.util.Profile$.time(Profile.scala:22) plusamp.middleware.model.core.data.SparkDataStreamBuilder.<init>(SparkDataStreamBuilder.scala:39) plusamp.middleware.graphql.datafile.SparkAccessor.$anonfun$retrieveData$3(SparkAccessor.scala:77) scala.util.Success.$anonfun$map$1(Try.scala:255) scala.util.Success.map(Try.scala:213) scala.concurrent.Future.$anonfun$map$1(Future.scala:292) scala.concurrent.impl.Promise.liftedTree1$1(Promise.scala:33) scala.concurrent.impl.Promise.$anonfun$transform$1(Promise.scala:33) scala.concurrent.impl.CallbackRunnable.run(Promise.scala:64) java.base/java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1128) java.base/java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:628) java.base/java.lang.Thread.run(Thread.java:829)	2025/08/02 15:20:31	13 ms	1/1	896.0 B		1313.0 B

Stage Id ▾

Pool Name

Description

Submitted

Duration

Tasks: Succeeded/Total

Input

Output

Shuffle Read

Shuffle Write

512889

default

toStream at SparkDataStreamBuilder.scala:39 +details

scala.collection.AbstractIterator.toStream(Iterator.scala:1431)
plusamp.middleware.model.core.data.SparkDataStreamBuilder.$anonfun$stream$1(SparkDataStreamBuilder.scala:39)
plusamp.scala.util.Profile$.time(Profile.scala:22)
plusamp.middleware.model.core.data.SparkDataStreamBuilder.<init>(SparkDataStreamBuilder.scala:39)
plusamp.middleware.graphql.datafile.SparkAccessor.$anonfun$retrieveData$3(SparkAccessor.scala:77)
scala.util.Success.$anonfun$map$1(Try.scala:255)
scala.util.Success.map(Try.scala:213)
scala.concurrent.Future.$anonfun$map$1(Future.scala:292)
scala.concurrent.impl.Promise.liftedTree1$1(Promise.scala:33)
scala.concurrent.impl.Promise.$anonfun$transform$1(Promise.scala:33)
scala.concurrent.impl.CallbackRunnable.run(Promise.scala:64)
java.base/java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1128)
java.base/java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:628)
java.base/java.lang.Thread.run(Thread.java:829)

2025/08/02 15:20:31

10 ms

1/1

1313.0 B

512888

default

toLocalIterator at SparkDataStreamBuilder.scala:39 +details

RDD: *(3) Sort [sort#94160419 ASC NULLS FIRST, description#94160423 ASC NULLS FIRST], true, 0 +- Exchange rangepartitioning(sort#94160419 ASC NULLS FIRST, description#94160423 ASC NULLS FIRST, 200), ENSURE_REQUIREMENTS, [id=#7533384] +- *(2) Project [sector_id#94354208, numcos#94354279, numdates#94354348, sort#94160419, description#94160423, universe#94354578, coverage#94354418] +- *(2) BroadcastHashJoin [sector_id#94354208], [sector_id#94160418], Inner, BuildLeft, false :- BroadcastExchange HashedRelationBroadcastMode(List(cast(input[0, int, true] as bigint)),false), [id=#7533377] : +- *(1) Project [CASE WHEN ((sector_id#94354027 = NA) OR (sector_id#94354027 = null)) THEN null ELSE cast(sector_id#94354027 as int) END AS sector_id#94354208, CASE WHEN ((numcos#94354030 = NA) OR (numcos#94354030 = null)) THEN null ELSE cast(numcos#94354030 as float) END AS numcos#94354279, CASE WHEN ((numdates#94354031 = NA) OR (numdates#94354031 = null)) THEN null ELSE cast(numdates#94354031 as float)...

org.apache.spark.sql.Dataset.toLocalIterator(Dataset.scala:3000)
plusamp.middleware.model.core.data.SparkDataStreamBuilder.$anonfun$stream$1(SparkDataStreamBuilder.scala:39)
plusamp.scala.util.Profile$.time(Profile.scala:22)
plusamp.middleware.model.core.data.SparkDataStreamBuilder.<init>(SparkDataStreamBuilder.scala:39)
plusamp.middleware.graphql.datafile.SparkAccessor.$anonfun$retrieveData$3(SparkAccessor.scala:77)
scala.util.Success.$anonfun$map$1(Try.scala:255)
scala.util.Success.map(Try.scala:213)
scala.concurrent.Future.$anonfun$map$1(Future.scala:292)
scala.concurrent.impl.Promise.liftedTree1$1(Promise.scala:33)
scala.concurrent.impl.Promise.$anonfun$transform$1(Promise.scala:33)
scala.concurrent.impl.CallbackRunnable.run(Promise.scala:64)
java.base/java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1128)
java.base/java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:628)
java.base/java.lang.Thread.run(Thread.java:829)

2025/08/02 15:20:31

68 ms

12/12

1313.0 B

512887

default

toLocalIterator at SparkDataStreamBuilder.scala:39 +details

RDD: *(1) Project [CASE WHEN ((sector_id#94160398 = NA) OR (sector_id#94160398 = null)) THEN null ELSE cast(sector_id#94160398 as int) END AS sector_id#94160418, CASE WHEN (sort#94160399 = null) THEN null ELSE sort#94160399 END AS sort#94160419, CASE WHEN (description#94160400 = null) THEN null ELSE description#94160400 END AS description#94160423, CASE WHEN ((universe#94160401 = NA) OR (universe#94160401 = null)) THEN null ELSE cast(universe#94160401 as int) END AS universe#94160424] +- FileScan csv [sector_id#94160398,sort#94160399,description#94160400,universe#94160401] Batched: false, DataFilters: [], Format: CSV, Location: InMemoryFileIndex(1 paths)[file:/srv/plusamp/data/default/ea-market/curate/curate_sector.csv], PartitionFilters: [], PushedFilters: [], ReadSchema: struct<sector_id:string,sort:string,description:string,universe:string>

org.apache.spark.sql.Dataset.toLocalIterator(Dataset.scala:3000)
plusamp.middleware.model.core.data.SparkDataStreamBuilder.$anonfun$stream$1(SparkDataStreamBuilder.scala:39)
plusamp.scala.util.Profile$.time(Profile.scala:22)
plusamp.middleware.model.core.data.SparkDataStreamBuilder.<init>(SparkDataStreamBuilder.scala:39)
plusamp.middleware.graphql.datafile.SparkAccessor.$anonfun$retrieveData$3(SparkAccessor.scala:77)
scala.util.Success.$anonfun$map$1(Try.scala:255)
scala.util.Success.map(Try.scala:213)
scala.concurrent.Future.$anonfun$map$1(Future.scala:292)
scala.concurrent.impl.Promise.liftedTree1$1(Promise.scala:33)
scala.concurrent.impl.Promise.$anonfun$transform$1(Promise.scala:33)
scala.concurrent.impl.CallbackRunnable.run(Promise.scala:64)
java.base/java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1128)
java.base/java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:628)
java.base/java.lang.Thread.run(Thread.java:829)

2025/08/02 15:20:31

13 ms

1/1

896.0 B

1313.0 B

Page: