Table 3. Performance comparison of...

Table 3.

Performance comparison of different model configurations using the 3D ResNet18 backbone. Best BATE values are highlighted in bold

Model	Predictive accuracy		Causal effect bias (BATE) (⁠ $↓$ ⁠)
Model	MAE	MSE	ChemoRT versus RT	ChemoRT versus RT+EGFRI	RT versus RT+EGFRI
Baseline (concatenation)	1.81 $\pm$ 0.09	5.35 $\pm$ 0.28	1.89 $\pm$ 0.17	0.65 $\pm$ 0.10	1.70 $\pm$ 0.20
Baseline + Bi-AdaIN	1.76 $\pm$ 0.08	4.22 $\pm$ 0.26	1.85 $\pm$ 0.16	0.53 $\pm$ 0.09	1.66 $\pm$ 0.19
Baseline + adversarial	1.84 $\pm$ 0.10	5.41 $\pm$ 0.31	1.59 $\pm$ 0.20	0.38 $\pm$ 0.12	1.42 $\pm$ 0.22
Bi-AdaIN + adversarial	1.69 $\pm$ 0.09	4.30 $\pm$ 0.29	1.15 $\pm$ 0.17	0.28 $\pm$ 0.10	0.95 $\pm$ 0.18
Baseline + MI	1.86 $\pm$ 0.10	5.44 $\pm$ 0.32	0.48 $\pm$ 0.15	0.23 $\pm$ 0.09	0.46 $\pm$ 0.16
Bi-AdaIN + MI (proposed)	1.68 $\pm$ 0.08	4.25 $\pm$ 0.27	0.21 $\pm$ 0.07	0.14 $\pm$ 0.06	0.18 $\pm$ 0.08

Model	Predictive accuracy		Causal effect bias (BATE) ( $↓$ )
Model	MAE	MSE	ChemoRT versus RT	ChemoRT versus RT+EGFRI	RT versus RT+EGFRI
Baseline (concatenation)	1.81 $\pm$ 0.09	5.35 $\pm$ 0.28	1.89 $\pm$ 0.17	0.65 $\pm$ 0.10	1.70 $\pm$ 0.20
Baseline + Bi-AdaIN	1.76 $\pm$ 0.08	4.22 $\pm$ 0.26	1.85 $\pm$ 0.16	0.53 $\pm$ 0.09	1.66 $\pm$ 0.19
Baseline + adversarial	1.84 $\pm$ 0.10	5.41 $\pm$ 0.31	1.59 $\pm$ 0.20	0.38 $\pm$ 0.12	1.42 $\pm$ 0.22
Bi-AdaIN + adversarial	1.69 $\pm$ 0.09	4.30 $\pm$ 0.29	1.15 $\pm$ 0.17	0.28 $\pm$ 0.10	0.95 $\pm$ 0.18
Baseline + MI	1.86 $\pm$ 0.10	5.44 $\pm$ 0.32	0.48 $\pm$ 0.15	0.23 $\pm$ 0.09	0.46 $\pm$ 0.16
Bi-AdaIN + MI (proposed)	1.68 $\pm$ 0.08	4.25 $\pm$ 0.27	0.21 $\pm$ 0.07	0.14 $\pm$ 0.06	0.18 $\pm$ 0.08

Note(s):

The BATE values involving the RT+EGFRI treatment group should be interpreted with caution due to the smaller sample size (n = 72) in this cohort compared to the ChemoRT (n = 1,413) and RT (n = 1,861) groups

[ViewLarge]