Counterfactual Routing Awakens Dormant Experts in MoE Models

Researchers introduce training-free Counterfactual Routing to activate dormant long-tail experts in MoE LLMs, improving factual accuracy 3.1% on benchmarks without added compute (arXiv:2604.14246).

Static Top-k routing in sparse Mixture-of-Experts models favors high-frequency patterns, leaving specialist experts for long-tail knowledge under-activated despite causal importance on other inputs (Hu et al., arXiv:2604.14246). Counterfactual Routing integrates layer-wise perturbation analysis with the Counterfactual Expert Impact metric to shift resources from syntax-dominant to knowledge-intensive layers while holding total activation count constant (Hu et al., arXiv:2604.14246).

Switch Transformers established MoE scalability via similar routing but left long-tail hallucination unaddressed (Fedus et al., arXiv:2101.03961); a hallucination survey documented factual errors on rare facts as systemic across LLMs (Huang et al., arXiv:2311.05232). The source understates how CoR's virtual ablation retrieves causally decisive experts without retraining, a connection to mechanistic interpretability techniques omitted in original coverage.

CoR yields 3.1% average factual accuracy gain on TruthfulQA, FACTOR, and TriviaQA with unchanged inference budget, outperforming static scaling on the Pareto frontier (Hu et al., arXiv:2604.14246).

THE FACTUM

Counterfactual Routing Awakens Dormant Experts in MoE Models

Sources (3)