WeDLM es un marco de vanguardia que reconcilia los Modelos de Lenguaje de Difusión (DLLMs) con mecanismos de atención causal estándar para lograr una inferencia rápida. Aborda las limitaciones de la generación autorregresiva tradicional al permitir la decodificación paralela mientras mantiene una salida de alta calidad. El marco está diseñado para mejorar la eficiencia de los modelos de lenguaje, haciéndolo adecuado para una variedad de aplicaciones, incluyendo razonamiento matemático y generación de código.