Arquitectura de red neuronal diseñada para procesar datos secuenciales, utilizada en modelos avanzados como GPT y BERT.