| Enfocament |
Atenció global i seqüencial. |
Procés iteratiu de soroll. |
| Aplicacions principals |
Classificació, detecció. |
Generació i edició d'imatges. |
| Complexitat |
Alta (requereix molts recursos). |
Moderada (més eficient). |
| Escalabilitat |
Excel·lent amb dades grans. |
Bona, però menys que ViT. |