Reformer (The Efficient Transformer)
Imagine classificar todos os *tokens* em *buckets* com base em sua similaridade antes de calcular a atenção, de modo que cada *token* atenda apenas a um pequeno conjunto de vizinhos provavelmente relevantes, em vez de a todos os outros *tokens*. Isso é a atenção LSH. Combinado com camadas reversíveis – onde as ativações podem ser reconstruídas na passagem de retropropagação em vez de serem armazenadas – o Reformer processa sequências que são ordens de magnitude mais longas do que um Transformer padrão consegue acomodar na memória.
Leia o método completo
Entre com uma conta gratuita para ler esta seção.
Method map
The neighbourhood of related methods — select a node to explore.
Fontes
- Kitaev, N., Kaiser, Ł., & Levskaya, A. (2020). Reformer: The efficient transformer. ICLR. link ↗
Como citar esta página
ScholarGate. (2026, June 2). Reformer (The Efficient Transformer). ScholarGate. https://scholargate.app/pt/deep-learning/reformer
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- InformerAprendizado profundo↔ compare
- PyraformerAprendizado profundo↔ compare
Referenciado por
Encontrou um problema nesta página? Relate ou sugira uma correção →