ScholarGate
Assistente
Machine learningTime-series forecasting

Reformer (The Efficient Transformer)

Imagine classificar todos os *tokens* em *buckets* com base em sua similaridade antes de calcular a atenção, de modo que cada *token* atenda apenas a um pequeno conjunto de vizinhos provavelmente relevantes, em vez de a todos os outros *tokens*. Isso é a atenção LSH. Combinado com camadas reversíveis – onde as ativações podem ser reconstruídas na passagem de retropropagação em vez de serem armazenadas – o Reformer processa sequências que são ordens de magnitude mais longas do que um Transformer padrão consegue acomodar na memória.

Abrir no MethodMindEm breveVídeoEm breveDownload slides

Leia o método completo

Exclusivo para membros

Entre com uma conta gratuita para ler esta seção.

Entrar

Method map

The neighbourhood of related methods — select a node to explore.

Fontes

  1. Kitaev, N., Kaiser, Ł., & Levskaya, A. (2020). Reformer: The efficient transformer. ICLR. link

Como citar esta página

ScholarGate. (2026, June 2). Reformer (The Efficient Transformer). ScholarGate. https://scholargate.app/pt/deep-learning/reformer

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Referenciado por

ScholarGateReformer (Reformer (The Efficient Transformer)). Recuperado em 2026-06-15 de https://scholargate.app/pt/deep-learning/reformer · Conjunto de dados: https://doi.org/10.5281/zenodo.20539026