Machine learning

Patch Time Series Transformer

Подача до Transformer одного часового кроку за раз призводить до марнування уваги на крихітних, зашумлених фрагментах і погано масштабується для довгих історій. Натомість PatchTST групує послідовні точки в короткі перекривні вікна, звані патчами, і розглядає кожен патч як єдиний токен — подібно до того, як речення читається слово за словом, а не літера за літерою. Це надає кожному токену багатший локальний контекст, скорочує послідовність, яку повинен обробляти механізм уваги, і дозволяє моделі ефективно вловлювати довгострокові закономірності.

Відкрити у MethodMindНезабаромВідеоНезабаромDownload slides

Читати метод повністю

Лише для учасників

Увійдіть із безкоштовним обліковим записом, щоб прочитати цей розділ.

Увійти

Method map

The neighbourhood of related methods — select a node to explore.

+4 more

Джерела

  1. Nie, Y., Nguyen, N. H., Sinthong, P. & Kalagnanam, J. (2023). A Time Series is Worth 64 Words: Long-term Forecasting with Transformers. ICLR. link
  2. Zhou, T., Ma, Z., Wen, Q., Wang, X., Sun, L. & Jin, R. (2022). FEDformer: Frequency Enhanced Decomposed Transformer for Long-term Series Forecasting. ICML. link

Як цитувати цю сторінку

ScholarGate. (2026, June 1). Patch Time Series Transformer. ScholarGate. https://scholargate.app/uk/deep-learning/patchtst

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Згадується в

ScholarGatePatchTST (Patch Time Series Transformer). Отримано 2026-06-15 з https://scholargate.app/uk/deep-learning/patchtst · Набір даних: https://doi.org/10.5281/zenodo.20539026