ScholarGate
어시스턴트
Machine learningDeep learning / NLP / CV

미세 조정된 비전 트랜스포머

미세 조정된 비전 트랜스포머(Fine-Tuned Vision Transformer)는 이미지를 고정 크기 패치로 분할하고 셀프 어텐션 레이어를 통해 처리하는 대규모 사전 훈련된 ViT 모델을 비교적 작은 레이블 데이터셋을 사용하여 새로운 이미지 분류 또는 인식 작업에 적응시킵니다. 대규모 사전 훈련 중에 학습된 풍부한 표현을 활용하여 컴퓨터 비전에서 최첨단 정확도를 달성합니다.

MethodMind에서 열기곧 제공동영상곧 제공Download slides

방법 전문 읽기

회원 전용

무료 계정으로 로그인하면 이 섹션을 읽을 수 있습니다.

로그인

Method map

The neighbourhood of related methods — select a node to explore.

+4 more

출처

  1. Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. In International Conference on Learning Representations (ICLR 2021). link
  2. Zhai, X., Kolesnikov, A., Houlsby, N., & Beyer, L. (2022). Scaling Vision Transformers. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR 2022), pp. 12104-12113. link

이 페이지 인용 방법

ScholarGate. (2026, June 3). Fine-Tuned Vision Transformer (ViT with Task-Specific Adaptation). ScholarGate. https://scholargate.app/ko/deep-learning/fine-tuned-vision-transformer

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

이 방법을 참조하는 항목

ScholarGateFine-Tuned Vision Transformer (Fine-Tuned Vision Transformer (ViT with Task-Specific Adaptation)). 2026-06-15에 다음에서 검색함: https://scholargate.app/ko/deep-learning/fine-tuned-vision-transformer · 데이터셋: https://doi.org/10.5281/zenodo.20539026