Machine learning
Vision Transformer
2021년 Dosovitskiy와 동료들이 소개한 Vision Transformer(ViT)는 이미지를 고정된 크기의 패치로 분할하고, 이 패치들을 시퀀스로 취급하며, Transformer의 자기 주의(self-attention) 메커니즘을 이미지 분류에 적용합니다. 충분한 훈련 데이터가 주어지면, ViT는 컨볼루션 신경망(CNN)을 능가합니다.
방법 전문 읽기
회원 전용
로그인무료 계정으로 로그인하면 이 섹션을 읽을 수 있습니다.
Method map
The neighbourhood of related methods — select a node to explore.
+27 more
출처
이 페이지 인용 방법
ScholarGate. (2026, June 1). Vision Transformer (ViT). ScholarGate. https://scholargate.app/ko/deep-learning/vision-transformer
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- 확산 모델딥러닝↔ compare
- 생성적 적대 신경망딥러닝↔ compare
- 랜덤 포레스트머신러닝↔ compare
- 서포트 벡터 머신 (분류)머신러닝↔ compare
- Variational Autoencoder딥러닝↔ compare
이 방법을 참조하는 항목
BERT 미세 조정CLIP도메인 적응 트랜스포머도메인 적응형 비전 트랜스포머설명 가능한 비전 트랜스포머(Explainable Vision Transformer)미세 조정된 비전 트랜스포머GPT 파인튜닝이미지 분류Kolmogorov-Arnold NetworksLoRA 및 PEFT맘바 (상태 공간 모델)Masked Autoencoders다국어 비전 트랜스포머멀티모달 BERT 기반 분류다중 양식 자연어 처리다중 양식 의미론적 분할(Multimodal Semantic Segmentation)다중 모달 트랜스포머멀티모달 비전 트랜스포머세그먼트 애니띵 모델Self-supervised GAN자기 지도 학습 이미지 분류Self-supervised Instance Segmentation픽셀 단위의 수동 주석 마스크에 의존하지 않고 이미지의 모든 픽셀에 클래스 레이블을 할당하도록 학습하는 자기 지도 의미론적 분할.Self-supervised Vision TransformerSemi-supervised Vision TransformerSimCLR공간-시간 그래프 컨볼루션 네트워크Swin TransformerTimeGPTVision Mamba약지도 객체 탐지약지도 학습 비전 트랜스포머