架构与训练

124 种方法属于此方法族。

精选

对抗训练Adversarial Training is a robust optimization procedure for deep neural networks in which the model is trained not on clean data alone but on worst-case perturbed inputs crafted du AlexNetAlexNet is a deep convolutional neural network (CNN) introduced by Alex Krizhevsky, Ilya Sutskever, and Geoffrey Hinton in 2012. It won the ImageNet Large Scale Visual Recognition 批量归一化Batch Normalization is a training technique introduced by Sergey Ioffe and Christian Szegedy in 2015 that normalizes the pre-activation outputs of each layer using the mean and var 胶囊网络A Capsule Network (CapsNet) is a deep learning architecture introduced by Sara Sabour, Nicholas Frosst and Geoffrey Hinton in 2017 that organises neurons as vectors (capsules) rath 卷积神经网络（分类）A Convolutional Neural Network (CNN) is a deep learning model, established by LeCun and colleagues in 1998, that learns local patterns directly from images and structured data to c 课程学习Curriculum Learning is a training strategy for machine learning models, introduced by Bengio et al. in 2009, in which training examples are presented in a meaningful order—typicall

阅读路径

本主题被引用最多的基础方法，按其提出的先后顺序排列——若您初次接触，不妨从这里开始。

强化学习1950s–1998作者：Sutton, R. S. & Barto, A. G. (formalised); Bellman, R. (foundations)
多层感知机 (MLP)1986作者：Rumelhart, D. E.; Hinton, G. E.; Williams, R. J.
基于卷积神经网络的迁移学习2010–2014作者：Pan, S. J. & Yang, Q. (transfer learning framework); popularized for CNNs by Yosinski et al. and Razavian et al.
微调卷积神经网络2012–2014作者：Yosinski, J. et al. (theoretical basis); practice widespread from Krizhevsky et al. 2012 onward
多模态句子嵌入2013–2021作者：Frome et al. (DeViSE, 2013); popularized by Radford et al. (CLIP, 2021)
残差网络（ResNet）2016作者：He, K.; Zhang, X.; Ren, S.; Sun, J.
实例分割2017作者：He, K., Gkioxari, G., Dollar, P., Girshick, R.
多语言句子嵌入2019–2022作者：Reimers, N. & Gurevych, I.; Feng, F. et al. (Google)

本栏架上的全部方法 ↓

全部方法 124

对抗训练 AlexNet 批量归一化胶囊网络卷积神经网络（分类）课程学习数据增强 (Data Augmentation)深度信念网络 (DBN)深度强化学习 DenseNet Dilated CNN DLinear：时间序列预测的分解线性模型域自适应卷积神经网络域自适应Doc2Vec 领域自适应实例分割领域自适应多层感知器领域自适应问答域自适应强化学习领域自适应文本摘要 Dropout 回声状态网络 EfficientNet 可解释图神经网络可解释实例分割可解释问答可解释强化学习可解释句子嵌入可解释文本摘要 Faster R-CNN FiLM: 频率改进的勒让德记忆模型微调卷积神经网络微调Doc2Vec 微调多层感知机微调强化学习 FreTS：用于时间序列预测的频域MLP 图卷积网络 (GCN)图神经网络 Inception Network（GoogLeNet）实例分割知识蒸馏 Kolmogorov-Arnold Networks Koopa：用于非平稳时间序列的 Koopman 预测器 LightTS：面向多变量时间序列预测的轻量级采样MLP LoRA 和 PEFT Mamba（状态空间模型）MICN：用于长期时间序列预测的多尺度等距卷积网络专家混合模型 MobileNet：面向移动视觉的高效卷积神经网络多层感知机 (MLP)多语言卷积神经网络多语言Doc2Vec 多语言图神经网络多语言多层感知机多语言问答多语言强化学习多语言句子嵌入多模态卷积神经网络多模态Doc2Vec 多模态图神经网络多模态实例分割多模态多层感知器多模态问题解答多模态强化学习多模态句子嵌入多模态文本摘要多任务学习 N-BEATS N-BEATSx N-HiTS NEAT：拓扑增强神经进化神经架构搜索 Neural ODE 神经辐射场 (NeRF)神经风格迁移归一化流强化学习残差网络（ResNet）ResNeXt 受限玻尔tzmann机 (RBM)SCINet：用于时间序列预测的样本卷积与交互网络 Segment Anything Model 自监督卷积神经网络自监督实例分割自监督问答自监督强化学习自监督句子嵌入半监督卷积神经网络半监督Doc2Vec 半监督图神经网络半监督实例分割半监督多层感知机半监督问答半监督强化学习半监督句子嵌入半监督文本摘要动量SGD / Adam优化器 Siamese Neural Network SimCLR 时空图卷积网络 Sundial：生成式时间序列基础模型 TextCNN TiDE：时间序列密集编码器 TimeMixer：可分解的多尺度混合时间序列预测 TimesFM：面向时间序列预测的仅解码器基础模型 TimesNet：面向时间序列的二维时变建模基于卷积神经网络的迁移学习基于图神经网络的迁移学习实例分割迁移学习迁移学习与强化学习 (Transfer RL) 是一种训练范式，其中代理在一个或多个源任务中获得的知识迁移学习与文本摘要基于Word2Vec的迁移学习 TSMixer：全MLP架构用于时间序列预测 U-Net VGGNet（超深度卷积网络）视觉曼巴视觉对比学习弱监督卷积神经网络弱监督图神经网络弱监督实例分割弱监督多层感知机弱监督问答弱监督强化学习弱监督句子嵌入弱监督文本摘要

深度学习中的更多内容

序列与生成式 103