ScholarGate
助手

架构与训练

124 种方法属于此方法族。

精选

阅读路径

本主题被引用最多的基础方法,按其提出的先后顺序排列——若您初次接触,不妨从这里开始。

  1. 强化学习1950s–1998作者:Sutton, R. S. & Barto, A. G. (formalised); Bellman, R. (foundations)
  2. 多层感知机 (MLP)1986作者:Rumelhart, D. E.; Hinton, G. E.; Williams, R. J.
  3. 基于卷积神经网络的迁移学习2010–2014作者:Pan, S. J. & Yang, Q. (transfer learning framework); popularized for CNNs by Yosinski et al. and Razavian et al.
  4. 微调卷积神经网络2012–2014作者:Yosinski, J. et al. (theoretical basis); practice widespread from Krizhevsky et al. 2012 onward
  5. 多模态句子嵌入2013–2021作者:Frome et al. (DeViSE, 2013); popularized by Radford et al. (CLIP, 2021)
  6. 残差网络(ResNet)2016作者:He, K.; Zhang, X.; Ren, S.; Sun, J.
  7. 实例分割2017作者:He, K., Gkioxari, G., Dollar, P., Girshick, R.
  8. 多语言句子嵌入2019–2022作者:Reimers, N. & Gurevych, I.; Feng, F. et al. (Google)
本栏架上的全部方法 ↓

全部方法 124

对抗训练AlexNet批量归一化胶囊网络卷积神经网络(分类)课程学习数据增强 (Data Augmentation)深度信念网络 (DBN)深度强化学习DenseNetDilated CNNDLinear:时间序列预测的分解线性模型域自适应卷积神经网络域自适应Doc2Vec领域自适应实例分割领域自适应多层感知器领域自适应问答域自适应强化学习领域自适应文本摘要Dropout回声状态网络EfficientNet可解释图神经网络可解释实例分割可解释问答可解释强化学习可解释句子嵌入可解释文本摘要Faster R-CNNFiLM: 频率改进的勒让德记忆模型微调卷积神经网络微调Doc2Vec微调多层感知机微调强化学习FreTS:用于时间序列预测的频域MLP图卷积网络 (GCN)图神经网络Inception Network(GoogLeNet)实例分割知识蒸馏Kolmogorov-Arnold NetworksKoopa:用于非平稳时间序列的 Koopman 预测器LightTS:面向多变量时间序列预测的轻量级采样MLPLoRA 和 PEFTMamba(状态空间模型)MICN:用于长期时间序列预测的多尺度等距卷积网络专家混合模型MobileNet:面向移动视觉的高效卷积神经网络多层感知机 (MLP)多语言卷积神经网络多语言Doc2Vec多语言图神经网络多语言多层感知机多语言问答多语言强化学习多语言句子嵌入多模态卷积神经网络多模态Doc2Vec多模态图神经网络多模态实例分割多模态多层感知器多模态问题解答多模态强化学习多模态句子嵌入多模态文本摘要多任务学习N-BEATSN-BEATSxN-HiTSNEAT:拓扑增强神经进化神经架构搜索Neural ODE神经辐射场 (NeRF)神经风格迁移归一化流强化学习残差网络(ResNet)ResNeXt受限玻尔tzmann机 (RBM)SCINet:用于时间序列预测的样本卷积与交互网络Segment Anything Model自监督卷积神经网络自监督实例分割自监督问答自监督强化学习自监督句子嵌入半监督卷积神经网络半监督Doc2Vec半监督图神经网络半监督实例分割半监督多层感知机半监督问答半监督强化学习半监督句子嵌入半监督文本摘要动量SGD / Adam优化器Siamese Neural NetworkSimCLR时空图卷积网络Sundial:生成式时间序列基础模型TextCNNTiDE:时间序列密集编码器TimeMixer:可分解的多尺度混合时间序列预测TimesFM:面向时间序列预测的仅解码器基础模型TimesNet:面向时间序列的二维时变建模基于卷积神经网络的迁移学习基于图神经网络的迁移学习实例分割迁移学习迁移学习与强化学习 (Transfer RL) 是一种训练范式,其中代理在一个或多个源任务中获得的知识迁移学习与文本摘要基于Word2Vec的迁移学习TSMixer:全MLP架构用于时间序列预测U-NetVGGNet(超深度卷积网络)视觉曼巴视觉对比学习弱监督卷积神经网络弱监督图神经网络弱监督实例分割弱监督多层感知机弱监督问答弱监督强化学习弱监督句子嵌入弱监督文本摘要

深度学习 中的更多内容