首页 > 其他分享 >On the Opportunities and Risks of Foundation Models

On the Opportunities and Risks of Foundation Models

时间:2023-11-18 23:22:36浏览次数:47  
标签:Foundation 语言 NLP Models 模型 学习 监督 Risks BERT

 

  随着 BERT、DALL-E、GPT-3 等大规模预训练模型的出现,AI 社区正在经历一场范式转变。

  在 BERT 出现(2018 年)之前,语言模型的自监督学习本质上只是 NLP 的一个子领域,与其他 NLP 子领域并行发展。但在 BERT 横扫 11 项 NLP 任务之后,这种格局被打破了。2019 年之后,使用自监督学习构造语言模型俨然已经成为一种基础操作,因为使用 BERT 已经成为一种惯例。这标志着大模型时代的开始。

  问题:为什么这里说自监督学习的BERT,最终标志着大模型时代的开始?

     自监督学习对语言模型意味着什么?

     除了自监督学习,在NLP中的其他子领域是什么?

 

引用链接:https://zhuanlan.zhihu.com/p/401157815

论文链接:https://arxiv.org/pdf/2108.07258.pdf

正文分四部分,阐述内容如下:

  • 能力:模型的能力,模型可以做到的事
    • 语言、视觉、机器人学、推理、交互、理解等;
  • 应用:可应用领域
    • 医疗、法律、教育等;
  • 技术:实现过程中涉及到的问题
    • 建模、训练、适应、评估、系统、数据、安全与隐私、稳健性、理论、可解释性等;
  • 社会影响:
    • 不平等、滥用、环境、法规、经济、伦理等。

 

 

 

 

 

标签:Foundation,语言,NLP,Models,模型,学习,监督,Risks,BERT
From: https://www.cnblogs.com/paramotor/p/17841469.html

相关文章

  • Conditional Probability Models for Deep Image Compression
    \(\quad\)在自编码器中使用深度网络已成为有前途的研究方向,这种学习网络有两个挑战:处理量化与控制reconstructionerror(distortion)entropy(rate)ofthelatentimagerepresentation之间的权衡(rate都用熵表示吗?)introduction\(\quad\)训练这种基于网络的压缩方法有一个......
  • Windows Media Foundation读取摄像头数据
    可以读取数据,设置分辨率如果我们期望的数据格式与摄像头的数据格式不同,就需要设置MF_SOURCE_READER_ENABLE_ADVANCED_VIDEO_PROCESSING 否则不需要以下是代码:intReadCameraData(UINT32width,UINT32height){IMFAttributes*attributes=NULL;IMFActivate**devices=N......
  • [论文阅读] Latent Consistency Models@ Synthesizing High-Resolution Images with F
    1.Pretitle:LatentConsistencyModels:SynthesizingHigh-ResolutionImageswithFew-StepInferenceaccepted:arXiv2023(ICLR2024Submission)paper:https://arxiv.org/abs/2303.01469code:https://github.com/openai/consistency_modelsref:https://mp.wei......
  • Adding Conditional Control to Text-to-Image Diffusion Models
    https://mp.weixin.qq.com/s/iL6YitT7EGP6DnrBehb9MQ1.AddingConditionalControltoText-to-ImageDiffusionModels论文地址:https://arxiv.org/pdf/2302.05543.pdf开源地址:https://github.com/lllyasviel/ControlNet(该项目已有2.4万stars)作者单位:斯坦福大学这......
  • 【论文阅读笔记】【OCR-文本识别】 Scene Text Recognition with Permuted Autoregres
    PARSeqECCV2022读论文思考的问题论文试图解决什么问题?一些文本识别模型会对semantic信息建模,从而辅助某些困难情况下的文本识别传统的auto-regressive方式限制了语义信息的传输方向;双向的auto-regressive聚合增加了不必要的计算量和复杂度;聚合视觉模型和语言......
  • PyTorch SAVING AND LOADING MODELS
    Saving&LoadingModelforInferenceSave/Load state_dict (Recommended)Save:torch.save(model.state_dict(),PATH)Load:model=TheModelClass(*args,**kwargs)model.load_state_dict(torch.load(PATH))model.eval()REFhttps://pytorch.org/tutorials/beginner/sa......
  • Python时间序列分析库介绍:statsmodels、tslearn、tssearch、tsfresh
    时间序列分析在金融和医疗保健等领域至关重要,在这些领域,理解随时间变化的数据模式至关重要。在本文中,我们将介绍四个主要的Python库——statmodels、tslearn、tssearch和tsfresh——每个库都针对时间序列分析的不同方面进行了定制。这些库为从预测到模式识别的任务提供了强大的工......
  • Transformer-based Encoder-Decoder Models
    整理原链接内容方便阅读https://colab.research.google.com/github/patrickvonplaten/notebooks/blob/master/Encoder_Decoder_Model.ipynbtitle:"Transformer-basedEncoder-DecoderModels"thumbnail:/blog/assets/05_encoder_decoder/thumbnail.pngauthors:user:p......
  • 执行这个这个命令sh download_depth_models.sh【记录】
     要下载上述模型,自己的电脑执行不了sh命令。 网上先下载git这个软件。sh.exe用这个软件来运行cd到 download_depth_models.sh这个文件所在的路径 再sh download_depth_models.sh执行这个命令! 方法二:直接用记事本打开这个文件download_depth_models.sh里面有ur......
  • Conditional Probability Models for Deep Image Compression
    深度神经网络被训练来作为图像压缩的自动编码器是一个前沿方向,面临的挑战有两方面——量化(quantization)和权衡reconstructionerror(distortion)andentropy(rate),这篇文章关注后者。主要思想是使用上下文模型直接对潜在表示的熵建模;3D-CNN一个学习自动编码器潜在分布的条......