A Survey on Large Language Models with Multilingualism: Recent Advances and New Frontiers

时间：2024-09-21 23:24:03浏览次数：11

标签：场景语言 Language Models Advances 模型调查 LLM 大型

本文是LLM系列文章，针对《A Survey on Large Language Models with Multilingualism: Recent Advances and New Frontiers》的翻译。

多语言大型语言模型调查：最新进展和新前沿

摘要
1 引言
2 前言
3 具有多语言功能的大型语言模型
4 多语言推理策略
5 多语言大型语言模型的安全性
6 多语言场景下的多域 LLM
7 多语言数据来源
8 多语言基准测试和评估
9 偏见和公平
10 结论和未来方向

摘要

大型语言模型（LLM）的快速发展展示了自然语言处理方面的卓越多语言能力，吸引了全球学术界和工业界的关注。为了减少潜在的歧视并提高不同语言用户组的整体可用性和可访问性，语言公平技术的发展非常重要。尽管 LLM 取得了突破，但对多语言场景的调查仍然不足，需要进行全面调查以总结最近的方法、发展、局限性和潜在解决方案。为此，我们提供了一项关于多语言场景中 LLM 利用率的多角度调查。我们首先重新思考以前和现在关于预训练语言模型的研究之间的过渡。然后，我们介绍了关于 LLM 多语言的几个观点，包括训练和推理方法、模型安全性、多语言文化的多领域以及数据集的使用。我们还讨论了这些方面出现的主要挑战以及可能的解决方案。此外，我们强调了旨在进一步提高多语言 LLM 的未来研究方向。该调查旨在帮助研究界解决多语言问题，并提供对基于 LLM 的多语言自然语言处理的核心概念、关键技术和最新发展的全面理解。

1 引言

2 前言

3 具有多语言功能的大型语言模型

4 多语言推理策略

标签：场景,语言,Language,Models,Advances,模型,调查,LLM,大型
From： https://blog.csdn.net/c_cpp_csharp/article/details/142426573

A SURVEY ON FAIRNESS OF LARGE LANGUAGE MODELS IN E-COMMERCE: PROGRESS, APPLICATI
本文是LLM系列文章，针对《ASURVEYONFAIRNESSOFLARGELANGUAGEMODELSINE-COMMERCE:PROGRESS,APPLICATION,ANDCHALLENGE》的翻译。电子商务中大型语言模型公平性的调查：进展、应用与挑战摘要1引言2电子商务LLM的原则3偏差挑战4电子商务应用5未来方......
Phi-2: The surprising power of small language models
Phi-2:Thesurprisingpowerofsmalllanguagemodelshttps://www.microsoft.com/en-us/research/blog/phi-2-the-surprising-power-of-small-language-models/ Phi-2EvaluationBelow,wesummarizePhi-2performanceonacademicbenchmarkscomparedtopopularla......
论文阅读笔记：Sapiens: Foundation for Human Vision Models
Sapiens:FoundationforHumanVisionModels1背景1.1问题1.2目标2方法3创新点4模块4.1Humans-300M数据集4.2预训练4.32D位姿估计4.4身体部位分割4.5深度估计4.6表面法线估计5实验5.1实现细节5.22D位姿估计5.3身体部位分割5.4深度估计5.5表面法线估......
modelscope 命令行工具下载模型
默认下载路径Windows系统在Windows系统上，默认的缓存目录通常是：自定义下载路径如果你想指定下载路径，可以使用 --local-dir 选项。例如：这样，模型文件将会下载到 E:\tmp\model_file 目录中。参考文档: 模型的下载·文档中心(modelscope.cn)......
Why Is Prompt Tuning for Vision-Language Models Robust to Noisy Labels?
文章汇总本文的作者针对了提示学习的结构设计进行了分析，发现了一些规律：1)固定的类名令牌为模型的优化提供了强正则化，减少了由噪声样本引起的梯度。2)从多样化和通用的web数据中学习到的强大的预训练图像文本嵌入为图像分类提供了强大的先验知识。3)CLIP的噪声零样本预测......
Analysis of Code and Test-Code generated by Large Language Models
本文是LLM系列文章，针对《AnalysisofCodeandTest-CodegeneratedbyLargeLanguageModels》的翻译。大型语言模型生成的代码和测试代码的分析摘要1引言2方法3进行实验4测试结果的评估5讨论6相关工作7结论和未来工作摘要ChatGPT和Copilot等......
Imitating Language via Scalable Inverse Reinforcement Learning
本文是LLM系列文章，针对《ImitatingLanguageviaScalableInverseReinforcementLearning》的翻译。通过可扩展的逆向强化学习模仿语言摘要1引言2方法3实验4相关工作5讨论6结论摘要大多数语言模型训练都建立在模仿学习的基础上。它涵盖了预训练、监......
论文解读《MobileCLIP: Fast Image-Text Models through Multi-Modal Reinforced Trai
系列文章目录文章目录系列文章目录论文细节理解1、研究背景2、论文贡献3、方法框架4、研究思路5、实验6、限制论文细节理解Ensembleteacher.在深度学习领域，什么意思？在深度学习领域，“ensembleteacher”通常指的是一种模型集成的方法，其中多个模型（教师模型）共同训......
数据控制语言（DCL，Data Control Language）
目录GRANT语句REVOKE语句权限类型数据控制语言（DCL，DataControlLanguage）用于管理数据库中的权限和访问控制。DCL语句主要用于控制用户对数据库对象的访问权限。常见的DCL语句有GRANT和REVOKE。GRANT语句GRANT语句用于授予用户或角色对数据库对象（如表、视图......
（论文解读）Visual-Language Prompt Tuning with Knowledge-guided Context Optimization
Comment:acceptedbyCVPR2023基于知识引导上下文优化的视觉语言提示学习摘要提示调优是利用任务相关的可学习标记将预训练的视觉语言模型（VLM）适应下游任务的有效方法。基于CoOp的代表性的工作将可学习的文本token与类别token相结合，来获得特定的文本知识。然而，这些特定的文......