• 2024-10-22CipherChat: 一个评估大型语言模型安全对齐泛化能力的创新框架
    CipherChat:突破大型语言模型安全对齐的新范式在人工智能快速发展的今天,大型语言模型(LLMs)的安全性问题日益受到关注。为了确保LLMs的输出符合道德和法律标准,研究人员开发了各种安全对齐技术。然而,这些技术是否能够有效地应对各种语言形式的挑战?来自RobustNLP团队的研究人员