17:58 清华大学与瑞莱智慧联合团队推出RealSafe-R1大模型
2月23日,清华大学与瑞莱智慧联合团队推出大语言模型RealSafe-R1。据悉,该模型基于DeepSeek R1进行深度优化与后训练,在确保性能稳定的基础上,实现了安全性的显著提升。瑞莱智慧方面表示,连日来,国产开源大模型DeepSeek的优异表现令人惊艳,其在自然语言处理和多任务推理方面的能力展现了强大的技术实力,尤其是在复杂问题解决和创造性任务中表现出色。然而,DeepSeek R1和V3在面对“越狱攻击”等安全性挑战时仍存在一定的局限性。例如,模型可能会被恶意设计的输入误导,生成不符合预期或不安全的响应。这一安全短板并非DeepSeek所独有的难题,而是当前开源大模型的通病,其根本缺陷源于安全对齐机制的深度不足。(每日经济新闻)
微信扫一扫
分享