阿里云推出通义千问首款专为安全防护设计的护栏模型 Qwen3Guard

9 月 28 日消息,阿里云通义团队今日宣布推出 Qwen3Guard,这是 Qwen 家族中首款专为安全防护设计的护栏模型。

该模型基于强大的 Qwen3 基础架构打造,并针对安全分类任务进行了专项微调,旨在为人工智能交互提供精准、可靠的安全保障。

通义团队表示,无论是用户输入的提示,还是模型生成的回复,Qwen3Guard 均可高效识别潜在风险,输出细粒度的风险等级与分类标签,帮助打造更负责任的 AI 应用。

在多项主流安全评测基准上,Qwen3Guard 表现卓越,稳居行业领先水平,全面覆盖英语、中文及多语言场景下的提示与回复安全检测任务。

据介绍,Qwen3Guard 提供两大专业版本,满足不同应用场景需求:

  • Qwen3Guard-Gen(生成式版) 支持对完整用户输入与模型输出进行安全分类,适用于离线数据集的安全标注、过滤,亦可作为强化学习中基于安全性的奖励信号源,是构建高质量训练数据的理想工具。

  • Qwen3Guard-Stream(流式检测版) 突破了传统的护栏模型架构,首次实现模型生成过程中的实时、流式安全检测,显著提升在线服务的安全响应效率与部署灵活性。

为适配多样化的部署环境与算力资源,两大版本均提供 0.6B、4B、8B 三种参数规模,兼顾性能与效率,满足从边缘设备到云端服务的全场景需求。

Qwen3Guard 支持 119 种语言及方言,适用于全球部署与跨语言应用场景,并在各类语言中均能提供稳定、高质量的安全检测能力。

附官方地址:

  • HuggingFace:https://huggingface.co/collections/Qwen/qwen3guard-68d2729abbfae4716f3343a1?spm=a2ty_o06.30285417.0.0.3d0fc921LMucKn

  • ModelScope:https://modelscope.cn/collections/Qwen3Guard-308c39ef5ffb4b?spm=a2ty_o06.30285417.0.0.3d0fc921LMucKn

  • 阿里云 AI 安全护栏服务:https://www.aliyun.com/product/content-moderation/guardrail?spm=a2ty_o06.30285417.0.0.3d0fc921LMucKn

Published by

风君子

独自遨游何稽首 揭天掀地慰生平