OpenAI o3/o4-mini模型AI生成文本含特殊符号，推测为隐形水印

0次浏览发布时间：2025-04-22 12:19:00

IT之家 4 月 22 日消息，AI 初创公司 Rumi 发现 OpenAI 公司在 o3 和 o4-mini 模型中，嵌入了窄不换行空格（Narrow No-Break Space, NNBSP, U+202F）等特殊 Unicode 字符。

IT之家注：这些字符在普通视图中与标准空格无异，但在 SoSciSurvey 或 Sublime Text 等专业工具中，可检测其独特代码。

Rumi 表示在 GPT-4o 等 OpenAI 此前模型中，并不存在这些设置，这些选项可以通过简单的“查找替换”移除，推测这可能是 OpenAI 故意设置的水印。

Rumi 强调，这种字符检测方法误报率极低，但易被绕过的缺陷明显。另一种解释是，这些字符符合排版规则，用于防止货币符号与金额或姓名缩写间换行，可能是模型从训练数据中习得的习惯。

OpenAI 此前曾探索过多种水印方案，例如在 2024 年初为 DALL・E 3 图像添加 C2PA 元数据，以及 2025 年 4 月在 GPT-4o 模型上测试可见的“ImageGen”标签。

行业内，谷歌的 SynthID、微软的元数据嵌入和 Meta 的强制标签也反映出对内容溯源的重视，但研究显示许多水印技术易受攻击。