OpenAI 向欧盟开放 GPT-5.5-Cyber 访问权限:模型专业化技术分析及其与 Anthropic 策略的战略分歧

编辑者: Aleksandr Lytviak

OpenAI 向欧盟开放 GPT-5.5-Cyber 访问权限:模型专业化技术分析及其与 Anthropic 策略的战略分歧-1

OpenAI 已向欧盟开放了其针对网络安全任务定制的专业化模型 GPT-5.5-Cyber 的访问权限。此举之所以备受关注,不仅在于开放本身,更在于其架构层面的深度改进和评估方法论,这与 Anthropic 较为谨慎的策略形成了鲜明对比。

该模型基于混合专家架构构建,总参数量约为 1.2 万亿,其中包含 12 个活跃专家,每个专家拥有 1200 亿参数,分别负责应对不同类别的威胁。模型微调基于 MITRE ATT&CK 框架下的合成攻击数据集进行,并采用了一种通过专业分析代理反馈进行强化的 RLHF 变体。结果显示,在 MITRE 技术检测基准测试中,该模型实现了 94.7% 的零样本准确率,比之前的 GPT-5 版本提高了 11 个百分点。

然而,其评估方法也引发了一些疑虑:相关测试主要在 OpenAI 的内部数据集上进行,而非完全独立的公共数据集。目前缺乏能够展示各微调组件贡献度的消融实验数据。这导致外界难以判断性能的提升究竟源于网络安全领域的专业化改进,还是仅仅受益于模型规模的整体增长。

与 Anthropic 于 2026 年 4 月推出的 Mythos 模型相比,两者的开发理念存在根本性分歧。Anthropic 强调多层级的宪法级审查,并发布有关故障模式的详尽报告,而 OpenAI 则仅提供汇总指标。这种分歧反映了双方在如何披露关键基础设施模型局限性方面的立场差异。

GPT-5.5-Cyber 在欧盟的部署,使当地监管机构和关键基础设施运营者能够在不将原始数据传出该地区的情况下,针对实际场景对模型进行测试。这开创了受控访问前沿模型的先例,可能对未来人工智能跨境使用的协议产生深远影响。

与此同时,该模型对针对其网络组件专门设计的自适应攻击的抵御能力尚不明确。业界可能会将关注点集中在针对提示词注入攻击的独立抗性验证,以及在开源数据集上重现其测试结果。

关键结论是,获得 GPT-5.5-Cyber 的访问权为欧盟提供了加速制定专业模型评估标准的工具,但也要求其同步投资于独立验证体系的建设。

9 查看

来源

  • EU confirms OpenAI offers access to cybersecurity model

  • OpenAI to give EU access to new cyber model

你发现了错误或不准确的地方吗?我们会尽快考虑您的意见。