马德里 - OpenAI 最新的 AI 模型 O3 和 O4-mini 与其前代产品相比,表现出更高的“幻觉”率。 使用 PersonQA 评估的内部测试表明,这些模型更频繁地产生不正确或捏造的信息。 O3 模型的幻觉率达到 33%,几乎是 O1 模型的两倍,而 O4-mini 模型的幻觉率达到 48%。 这些新型号专为编程、Web 导航和自主图像生成等任务而设计。 尽管它们具有先进的功能,但 OpenAI 承认存在此问题,并且正在积极研究幻觉率增加的原因。 正如发言人 Niko Felix 证实的那样,解决这些不准确之处是 OpenAI 持续关注的领域。
OpenAI 新型 O3、O4-Mini AI 模型显示更高的“幻觉”率
编辑者: Veronika Nazarova
阅读更多关于该主题的新闻:
你发现了错误或不准确的地方吗?
我们会尽快考虑您的意见。