Skip to main content

研究员对Anthropic新模型的防护栏不满人工智能公司 Anthropic 周二发布了其最新模型 Fable,将其宣传为公司功能强大的网络安全模型 Mythos的公开且受限版本

  1. 研究员对Anthropic新模型的防护栏不满

    人工智能公司 Anthropic 周二发布了其最新模型 Fable,将其宣传为公司功能强大的网络安全模型 Mythos的公开且受限版本。但并非所有人都对这些限制感到满意,一些网络安全研究人员和专业人士在网上表达了抱怨。“Fable拒绝任何可能与网络安全相关的请求。即使是像阅读博客文章这样无害的任务,”知名安全研究员 Chompie 说。当提示词触发其防护栏时,Fable会暂停聊天并说其“安全措施将此消息标记为涉及网络安全或生物主题。”设置防护栏是为了限制Fable可能被用于开发恶意软件或破坏软件的风险。尽管出发点是好的,但许多网络安全专家仍然对这些限制措施的随意性感到不满。

    —— Techcrunch