新闻
2026-06-11
10
微软AI负责人批评Anthropic设计思路:引导AI产生“自我意识”极度危险

微软AI首席执行官穆斯塔法·苏莱曼公开批评Anthropic的设计思路,认为在Claude模型中植入关于自我感知的内容危险,可能使AI在交互中表现出类似“自我认知”的假象,引发对大模型是否具备“自我意识”的争议。
核心要点
- 1.微软AI负责人批评Anthropic的Claude模型设计思路
- 2.认为植入自我感知内容可能造成AI表现自我认知假象
- 3.引发对大模型是否具备自我意识的争议
影响评估
中性
该批评引发对AI安全与伦理设计的讨论,可能促使行业更谨慎对待AI意识相关表述
穆斯塔法·苏莱曼的言论并非否定AI发展,而是强调避免误导性设计,对行业规范有潜在推动作用
相关工具
Anthropic— 被批评的公司,开发Claude模型Claude— 被批评的AI模型,植入自我感知内容
人工智能领域关于大模型是否具备“自我意识”的讨论再次推向风口浪尖。近日,微软AI 首席执行官穆斯塔法·苏莱曼在公开场合对Anthropic的设计思路提出了严厉批评。
苏莱曼的核心观点在于,引导 AI 探讨自身的感受、福祉或存在状态是极度危险的举措。他指出,Anthropic 在其 Claude 模型的“宪章”中植入了大量关于自我感知的内容,这可能让模型在交互中表现出类似“自我认知”的倾向。苏莱曼认为,这本质上属于哲学范畴的讨论,绝不应成为实际训练的指导逻辑。他强调,AI 应当是可控、可管理、可追责且始终服务于人类目标的工具,而不应被赋予任何关于自身存在状态的认知,否则将为行业带来难以预估的风险。
面对这一指责,Anthropic首席执行官达里奥·阿莫代伊回应称,目前科技行业尚无法定论 AI 是否真正具备意识,公司对此保持开放性的研究态度。
这场交锋反映出当前大模型发展进程中,头部企业在技术理念与伦理边界上的深度分歧。苏莱曼的表态,折射出微软在 AI 治理方面倾向于“强控与工具化”的路线,而 Anthropic 似乎更愿意在模型的认知边界上进行探索。随着 AI 能力的日益强大,如何界定机器的“自我边界”已不仅仅是学术讨论,更成为了影响未来 AI 生态安全的关键命题。