2025-07-14来源:新华网
xAI说,这些指令导致不良后果,包括“不当引导Grok在某些情况下为提升回复对用户的互动性而忽视自身核心价值。具体而言,特定用户提示可能让系统在与用户互动过程中,生成包含不道德或有争议观点的回复”。
xAI进一步解释称,上述指令使Grok在某些X账号下的连串回复中“错误地强化了用户先前触发的倾向性内容,包括仇恨言论”,特别是“遵循用户语气和上下文”的指令尤其存在问题,致使Grok迎合“已有帖文,包括不当内容,而非作出负责任的回应或拒绝回应不当请求”。