微软新推 Fara1.5 系列智能体模型,任务成功率高达 72%!超越 OpenAI!

微软研究院 AI Frontiers 实验室近日揭晓全新 Fara1.5 系列智能体模型,为浏览器场景量身打造,进一步推动计算机使用的智能化进程。该系列涵盖 4B、9B 与 27B 三个参数规模,旨在通过更自然的交互方式,让浏览器化身为可听、可看、可执行的智能伙伴。
Fara1.5 与 MagneticLite 沙盒浏览器界面深度融合,能直接读取浏览器截图,并模拟鼠标与键盘操作,自主完成各类网页任务。其核心机制遵循“观察 — 思考 — 行动”的循环模式,在每一步决策中融合历史对话与最近三张屏幕截图,实现动态推理与精准响应。

在性能表现上,Fara1.5-27B 在 Online-Mind2Web 基准测试中任务成功率高达 72%,显著领先于 OpenAI Operator(58.3%)与 Gemini 2.5 Computer Use(57.3%)。即便是轻量级的 9B 版本,也取得了 63.4% 的成功率,展现出优异的效率与实用性。
训练数据方面,Fara1.5 基于约 200 万条多样样本进行微调,涵盖网页轨迹(60%)、合成环境(12.8%)、用户交互(12.5%)、事实锚定(8.8%)及视觉问答(4.9%),这种多层次、多场景的训练策略大幅提升了模型的适应能力与智能水平。
在安全机制上,Fara1.5 在三种情况下会主动暂停并征询用户确认:涉及缺失个人信息、任务描述模糊,以及即将执行未经授权的不可逆操作。所有操作均记录于 MagneticLite 沙盒内,严格守护智能体与用户设备之间的安全边界。
随着人工智能与日常浏览体验的不断融合,Fara1.5 系列不仅展现了技术的前瞻性,也为未来人机协作模式提供了新的可能。
✨ 亮点聚焦:
▸ 任务成功率突破 72%,性能领先行业同类模型
▸ 基于“观察‑思考‑行动”循环,实现类人交互逻辑
▸ 沙盒运行 + 安全询问机制,兼顾智能与隐私保护