拆解Manus:沙盒架构深度解析

Manus 是一个通用目的 AI 代理(General-Purpose AI Agent),它能够在完整的沙盒环境中运行并交付生产级结果[1]。与传统的单一 LLM 聊天机器人不同,Manus 采用更复杂的多代理协调系统(Multi-Agent Coordination System):用户提示首先传递给规划代理(Planner Agent),该代理将任务分解为一系列子任务;然后执行代理(Executor Agent)使用多种工具(从网页浏览到终端命令)完成这些子任务[2]。为了使执行代理能够像人类研究人员或开发者一样工作,Manus 必须为其提供一个完整的云计算机环境——这就是 Manus 选择 E2B 作为其沙盒基础设施的核心原因。

Manus 的沙盒环境本质上是由 E2B 平台提供的 Firecracker 微虚拟机(microVMs)[3]。Firecracker 是 AWS 开发的轻量级虚拟化技术,能够在约 150 毫秒内启动一个完整的虚拟计算机环境——相比之下,Docker 容器需要 10-20 秒的启动时间,更重要的是,Docker 作为容器解决方案无法提供完整操作系统的所有功能[4]。Manus 联合创始人 Tao Zhang 强调:"Manus 不只是运行一些代码片段,它使用 27 种不同的工具,需要 E2B 提供完整的虚拟计算机来像真人一样工作"[5]。这些工具涵盖了从 Chromium 浏览器(访问 URL、保存图片、滚动页面)到终端命令(创建、编辑、删除文件),再到 Python、JavaScript、Bash 等编程语言环境的全栈能力。

从部署架构来看,Manus 选择了 E2B 的自托管部署模式(Self-Hosting Deployment)[6]。这意味着 Manus 在自己的机器上运行 E2B,而非依赖 E2B 的云服务——这种选择使 Manus 能够完全控制沙盒基础设施,同时简化运维管理。Tao Zhang 表示:"E2B 自托管很容易管理,我们能够在半天内完成实现和部署"[7]。如果 Manus 选择自建这套基础设施,技术上是可行的,但需要一支 3-5 人的全职基础设施团队花费数月时间来开发和维护——对于大多数构建 Agent 平台的团队来说,这会分散对产品和研发工作的注意力。通过选择 E2B,Manus 能够快速交付产品,专注于改进多代理编排系统,而不是重新发明云运行时基础设施。

E2B 沙盒的会话持久性(Session Persistence)是 Manus 架构的关键特性之一。沙盒会话可以持续运行数小时,代理在每次迭代中决定在沙盒中执行哪个操作[8]。对于付费用户,E2B 沙盒中保存的信息可以长达 14 天——这对于需要数十分钟才能完成的复杂任务至关重要。更重要的是,沙盒会话支持暂停和恢复(Pause and Resume):当代理需要向用户确认某些信息、需要凭据访问特定网站、或者需要通过"验证你是人类"测试时,可以暂停当前任务,待条件满足后恢复执行。这种能力使得 Manus 的代理能够在保持上下文的同时,灵活地处理需要人工介入的场景。

从多租户隔离的角度分析,E2B 为每个用户提供独立的沙盒实例[9]。这种设计确保了不同用户的任务互不干扰,每个用户都在完全隔离的虚拟计算机中运行——这对于快速增长的 Manus 用户群体尤为重要。当用户数量激增时,E2B 的可扩展性使 Manus 能够为每个用户分配独立的沙盒实例,而无需担心资源竞争或安全问题。Firecracker 微虚拟机提供的强隔离边界确保了一个沙盒中的恶意代码或异常操作不会影响宿主机或其他用户的沙盒,这是 E2B 设计的核心目标——安全地运行不可信代码。

从架构演进和未来规划的角度看,Manus 选择 E2B 也是基于长远考虑[10]。Tao Zhang 表示:"我们选择 E2B 是因为我们考虑到了未来。"Manus 的目标是让代理能够在各种操作系统上运行,包括 Windows 和 Android——由于并非所有的信息和服务都存在于 Web 上,像虚拟 Android 这样的环境将显著扩展代理能够访问和完成的工作范围。这种跨操作系统的愿景要求沙盒平台具备足够的技术灵活性和可扩展性,而 E2B 的架构设计恰好满足了这一需求。

Manus 的实际应用案例已经证明了沙盒架构的价值。金融时报中文版的主编展示了一个通过 Manus 生成的 3D 打印模型,代表过去十年美国国债的历史——这是完全通过 Manus 创建的[11]。另一个案例来自迪拜,一位社交媒体顾问利用 Manus 为客户开发全面的内容策略:在提供客户的网站和社交媒体资料后,代理生成了完整的一年期策略,包括受众定位、标题、内容、吸引人的句子和针对特定渠道的建议。这份超过 50 页的文档生产成本约为 6-7 美元,但在咨询市场上的价值高达数千美元。这些案例展示了 Manus 通过 E2B 沙盒实现的端到端任务执行能力——从数据分析到内容创作,从视觉设计到策略规划,所有这些复杂任务都在隔离的虚拟计算机环境中安全、可靠地完成。


参考资料:

[1] Manus 官方网站

[2] Manus 文档 - Introduction

[3] E2B 官方博客 - How Manus Uses E2B to Provide Agents with Virtual Computers

[4] Firecracker microVMs - AWS 开源项目

[5] E2B 官方文档

[6] E2B - Self-Hosting 部署指南

[7] E2B 博客 - AI Agents in 2024

[8] E2B 文档 - Sandbox 会话管理

[9] E2B 文档 - 多租户隔离

[10] E2B 博客 - Future Plans for AI Agent Sandboxes

[11] Manus 应用案例 - Financial Times & Dubai Consultant

拆解Manus:真正有用的深度报告的生成

真正的深度研究报告不是让 AI "写"出来的,而是"研究"出来的。这两个字差别大了。

最近几个月,几个产品让我眼前一亮:Gemini Deep Research、Manus Wide Research,还有 OpenAI 的 Deep Research。它们都在做同一件事——让 AI 具备真正的"研究能力"。

这事儿得从"上下文窗口陷阱"说起。

阅读全文

了解 Manus Sandbox - 您的云计算机

了解 Manus Sandbox - 您的云计算机

本来想写拆解Manus沙箱的文章,结果Manus官方自己写了 :)
了解 Manus Sandbox - 您的云计算机

正如 Manus 名称的出处"Mens et Manus"(Mind and Hand)所说的,Manus 希望让 AI 模型不仅只是思考,更可以帮你做出行动。而在我们给 AI 模型赋予的"手"中,最强大的莫过于一台真正的云计算机 —— Manus Sandbox。

阅读全文

Claude Code 使用

Codex CLI vs Gemini CLI vs Claude Code: Which is the Best?

https://www.analyticsvidhya.com/blog/2025/08/codex-cli-vs-gemini-cli-vs-claude-code/

In 2025, several AI coding assistants have been released, which can be accessed directly from the terminal. Codex CLI, Gemini CLI, and Claude Code are some of the popular names that embed large language models into command-line workflows. These programming tools that can generate and fix code via natural language prompts are truly incredible. We document our evaluation of all three of these across different tasks to determine which is most useful.

Each assistant is based on a sophisticated AI model like o4-mini, Gemini 2.5 Pro, or Claude Sonnet 4 to enhance productivity. We place each one in the same environment and test them with specific metrics on realistic programming tasks. Varying from web development to data analysis, through this, we aim to make the strengths of each agent clear!

Meet the Contenders: Codex CLI, Gemini CLI & Claude Code

The command line is quickly becoming a battleground for the next generation of AI coding assistants. Companies, including OpenAI, Google, and Anthropic, have released advanced CLI-based AI coding assistants, each with very powerful and impressive capabilities directly into the terminal. But what are the differences, and which is best for your workflow? Let’s go over the tools.

阅读全文