Manus 最新对话全文:尝试 Agent 支付,公司 RRR 近 1 亿美元

Manus 最新对话全文:尝试 Agent 支付,公司 RRR 近 1 亿美元

作者:AI下载 发表时间:2025-08-24

搬到新加坡的Manus,对通用AIAgent的思考没有停止。

在今天在新加坡举行的StripeTour上,Manus联合创始人兼首席科学家季逸超(Peak)与Stripe亚太地区及⽇本⾸席营收官PaulHarapin进行了对谈。

席间,ManusAI披露了近期的经营数据,ManusAI年度化的经常性收入(RRR,RevenueRunRate)已经达到9000万美元,很快即将上亿。

ManusAI的肖弘还特意在即刻表示,RevenueRunRate指的是当月的Revenue*12,并不等于CashIncome。很多AI产品都会有年付选项,这部分只能算作预存款,而不能记为Revenue。「如果我们按照这种【错误方式】披露,可以算出一个一个比1.2亿美金更大的数。」肖弘表示。

除了经营数据之外,季逸超还分享了Manus团队是如何思考通用Agent的的下一步的,以及AIAgent和AGI未来到底有什么区别。

「现在大家几乎把一切都叫做Agent。比如一个麦克风,有人会叫它是「有环境感知的收音Agent。」季逸超开玩笑地讲道。

他也给出了拓展通用Agent能力下一步的两条主线:其一,用多Agent协作把执行规模做宽(如在大规模调研里衍生出上百个并行的子Agent);其二,给Agent打开更大的「工具面」,不把能力绑死在少数预置API,而是像程序员一样调用开源生态、安装库、甚至在可视化后看图自检并回改。

季逸超还提到,今天的数字世界仍按「给人用」的范式建造——非API化网页、CAPTCHA、流程「小游戏化」带来大量摩擦,瓶颈更像生态与制度约束,而非模型智力。

这也是Manus参与Stripe活动的原因之一:双方正推进在Agent内完成支付,把「研究—决策—下单/结算」连成闭环,用基础设施协作来消解世界的摩擦。

以下为对话精华,经极客公园编辑整理:

问:给观众简单介绍一下你自己吧。你最近关于「上下文工程」的博客非常鼓舞人心,我觉得对于在座任何正在开发AIAgent的人来说都是必读的。我每次去和工程师们吃午饭时,他们总是在谈论这个,所以我现在只能坐到别的地方(笑)。但对于现场可能不太熟悉Manus的人,你能分享一下你的经历和愿景吗?

答:谢谢Paul。很高兴能来到。Manus在构建一个通用AIAgent。

很多研究机构和公司,其实在尝试打造一个大脑——打造一个大语言模型。但我们认为,从消费者的角度来看,这其实并不好。AI应该能真正采取行动,完成事情,所以我们构建了Manus。

我们的方式,是让AI可以使用人类历史上最伟大的发明之一——通用计算机。给了AI计算机,它能做人类能做到的所有事。Manus能真正完成任务。比如它可以帮你做演示文稿、帮你规划一次旅行,甚至能帮你运营社交媒体——虽然我并不推荐你真的这样做。

我们的用户真的很喜欢Manus。我们在三月份发布了Manus,现在已经实现了大约9000万的年度化的经常性收入(RRR,RevenueRunRate),很快就会突破1亿。

我觉得这对我们这样一个小型创业公司来说非常巨大。但更重要的是,这表明AIAgent已经不再只是一个研究领域的流行词,而是真正在被应用,落地生根。

我可以和大家分享一个我们构建Manus过程中的小故事。

我们其实从Agentcoding的应用中得到了很多灵感。比如像Cursor这样的AI编程产品,之前已经吸引了很多关注。

作为工程师,我们自然会使用Cursor。但让我们惊讶的是,公司里很多非工程师同事也在用Cursor。当然,他们并不是在写软件,而是用它来做数据可视化,甚至写一些文章。他们会忽略左边的代码部分,只是跟AI对话来完成工作。

这让我们意识到:我们应该把这种方式泛化,赋能非程序员。这就是AI的一个用例。

问:我们越来越常听到人们谈论AIAgent和AGI。你能不能帮我们更清楚地区分这两个概念?AIAgent和AGI对你和Manus来说各自意味着什么?

答:我们认为这是一个非常好的问题。

现在大家几乎把一切都叫做「Agent」。比如一个麦克风,有人会说它是「有环境感知的收音Agent「。

但至少我们主张,Agent应该是应用型AI的一个子集。我们不妨退一步,看看常见的AI应用类别。

大多数人已经熟悉两类:一类是聊天机器人,比如ChatGPT;另一类是生成式工具,比如MidJourney或Sora。在这些系统中,通常只有两个角色:用户和模型。你和模型交互,得到输出。而Agent的不同在于,它除了用户和模型,还引入了第三个关键元素——环境。

这个「环境」的概念会因智能体类型不同而变化,比如在设计型Agent里,环境可能是一个画布或一段代码;而在Manus这里,我们的目标是让Agent出现在虚拟机甚至整个互联网中。这样Agent就能观察环境,决定下一步该做什么,并通过行动来改变环境。这让它非常强大。

比如在Manus,你可以表达需求,它会打开浏览器、发布网页、帮你订一张机票。我很喜欢这个例子,因为虽然订机票听起来很简单,但这其实是AI在直接改变现实世界——结果不是模型的输出,而是你手里的机票。AI真正介入了你的世界。这就是我们所说的Agent。

简单来说,Agent就是能代表用户与环境交互的AI系统。

至于AGI,这个词也经常被提到,很多人把它等同于超级智能。我们认为,AGI是一种能利用AI模型的通用能力,在不经过特别设计的情况下完成许多任务的系统。

我们认为「Agentcoding」其实是通往AGI的一条路径。它不是一个垂直领域的能力,而是如果你把它赋予计算机,它几乎能在计算机上做任何事。所以对我们来说,AGI的条件就是要构建足够完善的环境,让这种能力得以发挥。

问:AI今天究竟在哪些场景中真正发挥了作用?未来会在哪些地方发挥作用?什么时候会出现iPhone时刻?

答:就Agent而言,如果单看模型能力的话,现在的旗舰模型已经非常惊人了,几乎是「超人」级别的。它们可以在数学竞赛或逻辑推理上胜过我们大多数人。

但我认为,模型仍然像是「瓶子里的大脑」,如果想真正发挥力量,就必须让它们与真实世界交互、触达现实。但不幸的是,这正是问题开始的地方。

比如你让一个AI去做一些事务性的任务,它在重复性任务上确实很擅长。比如像DeepResearch这样的产品,它只是聚合信息然后给出一个结果,它的输出只是简单地出现在那里。

举个例子,现在几乎所有东西都是为人类设计的,不只是物理世界,甚至数字世界也是这样。比如网页工具,它们就像小游戏一样,没有提供API或标准接口。验证码CAPTCHA无处不在,处处在拦截Agent。

所以我认为AI在封闭的自包含任务中表现很好,但一旦涉及真实世界,就会遇到障碍。

未来什么时候能出现iPhone时刻?我觉得这并不是技术问题,而是更像是一种制度性限制。这不是像我们这样的Agent创业公司能够单独解决的事情。

我认为这需要一个渐进的转变,要求整个生态系统共同进化。这也需要像Stripe这样的公司在基础设施层面发力。比如我们正在集成新的stripe的Agentic支付api。大家共同努力。

问:那我们能不能具体谈谈用户在使用Manus时的一些典型场景?他们是如何使用的?这其中体现出了怎样的力量?

答:是的,我们虽然来自当前这一代Agent,但已经看到很多很棒的用例。

比如说,我们刚刚搬到新加坡,需要雇佣房产中介来帮我们找住所。是真人Agent(笑)。

而现在这些中介已经在使用Manus:他们会根据客户的需求,用Manus来分析公司所在地、员工想住的区域,并生成相应的推荐。

我觉得这很有意思,因为这属于一种「长尾需求」。一般来说,并没有专门的AI产品是为这种具体场景设计的,但由于Manus是一个通用型Agent,它就能满足这些需求。我们认为长尾需求非常值得关注。

从宏观角度看,它可能是长尾,但对具体用户而言,这正是他们的日常工作。这种场景特别有价值。

这就像今天的搜索引擎格局一样。如果你只是搜索一些常见的内容,不管用Google还是Bing,结果质量差不多。那为什么人们会选择其中一个?可能是因为某个搜索引擎在特定时刻给了他们更合适的结果。而如果你搜索的是非常个性化或专业化的内容,就更能体现差异。所以我们认为通用型Agent的优势就在这里。

那如何让它更好呢?我们思考了很久,因为我们认为一切都绕不开编程。如果你把计算机交给AI,那么它与环境交互的方式其实就是通过编程。

我们认为可以从两方面改进。第一是规模化。但如果你能把Agent的能力放大一百倍会怎样呢?

最近Manus刚刚发布了一个新功能,叫做WideResearch。它的基本思路是允许一个Agent再衍生出上百个Agent一起去完成任务。你知道的,如果只是让AI帮你做一些小事,很多时候你自己也能完成。但如果任务非常庞大,你一个人根本不可能完成,比如需要做大规模的研究,这时候让上百个Agent并行去做,就会变得非常强大。

其次,我们还需要让Agent更灵活地使用计算机使。比如,如果你只给一个AIAgent设置了预设工具,那么它的行动空间就被限制在这些工具里。但想象一下,如果你是一个程序员,你有整个开源社区的资源可以调用。

比如你在3D打印的时候,直接修改模型的参数很困难,但是你如果能找到GitHub上的合适的库,直接安装就能解决你的问题了。在Manus,我们在优化通用性,并且提出了一个概念,叫做「工具的网络效应」。

有一个很有意思的例子:很多用户在用Manus做数据可视化。你们知道,在亚洲有时候会遇到问题,比如在图表中显示中文时可能会出现字体错误。或许有些专业用户会写一些硬编码规则,比如在输出韩文时应该用哪种字体。但这种方式会让系统越来越僵化。

我们采取的办法是给系统增加了一个很简单的能力:查看图像。结果很惊喜——因为今天的模型已经很聪明了,它们会在生成可视化图像后自己检查,并意识到错误,然后再自动修正。我们发现,增加工具的灵活性比硬编码规则能解决更多的问题。

问:这是一个令人兴奋的时代。我真的很激动,只希望自己能再年轻到三十岁(笑)。提到医学研究的,我知道Manus在这方面也很强。你们观察到有些用户在使用Manus研究医疗吗?

答:很多人已经在用Manus做研究,不仅限于医学研究。我们觉得这很有意思,因为现在确实有很多所谓的「深度研究」产品,它们会帮你收集大量信息并做一些分析,但最后只给你一个markdown文件或文档。这远远不够。

很多时候,研究人员真正需要的,是能够直接交付给老板或团队的成果。所以我们在Manus上加强了研究结果的输出。例如在医学研究中,很多时候需要生成正式的报告,比如幻灯片报告之类的东西。因此我们必须优化AI的输出能力,以满足研究人员的需求。这是一种「工具化」的体验。

比如现在很多用户会先用Manus做研究,然后直接生成一个网站。你会觉得这和传统的网站搭建方式完全不同。

要知道,搭建一个网站本身其实不难,难的是如何确保数据的可靠性和准确性。所以我们认为,最好能在一次会话、一个共享的上下文中完成整个流程。这样,你的研究、你的见解就能无缝转化为最终成果。这就是我们在Manus里所做的事情。

问:很多国家都在讨论一个话题:在AI时代,人类的未来和经济影响。你怎么看待就业被取代?又会出现哪些新的工作机会?

答:我们的朋友和投资人也经常问我们这个问题。当我们推出Manus时,最初认为如果能构建这样一个Agent,它就能帮人们节省很多时间,让大家轻松赚钱。

但实际上,我们发现这个愿景并没有完全实现。通过大量用户调研,我们发现用户在使用之后,他们反而工作得更多了。因为他们变得更高效了,他们实际上能做更多他们本来就很擅长的事情。这是第一点。

其次,我们认为Manus还打开了一个全新的空间。我们一直在讨论虚拟机和云计算。我们觉得Manus正在扮演一种「个人云计算平台」的角色。比如云计算已经存在几十年了,但它更多是工程师的特权,只有我们能通过编程来调用云的力量。普通知识工作者无法使用。

但现在有了像Manus这样的AIAgent,人们可以用自然语言下达指令,让AI去执行。这等于解锁了一种全新的生产力。这就是我们所带来的。

而最后,关于「替代」,我认为其实很难。比如房产中介,他们每天都在用Manus完成日常工作。但你知道,AI永远无法替代中介面对客户时的那种沟通方式。我们是一家AI公司,甚至Manus的发布视频都是由Manus写的脚本,但视频里出现的还是我,因为这是关于信任的事情。而信任,是不能完全交给AI的。

本文来自微信公众号“极客公园”(ID:geekpark),作者:LiYuan,编辑:靖宇,经授权发布。

相关文章
更多