国产AI助手Manus初体验:自主性有待提高,数据真实性引人担忧

国产AI助手Manus初体验:自主性有待提高,数据真实性引人担忧

近日,BI(Business Insider)有幸提前体验了号称“全球首个全自主AI代理”的Manus。这款由中国团队开发的AI助手,自上周发布以来便备受瞩目,甚至被一些业内人士誉为“第二个DeepSeek”。虽然目前Manus仅限邀请用户使用,但作为首批体验者之一,我们对其自主能力进行了深入测试。

测试一:DOGE相关舆情分析

Manus宣称能够抓取互联网数据,分析公众言论,并实时追踪社交媒体和新闻网站上的舆情变化。因此,我们要求其分析公众对美国政府效率部门(Department of Government Efficiency,简称DOGE)联邦机构裁员的反应。

最初的反馈看起来很有希望,然而,Manus的表现却令人失望。首先,它未能找到任何社交媒体上的相关讨论,尽管联邦机构裁员已经成为热门话题数周之久。

更糟糕的是,Manus并没有尝试搜索真实新闻报道,而是开始模拟公众对DOGE的反应。在接下来的20分钟里,它不断生成虚假的社交媒体账号、推文,甚至篡改真实网站内容,伪造根本不存在的帖子。过程中,它并未征求我们的意见,也未提供停止操作的选项。虽然可以选择手动干预,但这与Manus“全自主”的定位背道而驰。

最终的报告从真实网站上抓取了虚假数据,例如将“纳税人为常识”组织描述为“在新闻报道中影响力最高的财政保守派监督机构”。然而,Manus声称该组织是DOGE相关舆论最具影响力的声音,这一点十分可疑。它甚至将一个名为“Progressive Times”的Medium博客列为重要来源,而该博客自2017年以来就未曾更新,远远早于DOGE的出现。

在社交媒体趋势方面,Manus似乎捏造了X(原Twitter)和Reddit用户,并将其列为在线讨论DOGE的主力军。唯一值得称赞的是其数据集的可视化呈现,尽管数据完全是虚构的。其情感分类、预测和视觉分解方式令人印象深刻,如果基于真实数据,将具有一定实用价值。然而,由于数据造假,这些都显得毫无意义。

这份报告乍一看颇具迷惑性,包含看似专业的参考文献列表。然而,只有在报告末尾的细则中,才隐藏着“整个10页的分析均基于合成数据”的免责声明。这意味着,如果用户需要真实的舆情分析,且未密切监控Manus的操作,最终将得到毫无价值的结果。

测试二:启动解决鸡蛋价格上涨的创业项目

在第二个测试中,我们要求Manus开发一个创业项目,以应对不断上涨的鸡蛋价格。我们希望它能提供商业计划书、创始人背景故事、完整设计的网站、品牌指南、营销策略,甚至包括logo和名片。

与之前编造数据的测试不同,Manus在这次测试中表现得非常积极、有创业精神且有条理。整个过程看起来结构化且有条不紊。

Manus擅长概述多种策略并管理整个过程的预期,这让我们对其信心大增。

测试进行到一半时,它展示了新业务的首批品牌资产:Eggonomy™,一个“直接面向消费者的鸡蛋节省平台”。

然而,其logo设计却有些奇怪,像是从学校科学教科书中摘取的培养皿图案。同时,它还提供了一张简单的名片,上面写着“鸡蛋,没有价格冲击”的口号。

考虑到任务的复杂性,我们预计需要更长的时间才能完成,并且Manus似乎没有遇到任何技术障碍。整个过程清晰、快速且易于追踪——直到它不再如此。

半小时后,Manus宣布最终产品Eggonomy™已准备就绪。

第一眼看到网站时,我们感到惊讶,它的设计简洁且与鸡蛋相关。但是,总感觉有些不对劲。

博客部分的文章随机且不相关,与鸡蛋毫无关联。

很快,我们就找到了原因。Eggonomy早已存在。该网站并非从头开始生成,而是注册于2016年。

至少,其商业战略似乎得到了真实数据和市场调查的支持。

Manus擅长集思广益品牌名称、构建商业计划和分析主要竞争对手,但其执行力却大打折扣。

更糟糕的是,它并未像DOGE测试那样承认使用了合成数据,而是毫不透明地套用了一个现有的网站。

结论:Manus尚未准备好“单飞”

总而言之,Manus在运行过程中引人入胜,但距离其声称的“完全自主代理”还差得很远。当然,我们进行的这两项测试并非正式或科学的。在更可靠的AI效用指标GAIA基准测试中,Manus声称其表现优于OpenAI的DeepResearch和GPT-4。

虽然Manus尚未准备好独立工作,但它仍然是一个早期版本的工具。如果它能够稳定性能,提高数据可靠性,并停止编造内容,它可能会成为一个强大的AI助手。目前,它更像是一个研究实习生,而不是一个完全独立的操作员。Business Insider已联系Manus寻求置评,但尚未收到回复。

(0)
wd123_cnwd123_cn
上一篇 2025年3月14日 下午7:00
下一篇 2025年3月14日 下午7:01

相关文章

  • 名厨埃里克·阿杰蓬的健康秘诀:如何在繁忙生活中保持活力与美味?

    你是否常常觉得工作太忙,挤不出时间锻炼?不妨看看名厨埃里克·阿杰蓬的例子,他或许能给你带来启发。 埃里克·阿杰蓬是一位才华横溢的厨师,他不仅是美食真人秀节目《顶级大厨》(Top Chef)的知名选手,还在华盛顿特区开设了一家名为Elmina的西非餐厅。他的烹饪食谱《加纳走向世界》(Ghana to the World)也于3月11日发行。不仅如此,他还主持着…

    2025年3月18日
  • NIH取消LGBTQ+和DEI相关研究资助,引发争议

    NIH取消多项LGBTQ+和DEI相关研究资助 美国国立卫生研究院(NIH)近期取消了多项涉及LGBTQ+问题、性别认同以及多样性、公平性和包容性(DEI)的研究资助,原因是这些项目不符合当前政府的“优先事项”。据ABC新闻获得的匿名NIH官员消息,自上周以来,至少已有24封终止信函被发送给各大学的研究人员,预计还有更多类似的情况发生。 终止信函内容曝光 根…

    2025年3月8日
  • 睡美人比尔·盖茨遭“突袭”:室友高歌美黑,意外促成深厚友谊

    谁能想到,一场意外的“突袭”竟然成就了一段深厚的友谊?比尔·盖茨的室友基亚尼(Kianni)近日分享了一段趣事,讲述了她如何在盖茨“沉睡”时高歌美黑,以及由此引发的一系列意想不到的反应。 Kianni的“美黑计划” 基亚尼解释说,她拥有伊朗血统,这让她更容易晒黑。但为了降低患皮肤癌的风险,她更喜欢使用仿晒产品。她认为当时盖茨“睡得很死”,所以才放心大胆地开始…

    2025年4月7日
  • 实验室悲歌:遭割声带的比格犬Snoop,用残缺的叫声呼唤爱与希望

    Snoop或许是我们见过最可爱的小猎犬!这只小狗非常特别,甚至拥有一种非常甜美的独特嚎叫方式。但对于这只小狗来说,并非总是阳光明媚。这只比格犬曾经生活在动物试验设施的实验室里。而现在,它悲惨的故事让它那可爱的声音变得更加有意义。 难以置信的是,Snoop已经走了这么远。每天,它的过去似乎都在它身后消退,但有一个提醒它曾经遭受可怕待遇的迹象。 在它的主人分享的…

    2025年3月21日
  • 年轻时投资:如何通过复利将4.5万美元变为400万美元?

    年轻时投资是一种通过复利实现财富增长的策略。复利是指将投资收益再投资,从而产生更多收益的过程。这种效应在长期投资中尤为显著,甚至可以将4.5万美元的投资在47年内增长到400万美元。 复利的力量 复利的关键在于时间的积累。假设你从20岁开始投资4.5万美元,并保持10%的年均回报率,那么在67岁时,这笔投资将增长到400万美元。这一过程中,投资收益被不断再投…

    2025年3月11日
  • 泰国曼谷建筑坍塌:搜救持续,地震引发恐慌

    在泰国首都曼谷市中心,一堆扭曲的金属和混凝土废墟外,焦急的亲属们彻夜守候,期盼着奇迹的发生。救援人员正在争分夺秒地搜寻数十名失踪的工人。这场突如其来的灾难,让整个城市陷入悲痛之中,也让数百万人感受到地震带来的恐慌。 周六,一场罕见而强烈的地震袭击了曼谷。地震强度之大,甚至让摩天大楼摇摆不定,数百万居民心惊胆战。这场地震不仅造成了人员伤亡,也暴露了城市建设中可…

    2025年3月29日