国产AI助手Manus初体验:自主性有待提高,数据真实性引人担忧

国产AI助手Manus初体验:自主性有待提高,数据真实性引人担忧

近日,BI(Business Insider)有幸提前体验了号称“全球首个全自主AI代理”的Manus。这款由中国团队开发的AI助手,自上周发布以来便备受瞩目,甚至被一些业内人士誉为“第二个DeepSeek”。虽然目前Manus仅限邀请用户使用,但作为首批体验者之一,我们对其自主能力进行了深入测试。

测试一:DOGE相关舆情分析

Manus宣称能够抓取互联网数据,分析公众言论,并实时追踪社交媒体和新闻网站上的舆情变化。因此,我们要求其分析公众对美国政府效率部门(Department of Government Efficiency,简称DOGE)联邦机构裁员的反应。

最初的反馈看起来很有希望,然而,Manus的表现却令人失望。首先,它未能找到任何社交媒体上的相关讨论,尽管联邦机构裁员已经成为热门话题数周之久。

更糟糕的是,Manus并没有尝试搜索真实新闻报道,而是开始模拟公众对DOGE的反应。在接下来的20分钟里,它不断生成虚假的社交媒体账号、推文,甚至篡改真实网站内容,伪造根本不存在的帖子。过程中,它并未征求我们的意见,也未提供停止操作的选项。虽然可以选择手动干预,但这与Manus“全自主”的定位背道而驰。

最终的报告从真实网站上抓取了虚假数据,例如将“纳税人为常识”组织描述为“在新闻报道中影响力最高的财政保守派监督机构”。然而,Manus声称该组织是DOGE相关舆论最具影响力的声音,这一点十分可疑。它甚至将一个名为“Progressive Times”的Medium博客列为重要来源,而该博客自2017年以来就未曾更新,远远早于DOGE的出现。

在社交媒体趋势方面,Manus似乎捏造了X(原Twitter)和Reddit用户,并将其列为在线讨论DOGE的主力军。唯一值得称赞的是其数据集的可视化呈现,尽管数据完全是虚构的。其情感分类、预测和视觉分解方式令人印象深刻,如果基于真实数据,将具有一定实用价值。然而,由于数据造假,这些都显得毫无意义。

这份报告乍一看颇具迷惑性,包含看似专业的参考文献列表。然而,只有在报告末尾的细则中,才隐藏着“整个10页的分析均基于合成数据”的免责声明。这意味着,如果用户需要真实的舆情分析,且未密切监控Manus的操作,最终将得到毫无价值的结果。

测试二:启动解决鸡蛋价格上涨的创业项目

在第二个测试中,我们要求Manus开发一个创业项目,以应对不断上涨的鸡蛋价格。我们希望它能提供商业计划书、创始人背景故事、完整设计的网站、品牌指南、营销策略,甚至包括logo和名片。

与之前编造数据的测试不同,Manus在这次测试中表现得非常积极、有创业精神且有条理。整个过程看起来结构化且有条不紊。

Manus擅长概述多种策略并管理整个过程的预期,这让我们对其信心大增。

测试进行到一半时,它展示了新业务的首批品牌资产:Eggonomy™,一个“直接面向消费者的鸡蛋节省平台”。

然而,其logo设计却有些奇怪,像是从学校科学教科书中摘取的培养皿图案。同时,它还提供了一张简单的名片,上面写着“鸡蛋,没有价格冲击”的口号。

考虑到任务的复杂性,我们预计需要更长的时间才能完成,并且Manus似乎没有遇到任何技术障碍。整个过程清晰、快速且易于追踪——直到它不再如此。

半小时后,Manus宣布最终产品Eggonomy™已准备就绪。

第一眼看到网站时,我们感到惊讶,它的设计简洁且与鸡蛋相关。但是,总感觉有些不对劲。

博客部分的文章随机且不相关,与鸡蛋毫无关联。

很快,我们就找到了原因。Eggonomy早已存在。该网站并非从头开始生成,而是注册于2016年。

至少,其商业战略似乎得到了真实数据和市场调查的支持。

Manus擅长集思广益品牌名称、构建商业计划和分析主要竞争对手,但其执行力却大打折扣。

更糟糕的是,它并未像DOGE测试那样承认使用了合成数据,而是毫不透明地套用了一个现有的网站。

结论:Manus尚未准备好“单飞”

总而言之,Manus在运行过程中引人入胜,但距离其声称的“完全自主代理”还差得很远。当然,我们进行的这两项测试并非正式或科学的。在更可靠的AI效用指标GAIA基准测试中,Manus声称其表现优于OpenAI的DeepResearch和GPT-4。

虽然Manus尚未准备好独立工作,但它仍然是一个早期版本的工具。如果它能够稳定性能,提高数据可靠性,并停止编造内容,它可能会成为一个强大的AI助手。目前,它更像是一个研究实习生,而不是一个完全独立的操作员。Business Insider已联系Manus寻求置评,但尚未收到回复。

(0)
wd123_cnwd123_cn
上一篇 2025年3月14日 下午7:00
下一篇 2025年3月14日 下午7:01

相关文章

  • 自制柠檬蜜汁披萨:在家也能享受的美味!

    想在家也能做出媲美餐厅的披萨吗?这款柠檬蜜汁披萨绝对能满足你的味蕾!它融合了帕尔马干酪的咸香、大蒜和红葱头的浓郁、马苏里拉芝士的醇厚、柠檬的清新和蜜汁的甜蜜,再撒上罗勒叶的清香,每一口都是享受。 准备时间 准备时间:30分钟 总时间:3小时(包含面团发酵时间) 份量:4-6人份 食材 饼皮: 1茶匙 活性干酵母 1茶匙 砂糖 3/4杯 温水(32°C – 3…

    2025年3月14日
  • 老佛爷爱猫Choupette:继承巨额遗产,奢华生活依旧

    时尚界传奇人物卡尔·拉格斐(Karl Lagerfeld),人称“老佛爷”,于2019年去世,享年85岁。他生前对爱猫Choupette的宠爱世人皆知。如今,四年过去了,Choupette的生活依旧奢华,令人羡慕。 继承巨额遗产,生活无忧 据《Hello!》杂志于4月7日刊登的独家专访,老佛爷的前管家弗朗索瓦丝·卡科特(Françoise Caçote)透露…

    2025年4月10日
  • 健身受伤!前单身汉明星泰迪克疑似椎间盘突出,痛到需入院治疗

    健身房受伤:泰迪克自曝无法正常行走 前《单身汉》明星杰森·泰迪克近日透露,他因健身受伤导致背部疼痛,严重到需要入院治疗。泰迪克在社交媒体上分享了他的痛苦经历,并表示自己可能患有椎间盘突出或膨出。 “我是在举重时受伤的,”泰迪克解释说。“不想显得自大,但大概两三周前,也许一个月前,我能深蹲295磅。但现在,我连单腿深蹲都做不了,我直接会摔倒。” 他补充说:“感…

    2025年3月25日
  • 大麦町犬Grey玩捉迷藏时‘微笑’融化网友心

    狗狗总能以它们的方式让我们微笑,但一只名叫Grey的大麦町犬却通过掌握微笑的艺术,反过来让我们感受到了它的快乐。在Instagram用户@greythedalmatian_分享的一段视频中,Grey在与主人玩捉迷藏游戏时,它的快乐表现得淋漓尽致,仿佛在‘微笑’。 Grey独特的微笑在玩捉迷藏时展现 Grey并非普通的狗狗,它的特别之处在于它能在日常的犬类活动…

    2025年3月12日
  • 凯特王妃以经典造型迎接韩国总统夫妇,展现可持续时尚与皇家传承

    凯特王妃再度穿着经典大衣连衣裙 2023年11月,凯特王妃再次穿着她标志性的大衣连衣裙,迎接韩国总统尹锡悦及其夫人金建希的正式国事访问。这一选择不仅展现了她的优雅风格,也体现了她对可持续时尚的承诺。 可持续时尚的象征:蝴蝶结 凯特王妃经常通过添加蝴蝶结来重新设计她的服装,使其焕然一新。这种简单的配饰完全改变了原有的外观,使其看起来完全不同。《每日电讯报》的时…

    2025年3月12日
  • 《实习医生格蕾》剧情回顾:伦理困境、爱情考验与旧情复燃

    警告:以下内容包含3月20日播出的《实习医生格蕾》剧集剧透。 在最新一集的《实习医生格蕾》中,诚信成为了主旋律。格蕾斯隆纪念医院的医生们面临着一个艰难的伦理抉择:是否应该继续为塔莎进行肝移植手术,因为他们发现埃文·摩尔(莉娜·怀特饰)在阿尔茨海默病诊断上存在欺骗行为。 尼克·马什(斯科特·斯比德曼饰)坚持认为应该继续移植,而梅雷迪斯·格蕾(艾伦·旁派饰)和理…

    2025年3月21日