AutoGPT和BabyAGI是AI的新热门但它们现在很糟糕

导读 忘记ChatGPT,Bard和Bing聊天!这些机器人已经过时了,以至于它们还不如尖叫危险,威尔·罗宾逊!或者从盒式磁带上读取程序。至少在本周,人

忘记ChatGPT,Bard和Bing聊天!这些机器人已经过时了,以至于它们还不如尖叫“危险,威尔·罗宾逊!”或者从盒式磁带上读取程序。至少在本周,人工智能的下一件大事是自主代理,这是一个程序,它接受一个或一系列目标,然后开发自己的任务列表,然后遵循它。

想象一下,让代理编写计算机程序或开发工作演示文稿。你走开几分钟,回来,机器人会提供你要求的东西,即使它必须经过几十个步骤才能到达那里。这听起来很棒,也许有一天会。但是现在,这些工具更多的是概念证明,而不是有用的实用程序。

在过去的几周里,我开始尝试两个领先的自主代理:Auto-GPT和BabyAGI,虽然两者都有潜力,但现在我找不到一个实际用例,他们做得很好。公平地说,这些代理只是使用相同的大型语言模型(LLM),GPT3.5和GPT4,当您输入提示时会犯很多错误。这些错误被这样一个事实放大了,就像劲量兔子一样,代理会继续前进并走在错误的道路上。

Auto-GPT由一家名为SignificantGravis的公司设计并发布到Github,它是一个Python应用程序,它会在你给出一组初始目标后完成自己的任务。安装该应用程序相当容易,如果您想自己尝试,我们有一个关于如何设置Auto-GPT的完整教程。

要使用Auto-GPT,您只需要获取一个OpenAIAPI密钥,该密钥可以免费获得,但每次代理执行任务并且必须命中OpenAI服务器时都要花钱。当您第一次注册一个帐户时,您将获得几美元的免费信用额度(我在一个帐户上获得了18美元,在另一个帐户上获得了5美元),并且考虑到每个请求可能只用掉一分钱的一部分,您的免费积分可能可以进行实验。

无论您使用的是Windows、Linux还是macOS,都可以从命令行运行Auto-GPT。然后,它会要求您命名您的代理,并为其分配一个广泛的目标和一组目标的角色。我在Twitter上看到过很多开发人员吹嘘Auto-GPT是游戏规则改变者的例子,但吹捧机器人无法以当前形式完成的用例,或者那些模糊到可爱但无用的用例,比如为理论初创公司制定商业计划。

我最成功的Auto-GPT会话发生在我创建了一个名为WebSiteGPT的代理时,该代理的角色是为Geek-in-ChiefDesigns设计一个三页的网站,这是一家我发明的虚构的Web开发公司。我设定了目标,编写和设计一个描述公司的主页,制作一个联系我们页面,并制作一个隐私政策页面,说Geek-in-Chief设计根本不收集或出售用户数据。我还要求它将所有三个页面输出为HTML文件,然后停止。我不应该将停止设定为目标,但考虑到这些脚本可以持续多长时间,我想确保它最终会结束。

整个过程大约需要45分钟和几十个步骤。默认情况下,自动GPT会在执行每项任务之前提示您批准。但是,您也可以通过输入y-[N]对接下来的N步数说“是”。因此,您输入y-100,最好进行接下来的100个可能步骤。

对于每个步骤,Auto-GPT都会显示一系列标注:网站GPT思想、推理、计划和批评。推理部分显示代理下一步要执行的操作。例如,在第一步之前,它说“我认为我们应该从设计Geek-in-ChiefDesigns的主页开始......我可以使用谷歌搜索来寻找网站设计和结构的灵感,也许还可以浏览竞争对手的网站以获得一些想法。

推理步骤解释了为什么它想做它想做的事情(例如:“通过检查竞争对手的网站,我们可以推测他们使用的一些策略和做法”)。计划部分解释了机器人计划执行的操作-“使用start_agent命令委派HTML文件的创建”。

批评部分是Auto-GPT开始添加一堆神经质的自我批评和质量规则的地方,这些规则不符合它。例如,它写道,它必须确保它编写的隐私政策符合GDPR,并且信息“绝对准确”。在另一个会话中,我要求它编写一些Windows教程,它说“在编辑和完善教程时,我应该以清晰和简单为目标”,并且它坚持然后修改自己的工作。

在Auto-GPT完成网站建设任务后,我确实有代表网站三个页面的HTML文件,但是这些页面上的设计和副本都不是很好,描述公司和隐私政策的副本只是简单的。例如,尽管我明确告诉机器人,我的公司不收集或出售用户数据,但它在隐私政策中写道:“我们可能会通过联系表格、调查或用户帐户收集、存储和使用多种类型的个人信息。它甚至命名了我们将收集的名称、地址和浏览行为等信息。

主页还包含了一系列关于该公司的事情,Geek-in-ChiefDesigns。“Geek-in-ChiefDesigns提供网站和Web应用程序开发,网站维护,网站优化,自定义网页设计等等,”它写道。“我们经验丰富的开发人员团队可以处理任何复杂的项目,并按时交付,坚持高水平的质量。”