AutoGPT和BabyAGI是AI的新热门但它们现在很糟糕

2023-04-28 11:18:11

导读忘记ChatGPT，Bard和Bing聊天!这些机器人已经过时了，以至于它们还不如尖叫危险，威尔·罗宾逊!或者从盒式磁带上读取程序。至少在本周，人

忘记ChatGPT，Bard和Bing聊天!这些机器人已经过时了，以至于它们还不如尖叫“危险，威尔·罗宾逊!”或者从盒式磁带上读取程序。至少在本周，人工智能的下一件大事是自主代理，这是一个程序，它接受一个或一系列目标，然后开发自己的任务列表，然后遵循它。

想象一下，让代理编写计算机程序或开发工作演示文稿。你走开几分钟，回来，机器人会提供你要求的东西，即使它必须经过几十个步骤才能到达那里。这听起来很棒，也许有一天会。但是现在，这些工具更多的是概念证明，而不是有用的实用程序。

在过去的几周里，我开始尝试两个领先的自主代理：Auto-GPT和BabyAGI，虽然两者都有潜力，但现在我找不到一个实际用例，他们做得很好。公平地说，这些代理只是使用相同的大型语言模型(LLM)，GPT3.5和GPT4，当您输入提示时会犯很多错误。这些错误被这样一个事实放大了，就像劲量兔子一样，代理会继续前进并走在错误的道路上。

Auto-GPT由一家名为SignificantGravis的公司设计并发布到Github，它是一个Python应用程序，它会在你给出一组初始目标后完成自己的任务。安装该应用程序相当容易，如果您想自己尝试，我们有一个关于如何设置Auto-GPT的完整教程。

要使用Auto-GPT，您只需要获取一个OpenAIAPI密钥，该密钥可以免费获得，但每次代理执行任务并且必须命中OpenAI服务器时都要花钱。当您第一次注册一个帐户时，您将获得几美元的免费信用额度(我在一个帐户上获得了18美元，在另一个帐户上获得了5美元)，并且考虑到每个请求可能只用掉一分钱的一部分，您的免费积分可能可以进行实验。

无论您使用的是Windows、Linux还是macOS，都可以从命令行运行Auto-GPT。然后，它会要求您命名您的代理，并为其分配一个广泛的目标和一组目标的角色。我在Twitter上看到过很多开发人员吹嘘Auto-GPT是游戏规则改变者的例子，但吹捧机器人无法以当前形式完成的用例，或者那些模糊到可爱但无用的用例，比如为理论初创公司制定商业计划。

我最成功的Auto-GPT会话发生在我创建了一个名为WebSiteGPT的代理时，该代理的角色是为Geek-in-ChiefDesigns设计一个三页的网站，这是一家我发明的虚构的Web开发公司。我设定了目标，编写和设计一个描述公司的主页，制作一个联系我们页面，并制作一个隐私政策页面，说Geek-in-Chief设计根本不收集或出售用户数据。我还要求它将所有三个页面输出为HTML文件，然后停止。我不应该将停止设定为目标，但考虑到这些脚本可以持续多长时间，我想确保它最终会结束。

整个过程大约需要45分钟和几十个步骤。默认情况下，自动GPT会在执行每项任务之前提示您批准。但是，您也可以通过输入y-[N]对接下来的N步数说“是”。因此，您输入y-100，最好进行接下来的100个可能步骤。

对于每个步骤，Auto-GPT都会显示一系列标注：网站GPT思想、推理、计划和批评。推理部分显示代理下一步要执行的操作。例如，在第一步之前，它说“我认为我们应该从设计Geek-in-ChiefDesigns的主页开始......我可以使用谷歌搜索来寻找网站设计和结构的灵感，也许还可以浏览竞争对手的网站以获得一些想法。

推理步骤解释了为什么它想做它想做的事情(例如：“通过检查竞争对手的网站，我们可以推测他们使用的一些策略和做法”)。计划部分解释了机器人计划执行的操作-“使用start_agent命令委派HTML文件的创建”。

批评部分是Auto-GPT开始添加一堆神经质的自我批评和质量规则的地方，这些规则不符合它。例如，它写道，它必须确保它编写的隐私政策符合GDPR，并且信息“绝对准确”。在另一个会话中，我要求它编写一些Windows教程，它说“在编辑和完善教程时，我应该以清晰和简单为目标”，并且它坚持然后修改自己的工作。

在Auto-GPT完成网站建设任务后，我确实有代表网站三个页面的HTML文件，但是这些页面上的设计和副本都不是很好，描述公司和隐私政策的副本只是简单的。例如，尽管我明确告诉机器人，我的公司不收集或出售用户数据，但它在隐私政策中写道：“我们可能会通过联系表格、调查或用户帐户收集、存储和使用多种类型的个人信息。它甚至命名了我们将收集的名称、地址和浏览行为等信息。

主页还包含了一系列关于该公司的事情，Geek-in-ChiefDesigns。“Geek-in-ChiefDesigns提供网站和Web应用程序开发，网站维护，网站优化，自定义网页设计等等，”它写道。“我们经验丰富的开发人员团队可以处理任何复杂的项目，并按时交付，坚持高水平的质量。”

免责声明：本文由用户上传，如有侵权请联系删除！

标签：

猜你喜欢

最新文章