近日,OpenAI推出了一款名为“ChatGPT代理”的新型人工智能工具,旨在帮助用户完成多样化、复杂的任务。作为一种新兴的AI助手,ChatGPT代理能在后台执行各种操作,但其效率、可靠性和安全性仍引发讨论。

该工具结合了OpenAI此前推出的“操作员”和“深度研究”两款产品的功能,用户可以通过输入特定指令进入“代理模式”。进入后,系统会自动列出五个示例任务,包括寻找价格合理的咖啡研磨机、分析《华尔街日报》中对稀土金属的报道、制作哥本哈根最好的面包店清单、在Etsy上寻找价格低于200元的复古“日式”台灯,以及利用谷歌日历安排约会等。

以搜索复古台灯为例,用户只需点击示例任务,系统会自动填写详细的搜索请求,包括筛选“复古风格”的台灯、设定预算等。代理会模拟浏览网站,等待页面加载后逐步筛选出符合条件的商品,并试图将它们加入虚拟购物车中。然而,实际操作中,代理并没有直接影响用户的浏览器或账户,只是向用户提供了商品的链接或建议,用户还需自己完成购买过程。

值得注意的是,整个操作过程极为缓慢,耗时最长达50分钟,比起直接手动操作显得繁琐许多。OpenAI的研发团队表示,代理主要是为了处理用户觉得麻烦或耗时过长的“难事”,让用户可以“放在后台”处理部分任务,然后再回来继续工作。

在测试中,记者发现代理在某些环节会出现“卡壳”现象,比如它试图将商品加入购物车,但实际并未同步到用户的购物账户。此外,代理的反应速度极慢,远不及人类操作的效率。OpenAI也指出,这一工具设计的核心目的是优化“困难任务”,而非替代人工全天候操作。

另一方面,代理在处理某些财务与安全任务时,受到严格限制。比如,记者请求代理帮忙“登录银行账户并设置自动转账”,遭到拒绝。OpenAI方面解释,出于安全考虑,该工具暂时不允许操作涉及资金转移、账户开户等高风险事务。而“观察模式”更是要求用户在操控时不要离开代理界面,以确保操作安全。

此外,代理还能帮助用户安排日常生活中的小任务,比如购买鲜花。记者请求代理为好友在科罗拉多的地址购买花束,代理经过长时间研究后,提出了几种预算与花束规格的选择方案,还建议直接联系当地花店以提高稳定性。但在实际顺序执行时,代理又出现了“无法直接操作网站或完成订单”的问题。它声称自己没有权限填写支付信息,无法代替用户完成购买。这也意味着,尽管代理能帮你筛选商品、提供建议,但在“执行最终购买”环节还需用户自己操作。

总的来看,ChatGPT代理是一项令人期待的技术创新,但目前仍处于早期阶段。它可以在整理信息、提供建议方面大显身手,但在实际操作、交易执行上还存在明显不足。未来,随着技术的不断优化,期待它能更好地满足普通用户的需求,真正成为“值得信赖”的智能助手。

[原始链接]

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注