Gnomic智能体平台基于汇智智能自主研发的Carrot AI大模型和专利的“数字生命”技术,致力于提供最先进的人工智能交互体验;面向个人开发者,提供丰富的函数插件调用能力、自定义工作流RPA自动化工具、强大的知识库处理;提供深度定制化的无代码智能体创建服务。
复旦大学语富与视觉团队推出了一个名为AgentGym的通用智能体平台。
这个平台专注于大语言模型智能体的数据采样、训练微调以及自我进化的能力评测。
AgentGym基于AgentEvl算法,旨在探索通用智能体的自我进化能力,并在多项任务上取得了与GPT-4、Claude等SOTA模型相比的出色表现。
AgentGym平台提供了一个交互式训练与评测一体化的环境,支持智能体进行对话、执行动作并接收反馈。
它具备以下特点:1.支持多种环境和近百项任务,例如网页导航、文字游戏、工具控制等;2.提供统一的环境操作接口,简化配置过程;3.拥有多样化的环境,如WebShop环境,用于网络购物任务的交互式平台。
平台的框架包括数据驱动部分,详细介绍了轨迹数据的收集和处理方式,以及如何通过Thought-Action对推理步骤和行动序列进行结合。
此外,AgentGym使用的评估方法AgentEval是基于LLM的智慧体,用于全面评估AI模型的性能。
AgentGym平台采用模块化设计,便于开发者添加或更改环境。
环境部署在不同服务器上,并通过HTTP服务实现灵活、高效的交互。
客户端(EnvClients)封装了与环境交互所需的函数,为用户提供相应的操作接口。
文章还提到了行为克隆方法和自我进化基于环境反馈的概念,并提供了论文链接和代码仓库链接,以及相关话题和专题的介绍。
OpenAI最近在其博客上发布了一篇名为CriticGPT的新论文,这是其前任超级对齐团队的遗作之一。
CriticGPT基于GPT-4训练,旨在通过自我批评来指正GPT-4的输出错误。
OpenAI最近成立了一个名为“Superalignment(超级对齐)”的新团队,由联合创始人Ilya Sutskever和Jan Leike共同领导,旨在解决AI对齐问题。
研究表明,使用15亿参数的GPT-2模型可以激发GPT-4的大部分能力,使其达到接近GPT-3.5级别的性能,甚至可以正确泛化到小模型失败的难题上。
OpenAI的这一举措开辟了一个新的研究方向,有助于调整未来的超级AI模型,并在迭代的实证中取得进展。
CriticGPT的建议并非全都正确无误,但OpenAI的人员发现,有了CriticGPT的帮助,训练师可以发现更多模型编写答案的问题。
这一成果有望为AI领域的自我提升和对齐问题提供新的解决方案。