
AutoGLM
探索AutoGLM,ChatGLM家族的新系列,通过图形用户界面实现自主任务完成。它通过自主环境互动学习,提升在动态现实世界环境中的决策能力,适用于网页浏览和安卓设备控制等领域。
AutoGLM:ChatGLM家族的新成员,实现自主任务完成
AutoGLM是ChatGLM家族中的一款创新产品,专为通过图形用户界面(如手机和网页)实现自主任务完成而设计。它通过自主环境互动学习,强化现有模型的能力,弥补基础模型在动态现实世界环境中决策的不足,推动其向通用人工智能的方向发展。
核心特点:
- 自主环境互动学习:AutoGLM通过与环境的自主互动学习,提升其决策能力,能够适应不断变化的现实世界环境。
- “中间界面”设计:采用了适用于GUI控制的“中间界面”,将规划和执行行为分离,分别优化其灵活性和准确性。
- 渐进式训练框架:采用新颖的渐进式训练框架,支持AutoGLM进行自我进化的在线课程强化学习。
- 多领域有效性验证:在网页浏览、安卓设备控制等多个领域中,AutoGLM表现出色,成功率高。
主要功能:
- 网页浏览控制:支持在网页浏览器中自主完成各种操作,如预订餐厅、创建项目问题、查找商品等。
- 安卓设备控制:可以在安卓设备上自主完成各种任务,如写邮件、查找地点、添加商品到购物车等。
- 多语言支持:支持中文和英文的指令执行,能够理解和执行中英文混合的任务指令。
- 任务规划与执行:具备任务规划能力,能够根据任务目标规划操作步骤,并准确执行。
使用示例:
- 手机使用示例:
- 在Gmail中写一封关于项目进度的邮件,主题为“hi”,发送给harry66@gmail.com,并安排在10月30日早上8点发送。
- 在Google Maps中查找最近的评分最高的咖啡店,并步行导航至该地点。
- 在Temu上将两双销量最高的7.5码女性跑鞋添加到购物车。
- 网页浏览器使用示例:
- 在OpenTable上为2人预订2024年11月6日晚上7:30的Saffron Fine Indian Cuisine餐厅。
- 在GitLab上查看项目Zhipu AI的问题,并创建一个名为“excellent engineer wanted”的问题。
- 在OneStopShop上按价格升序显示“椅子”列表。
- 在小红书上查找热度最高的罗马旅游图文攻略,并总结其中提到的必去景点。
总结:
AutoGLM作为ChatGLM家族的新成员,通过图形用户界面实现对数字设备的自主控制。它通过自主环境互动学习和渐进式训练框架,有效提升了在动态现实世界环境中的决策能力。AutoGLM在网页浏览和安卓设备控制等多个领域表现出色,具有广泛的应用前景和实用价值,为实现更智能、更自主的人工智能系统提供了有力支持。