当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > 时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

来源:51CTO.COM 2024-05-23 18:45:10 0浏览 收藏

亲爱的编程学习爱好者,如果你点开了这篇文章,说明你对《时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3》很感兴趣。本篇文章就来给大家详细解析一下,主要介绍一下,希望所有认真读完的童鞋们,都有实质性的提高。

这几天,全世界的目光仿佛都被OpenAI发布的GPT-4o所吸引,与此同时,OpenAI的挑战者们也在同步创造历史。

就在5月14日,阿布扎比先进技术研究委员会(ATRC)下属的技术创新研究所(TII),发布了新一代的Falcon 2模型。

时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

Falcon 2 11B已开启访问,Falcon 2 11B VLM将在5月14日中午12点开放

时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

新一代「猎鹰」(Falcon意为猎鹰)重返竞技场,一经推出,迅速登上了HN热榜第一。

时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

去年Falcon首次推出就技惊四座,以碾压性的优势超越了Llama。

根据Hugging Face排行榜,这次推出的Falcon 2 11B性能再次超越了Llama 3 8B,与领先的Gemma 7B性能相当,平均性得分仅差0.01。

时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

Falcon 2包括两个版本:Falcon 2 11B和Falcon 2 11B VLM。

前者是在 5.5 万亿个token上训练出的大语言模型,后者则在此基础上开发的「视觉到语言」模型。

作为一款开源的大语言模型,Falcon 2不仅具备多语言能力,而且支持多模态,可以将视觉输入无缝转换为文本输出,这种功能是当今大模型市场中的首创。

时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

只需要在用户界面上传一张图片并输入提示,就可以得到一段关于图片的文字描述

多语言+多模态

Falcon 2 11B 具有多语言能力,可以快速响应英语、法语、西班牙语、德语、葡萄牙语和其他各种语言的任务。

Falcon 2 11B VLM 作为视觉语言模型,能够从环境中识别和解释各种视觉信息,因此在医疗、金融、电子商务、教育和法律等领域有广泛的应用场景。

比如用于文档管理、上下文索引等任务,而且其「视觉到语言」的功能还有望在未来为视障人群提供帮助。

此外,Falcon 2只需一个GPU就能高效运行,可以轻易部署在笔记本电脑上。

为了加快推进Falcon商业化的进程,去年11月,ATRC就成立了一家新公司——AI71

基于Falcon模型,AI71已经进军阿联酋的教育、医疗、法律等多个领域,并计划很快拓展到阿联酋以外。Falcon的本次升级,为其商业化进程提供了有力支撑。

坚持开源的Falcon

TII发布的人工智能模型,在全球范围内一直名列前茅,新推出的Falcon 2 11B 模型让TII的地位再次得到稳固。

更重要的是,本次更新的两个模型版本均已开源,全世界的开发人员都可以不受限制地使用,并在此基础上进行开发和部署。模型展现出的优秀性能意味着TII有望与Meta竞争开源宇宙霸主的地位。

阿布扎比先进技术研究委员会(ATRC)秘书长 Faisal Al Bannai 承诺,将会坚持推动开源创新,帮助全世界的开发者们实现他们的AI之旅。

时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

TII首席研究员Hakim Hacid博士也表示「开发人员正在认识到更小、更高效模型的无数好处······这是下一个新兴的大趋势。此外,Falcon 2的视觉转语言能力为人工智能的易用性开辟了新的前景,为用户提供了变革性的从图像到文本的交互方式。」

TII还透露其正在酝酿Falcon 2下一代模型,推出时间将在不久之后,这些模型的性能将通过专家混合(MoE)技术得到进一步增强。

开源与闭源之争,战局未定。但无论如何,TII已经成为AGI领域的一支劲旅,这背后是阿联酋自上而下形成的合力,他们正全力推动人工智能的发展,将这项技术视为继石油之后的下一个经济支柱。

Falcon不仅仅是作为「严肃的参与者」而存在,而是雄心勃勃振翅盘旋的「猎鹰」。

文中关于AI,数据的知识介绍,希望对你的学习有所帮助!若是受益匪浅,那就动动鼠标收藏这篇《时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3》文章吧,也可关注golang学习网公众号了解相关技术文章。

版本声明
本文转载于:51CTO.COM 如有侵犯,请联系study_golang@163.com删除
PHP框架中的国际化和本地化:支持多语言应用,拓展全球市场PHP框架中的国际化和本地化:支持多语言应用,拓展全球市场
上一篇
PHP框架中的国际化和本地化:支持多语言应用,拓展全球市场
克雷研究所100万美元奖金要归AI了数学界规则大改,未来数学家如何应对「海量猜想」
下一篇
克雷研究所100万美元奖金要归AI了数学界规则大改,未来数学家如何应对「海量猜想」
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    511次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    498次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • 千音漫语:智能声音创作助手,AI配音、音视频翻译一站搞定!
    千音漫语
    千音漫语,北京熠声科技倾力打造的智能声音创作助手,提供AI配音、音视频翻译、语音识别、声音克隆等强大功能,助力有声书制作、视频创作、教育培训等领域,官网:https://qianyin123.com
    164次使用
  • MiniWork:智能高效AI工具平台,一站式工作学习效率解决方案
    MiniWork
    MiniWork是一款智能高效的AI工具平台,专为提升工作与学习效率而设计。整合文本处理、图像生成、营销策划及运营管理等多元AI工具,提供精准智能解决方案,让复杂工作简单高效。
    156次使用
  • NoCode (nocode.cn):零代码构建应用、网站、管理系统,降低开发门槛
    NoCode
    NoCode (nocode.cn)是领先的无代码开发平台,通过拖放、AI对话等简单操作,助您快速创建各类应用、网站与管理系统。无需编程知识,轻松实现个人生活、商业经营、企业管理多场景需求,大幅降低开发门槛,高效低成本。
    166次使用
  • 达医智影:阿里巴巴达摩院医疗AI影像早筛平台,CT一扫多筛癌症急慢病
    达医智影
    达医智影,阿里巴巴达摩院医疗AI创新力作。全球率先利用平扫CT实现“一扫多筛”,仅一次CT扫描即可高效识别多种癌症、急症及慢病,为疾病早期发现提供智能、精准的AI影像早筛解决方案。
    166次使用
  • 智慧芽Eureka:更懂技术创新的AI Agent平台,助力研发效率飞跃
    智慧芽Eureka
    智慧芽Eureka,专为技术创新打造的AI Agent平台。深度理解专利、研发、生物医药、材料、科创等复杂场景,通过专家级AI Agent精准执行任务,智能化工作流解放70%生产力,让您专注核心创新。
    175次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码