• Qwen1.5开源并引入六种体量模型,超越GPT3.5的性能水平
    Qwen1.5开源并引入六种体量模型,超越GPT3.5的性能水平
    赶在春节前,通义千问大模型(Qwen)的1.5版上线了。今天上午,新版本的消息引发了AI社区关注。新版大模型包括六个型号尺寸:0.5B、1.8B、4B、7B、14B和72B。其中,最强版本的性能超越了GPT3.5和Mistral-Medium。该版本包含Base模型和Chat模型,并提供多语言支持。阿里通义千问团队表示,相关技术也已经上线到了通义千问官网和通义千问App。除此以外,今天Qwen1.5的发布还有如下一些重点:支持32K上下文长度;开放了Base+Chat模型的checkpoint;可与Tra
    科技周边 · 人工智能   |  1年前  |   AI 训练 501浏览 收藏
  • 交叉熵解读与应用
    交叉熵解读与应用
    熵量化了事件的不确定性大小。在数据科学中,交叉熵和KL散度与离散概率分布相关,用于衡量两个分布的相似程度。在机器学习中,通过交叉熵损失来评估预测分布与真实分布的接近程度。给定真实分布t和预测分布p,它们之间的交叉熵由以下等式给出:其中p(x)是真实概率分布(one-hot),q(x)是预测概率分布。然而,在现实世界中,预测值与实际值的差异称为发散,因为它们背离了实际值。交叉熵是熵和KL散度的综合度量。现在让我们使用分类示例了解交叉熵如何适合深度神经网络范例。每个分类案例都有一个已知的类别标签,概率为1.0
    科技周边 · 人工智能   |  1年前  |   机器学习 424浏览 收藏
  • OCR技术简介及其实施和应用
    OCR技术简介及其实施和应用
    光学字符识别(OCR)是数字化文档的重要技术之一。它利用计算机视觉检测和读取图像中的文本,并结合自然语言处理算法破译和理解文档传达的内容。本文将详细介绍OCR技术的原理和应用。光学字符识别技术的实现方式基于机器学习的办法虽然基于机器学习的方法开发速度快,但运行时间长得多,准确性和推理速度容易被深度学习算法超越。光学字符识别方法经过预处理,清理和消除噪音,然后二值化文档以进行轮廓检测,帮助行列检测。最后,通过各种机器学习算法,如K近邻和支持向量机算法提取、分割和识别字符。虽然在简单的OCR数据集上效果很好,
    科技周边 · 人工智能   |  1年前  |   机器学习 深度学习 375浏览 收藏
  • 深度聚类的综合算法分析
    深度聚类的综合算法分析
    深度聚类是一种结合了深度学习模型和聚类算法的方法,用于自动地从数据中学习特征并将数据分组成具有相似特征的类别。相较于传统的聚类算法,深度聚类能够有效处理高维度、非线性和复杂的数据,并具有更好的表现力和精度。通过深度学习模型,深度聚类可以学习到数据的抽象表示,从而更好地捕捉数据的内在结构和相似性。这种方法的优势在于能够自动地学习到数据的特征,而无需手动定义特征,从而减少了人为因素的干扰。深度聚类在许多领域都有广泛的应用,如计算机视觉、自然语言处理和推荐系统等。深度聚类的核心思想是利用深度学习模型将数据降维到
    科技周边 · 人工智能   |  1年前  |   机器学习 深度学习 137浏览 收藏
  • 什么是机器学习?
    什么是机器学习?
    机器学习到底是什么?它是人工智能的一部分,机器学习是一种人工智能应用程序,它赋予系统和机器拥有使用过去经验学习并改进的能力。它可以从数据中学习并将所学知识应用于未来,并以此得到更好成果的计算机程序。AI利用机器学习分析可用数据,以识别在不同场景中做出更佳决策的模式。机器学习的目标是让计算机和系统能够自动学习,无需人工干预。设计准确的模型需要处理大量数据以应对各种场景。机器学习通过强大的学习能力和算法,使这一过程更快、更容易。机器学习编程系统能够根据过去观察到的数据做出非编程决策。然而,有效地部署这样的系统
    科技周边 · 人工智能   |  1年前  |   机器学习 455浏览 收藏
  • 使用代码让语言模型创造视觉表现:MIT最新研究介绍纯文本模型训练的成果
    使用代码让语言模型创造视觉表现:MIT最新研究介绍纯文本模型训练的成果
    只会「看书」的大语言模型,有现实世界的视觉感知力吗?通过对字符串之间的关系进行建模,关于视觉世界,语言模型到底能学会什么?最近,麻省理工学院计算机科学与人工智能实验室(MITCSAIL)的研究人员对语言模型进行了评估,重点是其视觉能力。他们通过要求模型生成和识别出越来越复杂的视觉概念,从简单形状和物体到复杂场景,来测试模型的能力。研究人员还展示了如何使用纯文本模型训练一个初步的视觉表征学习系统。通过这项研究,他们为进一步发展和改进视觉表征学习系统奠定了基础。论文链接:https://arxiv.org/a
    科技周边 · 人工智能   |  1年前  |   模型 训练 239浏览 收藏
  • 强化学习的定义和应用实例场景说明
    强化学习的定义和应用实例场景说明
    训练狗最佳方法是采用奖励机制,奖励它表现良好,惩罚它做错事。同样的策略可用于机器学习,称为强化学习。强化学习是机器学习的分支之一,通过决策训练模型来找到问题的最佳解决方案。为了提高模型准确性,可通过正奖励鼓励算法接近正确答案,同时给予负奖励以惩罚偏离目标的情况。只需要明确目标,再对数据进行建模,模型与数据开始交互,并自行提出解决方案,无需人工干预。强化学习实例我们还是以训练狗为例,我们提供诸如狗饼干之类的奖励来让狗执行各种动作。狗会按照一定的策略来追求奖励,因此它会听从命令并学习新的动作,如乞讨。狗喜欢四
    科技周边 · 人工智能   |  1年前  |   机器学习 441浏览 收藏
  • 如何通过主动学习以较少的数据进行神经网络训练
    如何通过主动学习以较少的数据进行神经网络训练
    主动学习是一种通过利用人类专家知识指导神经网络学习的方法,以提高模型性能和泛化能力。它通过少量数据来实现这一目的。主动学习的好处不仅在于节省了采集大量标注数据的成本,还在于能够让神经网络更加高效地利用已有的数据来进行学习。这种方法的优势在于其能够减少对标注数据的需求,并且通过有针对性地选择样本进行标注,能够更好地指导神经网络的学习过程。这种方法尤其适用于数据量有限的情况下,可以提高模型的学习效果和泛化能力。主动学习的基本思路是通过选择最有价值的样本来让人类专家进行标注,然后将这些标注好的数据加入训练集,以
    科技周边 · 人工智能   |  1年前  |   机器学习 人工神经网络 372浏览 收藏
  • ConvNet和Transformer的对比:对4个领先的视觉模型进行Meta评测,LeCun表达认可
    ConvNet和Transformer的对比:对4个领先的视觉模型进行Meta评测,LeCun表达认可
    如何根据特定需求选择视觉模型?ConvNet/ViT、supervised/CLIP模型,在ImageNet之外的指标上如何相互比较?来自MABZUAI和Meta的研究人员发表的最新研究,在「非标准」指标上全面比较了常见的视觉模型。论文地址:https://arxiv.org/pdf/2311.09215.pdfLeCun对这项研究给予高度赞扬,称其为非常出色的研究。研究比较了相似大小的ConvNext和VIT架构,在监督模式和使用CLIP方法进行训练时,对各种属性进行了全面比较。超越ImageNet准确
    科技周边 · 人工智能   |  1年前  |   AI 数据 123浏览 收藏
  • 谷歌发布了具备自我判断输出正确性能力的 AI 训练框架 ASPIRE
    谷歌发布了具备自我判断输出正确性能力的 AI 训练框架 ASPIRE
    谷歌近日发布新闻稿,宣布推出ASPIRE训练框架,专为大语言模型设计。该框架旨在提升AI模型的选择性预测能力。谷歌提到,当下大语言模型在自然语言理解和生成内容方面发展迅速,已被用于构建各种创新应用,但要应用于高风险决策类场合依然不妥。这是由于模型预测具有不确定性及“幻觉”可能,因此谷歌开发了一款ASPIRE训练框架,为系列模型引入了“可信度”机制,即——模型会输出一系列答案,每个答案都会具有正确概率评分。▲图源谷歌新闻稿(下同)在技术层面,该训练框架可划分为三个阶段:特定任务调整、答案采样和自我评估学习。
    科技周边 · 人工智能   |  1年前  |   AI ​谷歌 大语言模型 423浏览 收藏
  • 人脸识别的发展历程与常用数据集
    人脸识别的发展历程与常用数据集
    人脸识别早期阶段——基于机器学习早期的方法主要侧重于与计算机视觉专家合作,提取手工特征,并使用传统的机器学习算法训练有效的分类器进行检测。然而,这些方法的局限性在于需要专家制作有效的特征,并且每个组件都需要单独优化,导致整个检测管道不够优化。为了解决这个问题,人们提出了更复杂的特征,如HOG、SIFT、SURF和ACF。为了增强检测的鲁棒性,还开发了针对不同视图或姿势训练的多个检测器的组合。然而,这些模型的训练和测试时间较长,对检测性能的提升有限。人脸识别更加先进的技术——基于深度学习近年来,面部识别方面
    科技周边 · 人工智能   |  1年前  |   人工智能 机器学习 450浏览 收藏
  • 单层神经网络的逼近能力涵盖了各种单值连续函数
    单层神经网络的逼近能力涵盖了各种单值连续函数
    单层神经网络,也称为感知器,是一种最简单的神经网络结构。它由输入层和输出层组成,每个输入与输出之间都有一个带权重的连接。其主要目的是学习输入与输出之间的映射关系。由于具备强大的逼近能力,单层神经网络能够拟合各种单值连续函数。因此,它在模式识别和预测问题中具有广泛应用潜力。单层神经网络的逼近能力可以通过感知器收敛定理来证明。该定理指出,感知器可以找到一个分界面,将线性可分的函数区分为两个类别。这证明了感知器的线性逼近能力。然而,对于非线性函数,单层神经网络的逼近能力是有限的。因此,为了处理非线性函数,我们需
    科技周边 · 人工智能   |  1年前  |   人工神经网络 435浏览 收藏
  • 使用Transformers进行文本生成的原因是什么?
    使用Transformers进行文本生成的原因是什么?
    由于这几个关键优势,Transformer被广泛用于文本生成任务:注意力机制在Transformers中的作用是允许模型关注输入序列的不同部分,并权衡它们对输出预测的贡献。这使得模型能够处理更长的文本序列,并捕获远程依赖关系。并行计算:Transformer可以并行训练,这样可以加快训练过程,并可以在大量数据上进行训练。迁移学习:Transformer已经在大量文本数据上进行了预训练,因此可以使用较少的附加数据进行微调,以针对特定任务。这种方式允许利用现有知识并提高性能。高精度:Transformers在
    科技周边 · 人工智能   |  1年前  |   430浏览 收藏
  • 语义编码器:工作原理和应用解析
    语义编码器:工作原理和应用解析
    语义编码器是一种用于将自然语言文本转换为低维向量表示的人工神经网络模型。通过捕捉语言中的语义和语法结构,这些向量表示可用于各种自然语言处理任务,如文本分类、情感分析和机器翻译。知名的语义编码器包括BERT、GPT和ELMo等。它们在处理不同类型的文本数据时展现出了卓越的性能和效果。这些语义编码器以其强大的表示能力和优秀的训练机制,为自然语言处理领域的研究和应用带来了巨大的推动和进展。语义编码器的工作原理通常可以分为以下几个步骤:1.输入表示:将自然语言文本转换成机器可以理解的表示形式,如词向量等。2.序列
    科技周边 · 人工智能   |  1年前  |   人工神经网络 190浏览 收藏
  • 优化ML模型部署的策略
    优化ML模型部署的策略
    随着机器学习技术的迅速进步,越来越多的企业和组织开始将其应用于生产环境中,以增强业务流程,提高效率并降低成本。然而,配置机器学习模型的一部分通常是一个复杂的过程,需要专业技能和知识。为了简化这个过程,以下是一些方法和技巧,可以帮助您快速轻松地配置您的机器学习模型。首先,确保您有一个清晰的目标和问题陈述。了解您希望模型解决的具体问题,并将其转化为可量化的目标。这将有助于指导您的配置过程,并确保您的模型能够达到预期的结果。其次,选择适当的算法和模型架构。根据您的问题和数据特征,选择与之匹配的算法和模型架构。考
    科技周边 · 人工智能   |  1年前  |   机器学习 474浏览 收藏
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
  • Golang深入理解GPM模型
    Golang深入理解GPM模型
    Golang深入理解GPM调度器模型及全场景分析,希望您看完这套视频有所收获;包括调度器的由来和分析、GMP模型简介、以及11个场景总结。
    473次学习
查看更多
AI推荐
  • AI Make Song:零门槛AI音乐创作平台,助你轻松制作个性化音乐
    AI Make Song
    AI Make Song是一款革命性的AI音乐生成平台,提供文本和歌词转音乐的双模式输入,支持多语言及商业友好版权体系。无论你是音乐爱好者、内容创作者还是广告从业者,都能在这里实现“用文字创造音乐”的梦想。平台已生成超百万首原创音乐,覆盖全球20个国家,用户满意度高达95%。
    16次使用
  • SongGenerator.io:零门槛AI音乐生成器,快速创作高质量音乐
    SongGenerator
    探索SongGenerator.io,零门槛、全免费的AI音乐生成器。无需注册,通过简单文本输入即可生成多风格音乐,适用于内容创作者、音乐爱好者和教育工作者。日均生成量超10万次,全球50国家用户信赖。
    13次使用
  •  BeArt AI换脸:免费在线工具,轻松实现照片、视频、GIF换脸
    BeArt AI换脸
    探索BeArt AI换脸工具,免费在线使用,无需下载软件,即可对照片、视频和GIF进行高质量换脸。体验快速、流畅、无水印的换脸效果,适用于娱乐创作、影视制作、广告营销等多种场景。
    12次使用
  • SEO标题协启动:AI驱动的智能对话与内容生成平台 - 提升创作效率
    协启动
    SEO摘要协启动(XieQiDong Chatbot)是由深圳协启动传媒有限公司运营的AI智能服务平台,提供多模型支持的对话服务、文档处理和图像生成工具,旨在提升用户内容创作与信息处理效率。平台支持订阅制付费,适合个人及企业用户,满足日常聊天、文案生成、学习辅助等需求。
    16次使用
  • Brev AI:零注册门槛的全功能免费AI音乐创作平台
    Brev AI
    探索Brev AI,一个无需注册即可免费使用的AI音乐创作平台,提供多功能工具如音乐生成、去人声、歌词创作等,适用于内容创作、商业配乐和个人创作,满足您的音乐需求。
    17次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码