• 揭秘字节跳动万卡集群技术:仅用2天完成GPT-3训练,算力利用率超越英伟达Megatron-LM
    揭秘字节跳动万卡集群技术:仅用2天完成GPT-3训练,算力利用率超越英伟达Megatron-LM
    随着对Sora技术分析的展开,AI基础设施的重要性愈发凸显。来自字节和北大的一篇新论文在此时吸引关注:文章披露,字节搭建起的万卡集群,能在1.75天内完成GPT-3规模模型(175B)的训练。具体来说,字节提出了一个名为MegaScale的生产系统,旨在解决在万卡集群上训练大模型时面临的效率和稳定性挑战。在12288块GPU上训练1750亿参数大语言模型时,MegaScale实现了55.2%的算力利用率(MFU),是英伟达Megatron-LM的1.34倍。论文还透露,截止2023年9月,字节已建立起超过
    科技周边 · 人工智能   |  1年前  |   AI 模型 490浏览 收藏
  • 斯坦福和OpenAI提出meta-prompting,最强零样本prompting技术诞生了
    斯坦福和OpenAI提出meta-prompting,最强零样本prompting技术诞生了
    最新一代语言模型(如GPT-4、PaLM和LLaMa)在自然语言处理和生成方面取得了重要的突破。这些大规模模型能够应对各种任务,从创作莎士比亚风格的十四行诗到概括复杂的医疗报告,甚至解决竞赛级的编程问题。虽然这些模型能够解决多样化的问题,但并非始终正确。有时候它们可能会生成不准确、误导性或矛盾的响应结果。因此,在使用这些模型时,仍然需要谨慎评估和验证其输出的准确性和可靠性。随着模型运行成本的下降,人们开始考虑使用脚手架系统和多语言模型查询来提高模型输出的准确度和稳定性。这种方法可以优化模型的性能,并为用户
    科技周边 · 人工智能   |  1年前  |   AI 数据 490浏览 收藏
  • 面壁智能完成新一轮数亿元融资,继续面向AGI的高效大模型征程
    面壁智能完成新一轮数亿元融资,继续面向AGI的高效大模型征程
    近日,面壁智能完成新一轮数亿元融资,由春华创投、华为哈勃领投,北京市人工智能产业投资基金等跟投,知乎作为战略股东继续跟投支持。本轮融资完成后,面壁智能将进一步推进优秀人才引入,加固大模型展开的基础算力与数据基础,持续引领“高效大模型”路线,推动大模型高效训练,快速应用落地。本轮由光源资本担任独家财务顾问。基于扎实的原创性AI技术基础,面壁智能是世界范围内对“高效大模型”探索最为前列的大模型团队之一,目前已完成了贯彻高效训练、高效落地与高效推理的大模型全栈技术生产线布局。核心研发团队脱胎于清华NLP实验室,
    科技周边 · 人工智能   |  1年前  |   产业 490浏览 收藏
  • 揭秘扩散模型背后的“硬核骨架”:一文读懂Backbone在生成艺术与智能决策中的关键作用
    揭秘扩散模型背后的“硬核骨架”:一文读懂Backbone在生成艺术与智能决策中的关键作用
    引子:揭开扩散模型及其“脊梁骨”的神秘面纱如今,AI创作的精美画作、音视频内容层出不穷,其中有一项技术犹如魔法般从无到有地创造出惊艳作品,那就是扩散模型。而在其运作机制的核心深处,有一个至关重要的结构——我们称之为“backbone”,正是这个强大的支撑架构赋予了模型学习和理解数据的能力。今天,我们就深入浅出地剖析一下扩散模型的backbone,看它是如何扮演着推动模型高效工作的角色。一、走进扩散模型的世界扩散模型是一种基于概率框架的深度学习模型,它通过模拟数据从清晰状态逐步转变为噪声状态,再逆向恢复到清
    科技周边 · 人工智能   |  1年前  |   模型 数据分析 Backbone 490浏览 收藏
  • Docker三分钟搞定LLama3开源大模型本地部署
    Docker三分钟搞定LLama3开源大模型本地部署
    概述LLaMA-3(LargeLanguageModelMetaAI3)是由Meta公司开发的大型开源生成式人工智能模型。它在模型结构上与前一代LLaMA-2相比没有大的变动。LLaMA-3模型分为不同规模的版本,包括小型、中型和大型,以适应不同的应用需求和计算资源。小型模型参参数规模为8B,中型模型参参数规模为70B,而大型模型参参数规模则达到400B。然而在训练中,目标是实现多模态、多语言的功能,预计结果将与GPT4/GPT4V相当。安装OllamaOllama是一个开源的大型语言模型(LLM)服务工
    科技周边 · 人工智能   |  1年前  |   docker 模型 Llama3 490浏览 收藏
  • 阿里智能体“组装工厂”开源!0经验搞定上万Agent并发
    阿里智能体“组装工厂”开源!0经验搞定上万Agent并发
    让多智能体开发就像搭积木,阿里巴巴通义实验室开源多智能体编程框架与开发平台AgentScope。该平台专门为多智能体应用开发者打造,旨在提供高易用的编程体验、稳定可靠的运行时保障,并且为开发者提供了分布式和多模态的技术支持。内置了OpenAI、DashScope、Gemini、Ollama等多种不同平台的模型API,深度兼容当下的大模型开源生态。AgentScope提供了多种开箱即用的功能,通过简单拖拽就能搭建多智能体应用。即使没有分布式开发经验的开发者,在AgentScope平台上也能轻松实现上万级别的
    科技周边 · 人工智能   |  1年前  |   开源 AI 490浏览 收藏
  • 开源!V2Xverse:上交发布首个面向V2X的仿真平台与端到端模型
    开源!V2Xverse:上交发布首个面向V2X的仿真平台与端到端模型
    车路协同的同步驾驶数据车路协同辅助的自动驾驶V2X-AD(Vehicle-to-everything-aidedautonomousdriving)在提供更安全的驾驶策略方面具有巨大潜力。研究者们在V2X-AD的通信和通信层面进行了大量的研究,但是这些基础设施和通信资源在提高驾驶性能方面的效果仍未得到充分探索。这突显了研究协同自动驾驶的必要性,即如何设计面向驾驶规划的高效信息共享策略,从而提高每辆汽车驾驶性能。这需要两个关键的基础条件:一个是能够为V2X-AD提供数据环境的平台,以及一个具有驾驶相关完整功
    科技周边 · 人工智能   |  1年前  |   开源 模型 490浏览 收藏
  • GLM-4开源版本终于来了:超越Llama3,多模态比肩GPT4V,MaaS平台也大升级
    GLM-4开源版本终于来了:超越Llama3,多模态比肩GPT4V,MaaS平台也大升级
    最新版本大模型,6分钱100万Token。今天上午,在AI开放日上,备受关注的大模型公司智谱AI公布了一系列行业落地数字:根据最新的统计数据,智谱AI大模型开放平台目前已经获得30万注册用户,日均调用量达到400亿Tokens,其中,过去6个月API每日消费量增长达50倍以上,性能最强的GLM-4模型在过去4个月中有超过90倍的增长。在最近的清谈App中,已有超过30万个智能体活跃在智能体中心,包括许多出色的生产力工具,如思维导图、文档助手、日程安排等等。而在新技术一侧,GLM-4的最新版本GLM-4-9
    科技周边 · 人工智能   |  1年前  |   产业 智谱 AI GLM-4-9B 490浏览 收藏
  • LLM仍然不能规划,刷屏的OpenAI o1远未达到饱和
    LLM仍然不能规划,刷屏的OpenAI o1远未达到饱和
    实验证明,大模型的System2能力还有待开发。规划行动方案以实现所需状态的能力一直被认为是智能体的核心能力。随着大型语言模型(LLM)的出现,人们对LLM是否具有这种规划能力产生了极大的兴趣。最近,OpenAI发布了o1模型,一举创造了很多历史记录。o1模型拥有真正的通用推理能力。在一系列高难基准测试中展现出了超强实力,相比GPT-4o有巨大提升,让大模型的上限从「没法看」直接上升到优秀水平,不专门训练直接数学奥赛金牌,甚至能在博士级别的科学问答环节上超越人类专家。那么,o1模型是否具备上述规划能力?2
    科技周边 · 人工智能   |  11个月前  |   产业 490浏览 收藏
  • 芯粤能顺利通过IATF 16949:2016汽车行业质量管理体系认证
    芯粤能顺利通过IATF 16949:2016汽车行业质量管理体系认证
    在持续推动技术创新与品质卓越的道路上,广东芯粤能半导体有限公司(以下简称:芯粤能)迎来了又一里程碑式的成就。芯粤能顺利通过IATF16949汽车行业质量管理体系认证,标志着其已根据IATF16949标准建立并实施质量管理体系,满足从产品研发、采购、生产、检验到售后服务等各方面对汽车行业供应链所设定的质量要求。IATF16949作为全球汽车行业公认的质量管理最高标准,它整合了ISO9001和汽车行业特定的质量管理要求,旨在确保汽车供应链中的每个环节都符合严格的质量标准。市场是海,质量是船,品牌是帆。芯粤能专
    科技周边 · 人工智能   |  10个月前  |   芯粤能 490浏览 收藏
  • 骄成超声与柏楚电子达成战略合作,聚焦超声波和激光技术融合创新
    骄成超声与柏楚电子达成战略合作,聚焦超声波和激光技术融合创新
    11月20日,骄成超声与柏楚电子在上海签订战略合作协议。根据协议,两家公司将在以下领域展开合作:产品技术研发:探索超声波和激光技术在先进应用场景中的融合与创新。供应链:建立优势技术联合开发模式。渠道建设:覆盖精密运动控制、传感器技术、光路测量、过程监控和声光一体化等技术领域。合作旨在增强新技术体验,推动持续升级和优化。骄成超声表示,作为功率超声领域的上市企业,其目标是打造超声波技术平台型企业,并拓展超声波应用至新能源、半导体和医疗医美领域。柏楚电子是工业激光加工自动化控制行业的先驱,在计算机图形学、运动控
    科技周边 · 人工智能   |  8个月前  |   柏楚电子 490浏览 收藏
  • 2025 CES亮点: Symphony Opus One丹拿第一交响重新定义未来家庭影音体验
    2025 CES亮点: Symphony Opus One丹拿第一交响重新定义未来家庭影音体验
    丹拿(Dynaudio)在2025年CES展会上惊艳亮相!其首款家庭影音一体化解决方案——SymphonyOpusOne丹拿第一交响,继CEDIA展会后再次惊艳登场,成为展会焦点。这款产品集全球领先声学技术与革新设计于一身,吸引了众多行业专家、媒体和消费者的目光。家庭影音系统新纪元:SymphonyOpusOne丹拿第一交响SymphonyOpusOne丹拿第一交响的推出,标志着家庭影音系统进入全新时代。它突破了传统音响的限制,采用全球最先进的声学算法,并结合丹拿独有的声学校准技术,自动优化声音在不同环境
    科技周边 · 人工智能   |  7个月前  |   歌尔股份 490浏览 收藏
  • ScienceAl 2024「AI+药物&医疗&基因组&细胞」专题年度回顾
    ScienceAl 2024「AI+药物&医疗&基因组&细胞」专题年度回顾
    2024年,人工智能在药物研发、医疗、基因组学和细胞生物学领域取得了令人瞩目的进展。从AI辅助药物设计到基因编辑技术的精准应用,从单细胞分析到多模态医疗决策,科技的融合为人类健康带来了无限可能。AI驱动的药物研发效率显著提升,精准度也大幅提高。在基因与细胞研究方面,单细胞技术与深度学习的结合,为理解复杂生物系统提供了强大的工具,推动了精准医疗的发展。医疗AI在诊断、治疗和患者管理中的应用日益广泛,多模态数据整合和智能算法的进步,为个性化医疗开辟了新的方向。ScienceAI2024年AI在生物医学领域重要
    科技周边 · 人工智能   |  7个月前  |   理论 药物 基因组学 细胞生物学 490浏览 收藏
  • 陕西战新产业发展并购基金正式发布,总规模50亿元
    陕西战新产业发展并购基金正式发布,总规模50亿元
    陕西战新产业发展并购基金正式启动!12月25日,陕西国资国企战新产业发展大会暨并购基金发布会上,总规模50亿元的陕西战新产业发展并购基金正式亮相。(来源:长安汇通)该基金由长安汇通、工银投资和开源证券共同发起,将重点关注陕西省国资委重点布局的战略性新兴产业。基金将积极寻找与省属国企、上市公司及产业链龙头企业具有协同效应的优质投资标的,助力培育和发展新兴产业。这是继国企结构调整基金和西安区域综合改革基金之后,长安汇通与央企合作设立的又一重大专项基金,也是陕西省“并购六条”政策出台后首批落地的省级并购基金。长
    科技周边 · 人工智能   |  7个月前  |   陕西国资 并购基金 490浏览 收藏
  • 李想曾预言2025年将诞生新能源“五常品牌”:包含华为
    李想曾预言2025年将诞生新能源“五常品牌”:包含华为
    2025年中国新能源汽车市场竞争依然激烈,延续了2024年的态势。值得关注的是,理想汽车CEO李想此前预测,2025年将出现新能源汽车“五常品牌”,其中包括比亚迪和华为等巨头。李想据了解,李想在2023年4月的朋友圈中曾大胆预言:2023年至2025年,是中国智能电动车市场的关键时期,如同二战最后三年一样充满挑战。他预测2025年12月新能源汽车(NEV)销量占比将超过80%,并诞生五大领先品牌。这条朋友圈如今被网友们纷纷提及。随后,李想在微博评论区公布了其中三个品牌:比亚迪、特斯拉和华为(指鸿
    科技周边 · 人工智能   |  7个月前  |   490浏览 收藏
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    511次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    498次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
  • Golang深入理解GPM模型
    Golang深入理解GPM模型
    Golang深入理解GPM调度器模型及全场景分析,希望您看完这套视频有所收获;包括调度器的由来和分析、GMP模型简介、以及11个场景总结。
    474次学习
查看更多
AI推荐
  • 千音漫语:智能声音创作助手,AI配音、音视频翻译一站搞定!
    千音漫语
    千音漫语,北京熠声科技倾力打造的智能声音创作助手,提供AI配音、音视频翻译、语音识别、声音克隆等强大功能,助力有声书制作、视频创作、教育培训等领域,官网:https://qianyin123.com
    316次使用
  • MiniWork:智能高效AI工具平台,一站式工作学习效率解决方案
    MiniWork
    MiniWork是一款智能高效的AI工具平台,专为提升工作与学习效率而设计。整合文本处理、图像生成、营销策划及运营管理等多元AI工具,提供精准智能解决方案,让复杂工作简单高效。
    314次使用
  • NoCode (nocode.cn):零代码构建应用、网站、管理系统,降低开发门槛
    NoCode
    NoCode (nocode.cn)是领先的无代码开发平台,通过拖放、AI对话等简单操作,助您快速创建各类应用、网站与管理系统。无需编程知识,轻松实现个人生活、商业经营、企业管理多场景需求,大幅降低开发门槛,高效低成本。
    311次使用
  • 达医智影:阿里巴巴达摩院医疗AI影像早筛平台,CT一扫多筛癌症急慢病
    达医智影
    达医智影,阿里巴巴达摩院医疗AI创新力作。全球率先利用平扫CT实现“一扫多筛”,仅一次CT扫描即可高效识别多种癌症、急症及慢病,为疾病早期发现提供智能、精准的AI影像早筛解决方案。
    321次使用
  • 智慧芽Eureka:更懂技术创新的AI Agent平台,助力研发效率飞跃
    智慧芽Eureka
    智慧芽Eureka,专为技术创新打造的AI Agent平台。深度理解专利、研发、生物医药、材料、科创等复杂场景,通过专家级AI Agent精准执行任务,智能化工作流解放70%生产力,让您专注核心创新。
    340次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码