-
- 为大模型恶补数学,上交开源MathPile语料库,95亿tokens,还可商用
- 在当前智能对话模型的发展中,强大的底层模型起着至关重要的作用。这些先进模型的预训练往往依赖于高质量且多样化的语料库,而如何构建这样的语料库,已成为行业中的一大挑战。在备受瞩目的AIforMath领域,由于高质量的数学语料相对稀缺,这限制了生成式人工智能在数学应用方面的潜力。为了应对这一挑战,上海交通大学生成式人工智能实验室推出了「MathPile」。这是一套专门针对数学领域的高质量、多样化预训练语料库,其中包含约95亿tokens,旨在提升大型模型在数学推理方面的能力。此外,实验室还推出了MathPile
- 科技周边 · 人工智能 | 1年前 | 产业 MathPile 494浏览 收藏
-
- 58行代码把Llama 3扩展到100万上下文,任何微调版都适用
- 堂堂开源之王Llama3,原版上下文窗口居然只有……8k,让到嘴边的一句“真香”又咽回去了。在32k起步,100k寻常的今天,这是故意要给开源社区留做贡献的空间吗?开源社区当然不会放过这个机会:现在只需58行代码,任何Llama370b的微调版本都能自动扩展到1048k(一百万)上下文。背后是一个LoRA,从扩展好上下文的Llama370BInstruct微调版本中提取出来,文件只有800mb。接下来使用Mergekit,就可以与其他同架构模型一起运行或直接合并到模型中。所使用的1048k上下文微调版本,
- 科技周边 · 人工智能 | 1年前 | 模型 数据 494浏览 收藏
-
- Mistral首个多模态模型Pixtral 12B来了!还是直接放出24GB磁力链接
- 训练完就直接上模型。我们都知道,Mistral团队向来「人狠话不多」。昨天下午,他们又又又丢出了一个不带任何注解的磁力链接。解析一下这个链接,可以看到大小共23.64GB,其中包含4个文件,其中最大的文件是一个封装的多模态大模型。动作快的非官方Mistral社区已经将该模型上传到了HuggingFace。磁力链接:magnet:?xt=urn:btih:7278e625de2b1da598b23954c13933047126238a&dn=pixtral-12b-240910HuggingFace地址:h
- 科技周边 · 人工智能 | 11个月前 | 产业 494浏览 收藏
-
- 用大模型优化大模型预训练数据,节省20倍计算量,实现显著性能提升!
- AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com生成式人工智能研究实验室(GAIR,主页:https://plms.ai/)是国内首个聚焦于生成式人工智能的高校研究组。汇聚了来自于CMU、复旦、交大(ACM班、IEEE试点班等)等顶尖
- 科技周边 · 人工智能 | 10个月前 | 工程 494浏览 收藏
-
- 月之暗面发布k0-math推理模型,对标OpenAI o1
- 11月16日,月之暗面KimiChat宣布推出新一代数学推理模型k0-math。新京报报道,基准测试显示,Kimik0-math的数学能力可与全球领先的OpenAIo1系列可公开使用的两个模型o1-mini和o1-preview相媲美。在中考、高考、考研以及包含入门竞赛题的MATH等4个数学基准测试中,k0-math初代模型的成绩超过了o1-mini和o1-preview模型。在两个难度更大的竞赛级别的数学题库OMNI-MATH和AIME基准测试中,k0-math初代模型的表现分别达到了o1-mini最高
- 科技周边 · 人工智能 | 9个月前 | 月之暗面 494浏览 收藏
-
- 嘉元科技:拟签订50.66亿元电解铜长单采购合同
- 嘉元科技近日发布公告,宣布将与IXMS.A.和埃珂森(上海)企业管理有限公司签订总计7万吨电解铜长单采购合同,合同总金额预计达50.66亿元。此举旨在确保公司电解铜原材料的长期稳定供应,保障生产经营的顺利进行。合同约定,嘉元科技将在2024年12月至2025年11月期间从IXMS.A.采购6万吨电解铜,并在2025年1月2日至2025年12月31日期间从埃珂森上海采购1万吨电解铜。具体价格将根据合同约定的定价原则结算。嘉元科技积极研发创新,近年来已成功推出中强/高强/超高强锂电铜箔、微孔铜箔、单晶铜箔、高
- 科技周边 · 人工智能 | 8个月前 | 嘉元科技 494浏览 收藏
-
- 圆柱电池业务实现增长,长虹能源预计2024年同比扭亏为盈
- 长虹能源2024年度业绩预告:扭亏为盈,销售收入增长长虹能源近日发布2024年度业绩预告,预计归属于母公司所有者的净利润将达到1.85亿元到2.05亿元之间,与上年同期2708.99万元的亏损相比,实现了扭亏为盈。同时,公司销售收入也同比增长。业绩大幅改善的主要原因如下:一次性圆柱形碱性锌锰电池业务:通过积极开拓市场,并实施降本增效和精细化管理,保持了较高的运营效率,销售规模和利润均实现稳步增长。圆柱形高倍率锂电池业务:公司持续推进“强基行动”,优化组织架构和运行机制,提升运营效
- 科技周边 · 人工智能 | 7个月前 | 长虹能源 494浏览 收藏
-
- 2024年中国汽车行业收入突破10万亿 电池利润增48.5%
- 2024年汽车行业经济数据分析:利润下滑,新能源电池逆势增长2024年汽车行业全年总收入达10.65万亿元,同比增长4%,但成本增长5%达到9.33万亿元,导致利润同比下降8%,仅为4623亿元,利润率仅为4.3%,远低于下游工业企业平均水平。12月数据显示,收入同比增长13%达到1.19万亿元,但成本增长更快,达到1.03万亿元(同比增长15%),利润同比下降13.5%至491亿元,利润率降至4.1%。与整体行业利润下滑形成鲜明对比的是,锂离子电池制造行业利润增长48.5%,凸显新能源汽车产业
- 科技周边 · 人工智能 | 7个月前 | 494浏览 收藏
-
- 日本拟对十余种半导体相关物项实施出口管制 商务部:坚决维护自身合法权益
- 针对日本拟对半导体相关物项实施出口管制一事,中国商务部回应称将坚决维护自身合法权益。商务部发言人指出,日本政府计划对十余种半导体相关产品实施出口管制,并将部分中国企业列入“最终用户清单”。此举被认为是泛化国家安全概念,滥用出口管制措施,对中国半导体产业进行打压,影响产业链供应链稳定,干扰正常商业往来,并损害两国企业利益。目前,日本政府正在公开征求意见。中国方面呼吁日方重视业界声音,维护国际经贸规则和中日经贸合作大局,避免相关措施损害两国经贸关系,并强调中方保留采取相应措施的权利,以坚决维护自身合法权
- 科技周边 · 人工智能 | 7个月前 | 出口管制 494浏览 收藏
-
- 欧盟委员会:2024年全球研发投入Alphabet、Meta和苹果列前三,中企占比近三成
- 欧盟2024年工业研发投资记分牌新鲜出炉!榜单显示,全球研发投入最高的2000家企业总投入高达12570亿欧元,占据全球商业研发85%以上份额。其中,Alphabet公司以398亿欧元的研发投入拔得头筹,Meta和苹果紧随其后。值得关注的是,华为以190亿欧元的研发投入位列第六,成为榜单中排名最高的中国企业。前50名企业贡献了总研发投入的40%。国家分布方面,美国企业占据681席,中国企业(包括中国台湾地区55家公司)以579席位列第二,欧盟、日本分别位列第三、第四。英国、韩国和瑞士也分别有63家、40
- 科技周边 · 人工智能 | 7个月前 | Alphabet 欧盟委员会 研发投入 494浏览 收藏
-
- 成功率达100%,上交团队提出AI辅助的酶热稳定性工程策略,设计热稳定性的组合突变体
- 利用AI高效提升酶热稳定性:上海交大研究团队取得突破酶的热稳定性对于生物技术和工业应用至关重要。传统方法通过逐步引入单点突变来优化酶的热稳定性,过程费时且效率低下。近日,上海交通大学杨广宇研究员团队与洪亮教授合作,在《mLife》杂志发表研究成果,提出了一种基于人工智能的策略,显著提高了酶热稳定性工程的效率。该研究利用蛋白质语言模型Pro-PRIME,结合少量实验数据进行微调,预测组合突变体的稳定性和活性。通过对肌酸酶进行两轮设计,成功获得了50个具有卓越热稳定性的组合突变体,设计成功率达到惊人的1
- 科技周边 · 人工智能 | 7个月前 | 入门 494浏览 收藏
-
- 余承东:明日尊界发布会,稳住,觉醒!
- 余承东预告尊界S800发布会:明日两点三十分直播,技术革新引爆期待!尊界S800华为常务董事余承东在其个人微博发布视频,预告将于明日(2月20日)下午两点三十分在其个人账号进行尊界S800技术发布会直播。视频中,余承东用“稳”和“觉醒”两个词概括了此次发布会的核心,并暗示将带来令人震撼的技术突破。余承东视频预热据悉,此次发布会将重点展示尊界S800在智能驾驶、底盘等方面的创新技术。此前官方信息显示,尊界S800拥有超级巡航、超强机动性、超级信息感知、超级隐私保护、天地网联、AI辅助驾驶、主动
- 科技周边 · 人工智能 | 6个月前 | 494浏览 收藏
-
- 企业级AI证件照批量生成利器
- AI技术可用于企业级证件照批量生成。1)AI通过人脸检测和背景替换实现照片标准化。2)使用深度学习模型处理不同光照条件。3)多线程技术提高批量处理效率。
- 科技周边 · 人工智能 | 3个月前 | 494浏览 收藏
-
- 苹果副总裁预言:AI将取代iPhone
- 苹果高层罕见地向外界透露,iPhone的终结可能比人们预期的更快到来。苹果资深副总裁EddyCue在周三(7日)美国司法部针对Google的反垄断诉讼中作证时表示,随着人工智能技术的快速发展,十年后人们「可能不再需要iPhone」。这是苹果首次公开对自家核心产品未来的重大暗示。Cue指出:「这听起来可能很不可思议,但十年后你可能就不需要iPhone了。真正的竞争来自于技术的转变。AI就是这样一个技术转折点,它正在为新进入者创造前所未有的机会。」此番言论不仅揭示了苹果已经意识到AI对搜索和用户界面的颠覆性
- 科技周边 · 人工智能 | 3个月前 | AI iPhone EddyCue 十年 颠覆性影响 494浏览 收藏
查看更多
课程推荐
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 514次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 499次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- Golang深入理解GPM模型
- Golang深入理解GPM调度器模型及全场景分析,希望您看完这套视频有所收获;包括调度器的由来和分析、GMP模型简介、以及11个场景总结。
- 474次学习
查看更多
AI推荐
-
- AI Mermaid流程图
- SEO AI Mermaid 流程图工具:基于 Mermaid 语法,AI 辅助,自然语言生成流程图,提升可视化创作效率,适用于开发者、产品经理、教育工作者。
- 237次使用
-
- 搜获客【笔记生成器】
- 搜获客笔记生成器,国内首个聚焦小红书医美垂类的AI文案工具。1500万爆款文案库,行业专属算法,助您高效创作合规、引流的医美笔记,提升运营效率,引爆小红书流量!
- 207次使用
-
- iTerms
- iTerms是一款专业的一站式法律AI工作台,提供AI合同审查、AI合同起草及AI法律问答服务。通过智能问答、深度思考与联网检索,助您高效检索法律法规与司法判例,告别传统模板,实现合同一键起草与在线编辑,大幅提升法律事务处理效率。
- 242次使用
-
- TokenPony
- TokenPony是讯盟科技旗下的AI大模型聚合API平台。通过统一接口接入DeepSeek、Kimi、Qwen等主流模型,支持1024K超长上下文,实现零配置、免部署、极速响应与高性价比的AI应用开发,助力专业用户轻松构建智能服务。
- 201次使用
-
- 迅捷AIPPT
- 迅捷AIPPT是一款高效AI智能PPT生成软件,一键智能生成精美演示文稿。内置海量专业模板、多样风格,支持自定义大纲,助您轻松制作高质量PPT,大幅节省时间。
- 229次使用