-
- 华科北邮PR1强化学习,提升LLM多模态视觉感知
- 华中科技大学、北京邮电大学等多所高校的研究团队最近合作推出了Perception-R1(PR1)多模态大语言模型,这一模型在COCO2017验证集上首次突破了30AP,成为首个在纯多模态开源LLM中超越YOLOv3和Faster-RCNN等传统视觉模型的表现。Perception-R1专注于当前主流的纯视觉任务(如计数、通用目标检测)和视觉语言任务(如grounding、OCR),通过研究基于规则的强化学习(rule-basedRL)来提升模型的感知能力。目前,该项目的论文和代码已完全开源,研究团队希望
- 科技周边 · 人工智能 | 3个月前 | 强化学习 视觉感知 多模态大语言模型 Perception-R1 COCO2017 409浏览 收藏
-
- AI证件照如何避免太假的秘诀
- 要让AI生成的证件照看起来不那么假,需要在生成和后期处理上多下功夫:1.选择高质量的AI模型,如StyleGAN和DALL-E2;2.调整生成参数,如锐度和饱和度,并加入随机噪声;3.后期处理时使用图像编辑软件调整亮度和对比度,并加入轻微模糊效果;4.背景处理时添加真实背景元素;5.手动修复面部特征的细微缺陷。通过这些方法,可以让AI生成的图像更加接近真实,减少“假”的感觉。
- 科技周边 · 人工智能 | 3个月前 | 409浏览 收藏
-
- 夏普大幅缩减液晶业务,龟山二厂卖给富士康
- 日本电子公司夏普已决定将位于日本西部三重县龟山市的液晶显示器工厂(龟山第二工厂)出售给其母公司富士康。该工厂生产的液晶电视曾被誉为“龟山模式”,对提升夏普的全球品牌形象起到了关键作用。由于中国制造商的增产导致面板价格下跌,盈利能力降低,夏普决定出售该工厂,以缩小其液晶面板业务规模并改善财务状况。龟山工厂目前主要生产用于智能手机、平板电脑和PC等的中小尺寸液晶面板,由两座厂房(龟山第一工厂和龟山第二工厂)组成,此次计划卖给富士康的对象是龟山第二工厂。与龟山第一工厂相比,龟山第二工厂的稼动率(产能利用率)较低
- 科技周边 · 人工智能 | 3个月前 | 富士康 夏普 液晶面板 龟山第二工厂 稼动率 409浏览 收藏
-
- 通灵义码轻松上手,5个实用技巧分享
- 通灵义码入门并不难,具体步骤如下:1.了解每组数字和字母的基本含义;2.每天练习解读简单的通灵义码组合;3.保持开放的心态,与自己内心对话。
- 科技周边 · 人工智能 | 2个月前 | 409浏览 收藏
-
- AI证件照翻车?避坑指南来救你了!
- 要让AI生成的证件照看起来不那么假,需要在生成和后期处理上多下功夫:1.选择高质量的AI模型,如StyleGAN和DALL-E2;2.调整生成参数,如锐度和饱和度,并加入随机噪声;3.后期处理时使用图像编辑软件调整亮度和对比度,并加入轻微模糊效果;4.背景处理时添加真实背景元素;5.手动修复面部特征的细微缺陷。通过这些方法,可以让AI生成的图像更加接近真实,减少“假”的感觉。
- 科技周边 · 人工智能 | 2个月前 | 409浏览 收藏
-
- 即梦AI怎么导出高清视频?超详细视频导出设置教程
- 即梦AI支持导出高清视频,支持的格式包括MP4、MOV和AVI。1.进入编辑界面,选择视频并点击“导出”。2.选择分辨率(如1080p或4K)和格式。3.点击“开始导出”即可。若遇到导出时间长或质量差,可调整分辨率或选择高比特率和合适编码器。
- 科技周边 · 人工智能 | 2个月前 | 409浏览 收藏
-
- AI批量写短视频脚本,手把手教你用ChatGPT/Kimi实操!
- 理论上AI一天能写100条短视频脚本,但关键在prompt工程及后续筛选润色。AI提供创意框架,细节仍需人工打磨。具体方法包括:1.根据需求选择AI模型,ChatGPT适合创意发散,豆包更懂中文语境,Kimi擅长长文本处理;2.编写高效prompt,明确目标、提供参考、限定格式、加入限制条件并迭代优化;3.批量生成时先创建主题列表,使用循环指令或工具批量生成脚本;4.生成后进行人工筛选润色,并细化分镜、准备素材、高效剪辑、添加特效字幕及优化发布。最终效果仍取决于创意与执行力。
- 科技周边 · 人工智能 | 2个月前 | AI 短视频脚本 Prompt工程 批量生成 后期制作 409浏览 收藏
-
- 豆包AI怎么切换风格?手把手教你设置口语&专业模式
- 要调整豆包AI的回复风格,可通过直接指令、角色扮演、示例引导、Prompt工程和反馈循环等方法实现。1.直接指令即明确告诉AI使用口语化或专业语言;2.角色扮演是设定AI身份以保持特定风格;3.示例引导通过提供参考样例让AI模仿;4.Prompt工程是设计提示词引导生成理想回答;5.反馈循环通过不断纠正优化输出效果。若需更口语化,可用非正式语言、语气词、反问句等方式模拟真实对话;若需更专业化,则用术语、权威引用、清晰逻辑和客观表述提升严谨性。调整时需明确需求、多尝试方法、不期望一步到位,并注意上下文协调。
- 科技周边 · 人工智能 | 2个月前 | 409浏览 收藏
-
- ElserAI漫画免费版与付费版对比解析
- 免费版适合偶尔创作或试用,付费版适合高频及专业需求。免费版提供基础功能,如简单文本生成漫画、低分辨率输出、每日次数限制及无高级编辑工具,适合新手或轻度用户;付费版则提升至高分辨率输出、无生成限制、更多风格模板、图层管理、无水印导出等功能,适合连载创作或商业用途。选择时应根据使用频率和项目需求决定,可先试用免费版再升级。
- 科技周边 · 人工智能 | 1个月前 | 版本区别 AI漫画 409浏览 收藏
-
- 即梦AI添加时间戳教程详解
- 在即梦AI中添加时间戳和设置日期水印的方法如下:1.打开编辑界面,点击“添加元素”,选择“时间戳”或“日期水印”。2.调整位置、格式、大小和颜色,保存设置。
- 科技周边 · 人工智能 | 1个月前 | 409浏览 收藏
-
- ChatGPT打造数字博物馆,文化展陈新体验
- ChatGPT虽不能直接创建交互式博物馆,但可在数字展陈构建中发挥辅助作用。1.ChatGPT可生成展品解说词、翻译多语种内容、设计互动问答、辅助策展思路整理;2.其输出可集成进语音导览、聊天机器人、AR/VR讲解及动态内容更新系统以实现交互体验;3.实际应用中需注意内容准确性、文化敏感性、版权问题及用户体验设计,需专业人士审核与配合团队协作完成。合理利用ChatGPT可提升效率并增强展览的互动性与吸引力。
- 科技周边 · 人工智能 | 1个月前 | 409浏览 收藏
-
- MemoAI官方版下载教程
- 要下载和使用MemoAI官方版,需先通过官网申请试用、关注官方微信/社群获取邀请码或通过合作平台获取体验链接;随后打开邀请链接注册账号,选择网页端使用或下载安装客户端并完成基础设置;使用前需注意支持的文件格式、语言识别范围、导出格式及文件大小限制等事项。
- 科技周边 · 人工智能 | 1个月前 | 409浏览 收藏
-
- AIOverviews怎么开启?全平台设置教程
- 要开启AIOverviews,具体操作步骤因平台而异。1.在Google搜索中,可尝试加入测试计划、更改搜索设置、使用特定地区账号、更新浏览器并保持登录状态;2.在MicrosoftEdge中,进入设置开启Copilot或相关AI功能,并利用“集锦”整理信息;3.在移动端如GoogleApp中,更新应用后查找摘要按钮或在设置中启用实验性功能,第三方浏览器则直接开启AI浏览模式即可。
- 科技周边 · 人工智能 | 1个月前 | 409浏览 收藏
-
- ChatGPT语音输入怎么设置
- ChatGPT可通过不同设备实现语音输入,但无原生语音输出功能。一、iOS设备点击键盘麦克风按钮使用听写功能实现语音转文字;二、安卓用户点击输入框麦克风图标或长按空格键启动语音输入;三、网页版需使用Chrome浏览器并点击麦克风图标或系统快捷键启用语音识别;四、ChatGPT暂不支持语音输出,可借助第三方TTS工具实现声音播放。整体操作依赖系统或浏览器服务,需注意网络连接、口音环境及隐私问题。
- 科技周边 · 人工智能 | 1个月前 | 409浏览 收藏
查看更多
课程推荐
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 511次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 498次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- Golang深入理解GPM模型
- Golang深入理解GPM调度器模型及全场景分析,希望您看完这套视频有所收获;包括调度器的由来和分析、GMP模型简介、以及11个场景总结。
- 474次学习
查看更多
AI推荐
-
- 千音漫语
- 千音漫语,北京熠声科技倾力打造的智能声音创作助手,提供AI配音、音视频翻译、语音识别、声音克隆等强大功能,助力有声书制作、视频创作、教育培训等领域,官网:https://qianyin123.com
- 225次使用
-
- MiniWork
- MiniWork是一款智能高效的AI工具平台,专为提升工作与学习效率而设计。整合文本处理、图像生成、营销策划及运营管理等多元AI工具,提供精准智能解决方案,让复杂工作简单高效。
- 222次使用
-
- NoCode
- NoCode (nocode.cn)是领先的无代码开发平台,通过拖放、AI对话等简单操作,助您快速创建各类应用、网站与管理系统。无需编程知识,轻松实现个人生活、商业经营、企业管理多场景需求,大幅降低开发门槛,高效低成本。
- 220次使用
-
- 达医智影
- 达医智影,阿里巴巴达摩院医疗AI创新力作。全球率先利用平扫CT实现“一扫多筛”,仅一次CT扫描即可高效识别多种癌症、急症及慢病,为疾病早期发现提供智能、精准的AI影像早筛解决方案。
- 225次使用
-
- 智慧芽Eureka
- 智慧芽Eureka,专为技术创新打造的AI Agent平台。深度理解专利、研发、生物医药、材料、科创等复杂场景,通过专家级AI Agent精准执行任务,智能化工作流解放70%生产力,让您专注核心创新。
- 245次使用