-
【从Qwen2,Apple Intelligence Foundation,Gemma 2,Llama 3.1看大模型的性能提升之路】
从早期的 GPT 模型到如今复杂的开放式 LLM,大型语言模型 (LLM 的发展已经取得了长足的进步。最初,LLM 训练过程仅侧重于预训练,但后来扩展到包括预训练和后训练。后训练通常包括监督指令微调和校准,这是由 ChatGPT 推广的。 自 Chat...
-
AI搜索是否能引领信息检索的创新与变革
引言 2024年,人工智能(AI)时代正以前所未有的速度发展。例如,OpenAI推出的Sora模型能够根据文本描述生成视频,震惊了业界;卡内基梅隆大学研究人员发布的基准测试大大提升了大模型在Web上的性能。这些技术创新和突破展示了AI在...
-
WhisperS2T:加速语音转文本的高效解决方案
WhisperS2T:加速语音转文本的高效解决方案 WhisperS2TAn Optimized Speech-to-Text Pipeline for the Whisper Model Supporting Multiple Inference E...
-
非Transformer时代到来!全新无注意力模式超越Llama传奇
来源 | 机器之心 ID | almosthuman2014 Mamba 架构模型这次终于要「站」起来了?自 2023 年 12 月首次推出以来,Mamba 便成为了 Transformer 的强有力竞争对手。 此后,采用 Mamba 架构的模型...
-
【三维重建】Pixel-GS:三维高斯泼溅的像素感知的梯度密度控制(去除浮点,提升精度)
项目:https://pixelgs.github.io/标题:Pixel-GS: Density Control with Pixel-aware Gradient for 3D Gaussian Splatting来源:香港大学;腾讯AI Lab...
-
MSRA古纾旸:2024年,视觉生成领域最重要的问题有哪些?
文章链接: https://arxiv.org/pdf/2407.18290 亮点直击 概述了视觉生成领域中的各种问题。 这些问题的核心在于如何分解视觉信号,其他所有问题都与这一核心问题密切相关,并源于不适当的信号分解方法。 本文旨...
-
探索音乐的智慧:MU-LLaMA 模型引领文本到音乐生成新纪元
探索音乐的智慧:MU-LLaMA 模型引领文本到音乐生成新纪元 MU-LLaMAMU-LLaMA: Music Understanding Large Language Model项目地址:https://gitcode.com/gh_mirrors/...
-
即刻体验 Llama3.1就在Amazon Bedrock!
引言 在人工智能的浪潮中,大型语言模型(LLMs)不断推动着技术边界的扩展。Meta 最新推出的 Llama 3.1 模型系列,以其卓越的性能和广泛的应用前景,引起了业界的广泛关注。现在,激动人心的消息来了——Llama3.1 已经在 Amazon Be...
-
AI设计自己,代码造物主已来!UBC华人一作首提ADAS,数学能力暴涨25.9%
【新智元导读】AI掌握自我设计的权力,将会怎样?最近,来自UBC等机构研究人员提出了「智能体自动化设计」系统,让元智能体使用搜索算法,自动构建强大的同类。 AI训AI已经老生常谈了,那么,AI能够设计出更强的AI吗? 这不,来自UBC等机构的研究人员提出了...
-
AI爆料人遭全网封禁!OpenAI等25个机构祭大招,一眼辨别AI机器人
【新智元导读】AI智能体遍布整个网络,未来如何防止被骗?如何保护隐私?OpenAI微软MIT等25个机构联手提出「人格凭证」,可以证明自己是真人,还不用披露任何个人信息。 最近半个月,全网竟被一个OpenAI的「AI爆料人」愚弄了。 听到「草莓哥」@iru...
-
和AI「赛博爱情」的时代已经到来
【新智元导读】AI赛博恋人正变得越来越受欢迎,Replika CEO甚至鼓励人们与AI结婚。然而,这是否是一种饮鸩止渴?通过梳理近20篇国外论文,我们还原了学术界对「人机之恋」的研究面貌。 人和机器之间真的能够产生「爱情」吗? 计算机运算先驱、人机之恋旗手...
-
Flux:Stable Diffusion 创始人团队再创开源 AI 巅峰之作
前言 TLDR 还记得 Stable Diffusion 吗?这款开源文本到图像生成模型,现在其部分创始成员成立了新公司 Black Forest Labs,并带来了全新的力作——Flux,一个拥有 120 亿参数的文本到图像模型,也是目前最大...
-
ChatGPT后,人工智能的终极里程碑却倒了
大模型的拟人行为,在让我们产生恐怖谷效应。 「图灵测试是一个糟糕的测试标准,因为对话能力和推理完全是两码事。」最近几天,AI 圈里一个新的观点正在流行。 如今已是生成式 AI 时代,我们评价智能的标准该变了。 「机器能思考吗?」这是艾伦・图灵在他1950...
-
橙篇APP下载地址 AI超长文章写作热点解读使用方法教程
探索橙篇能为你带来哪些改变 为什么选择橙篇? 橙篇不仅仅是一款产品——它是一项革命性的技术,致力于提供全面的生活、学习、工作辅助。橙篇旨在为用户提供智能全网搜索、AI今日热点、多图一键成片、超长文章写作、文件理解总结等强大功能,以提升工作和学习的效率。...
-
盘点目前有关数字人的开源项目
近年来,数字人技术的迅猛发展吸引了众多研究者和开发者的关注。开源社区也涌现出许多优秀的项目,为数字人技术的发展提供了强有力的支持。本文将对一些目前较为热门的数字人生成相关开源项目进行分类整理和总结,以供广大开发者和研究人员参考。 一、动画人像生成与动作...
-
清华唐杰团队新作:一口气生成2万字,大模型开卷长输出
一口气生成2万字,大模型输出也卷起来了! 清华&智谱AI最新研究,成功让GLM-4、Llama-3.1输出长度都暴增。 相同问题下,输出结果直接从1800字增加到7800字,翻4倍。 要知道,目前大模型的生成长度普遍在2k以下。这对于内容创作、问...
-
FLUX.1最强AI绘画开源新模型,本地部署教程!
原文链接:FLUX.1最强AI绘画开源新模型,本地部署教程! (chinaz.com Flux最近收到了很多模型爱好者的好评,出图质量超越SD3和MJ,许多人说Flux才是大家心目中的SD3,所以我也是非常好奇FLux的实力在这里把本地部署的过程分享给...
-
GPT-4o模仿人类声音,诡异尖叫引OpenAI研究员恐慌!32页技术报告出炉
【新智元导读】五颗草莓到底指什么?盼了一天一夜,OpenAI只发来一份32页安全报告。报告揭露:在少数情况下,GPT-4o会模仿你的声音说话,或者忽然大叫起来……事情变得有趣了。 昨天奥特曼率众人搞了一波「草莓暗示」的大阵仗,全网都在翘首以盼OpenAI的...
-
llama模型,nano
目录 llama模型 Llama模型性能评测 nano模型是什么 Gemini Nano模型 参数量 MMLU、GPQA、HumanEval 1. MMLU(Massive Multi-task Language Understanding)...
-
AI模型提早5年预警乳腺癌,MIT研究登Science获LeCun转发
【新智元导读】科学家正在通过AI的力量,改变乳腺癌的现状。 在全球范围内,每年有超过60万名女性因乳腺癌而无法存活。 美国有八分之一的女性一生中会被诊断出患有乳腺癌。 这些数字听起来很可怕,但并非毫无希望。 当处于最早的局部阶段时,5年相对生存率为99%...
-
OpenAI高层巨变:联创辞职总裁休假,网友:领导层成了空壳
刚刚,OpenAI高层大地震: 联创John Schulman辞职跑路,联创&总裁Greg Brockman长期休假,产品副总裁Peter Deng也被曝离职。 John Schulman(约翰·舒曼),长年领导OpenAI强化学习团队,被誉为“C...
-
LLaMA模型量化方法优化:提高性能与减小模型大小
LLaMA模型量化方法优化:提高性能与减小模型大小 LLaMA模型量化方法优化:提高性能与减小模型大小 引言 新增量化方法 性能评估 7B模型 13B模型 结果分析 结论 LLaMA模型量化方法优化:提高性能与减小模型大小...
-
贾扬清:大模型尺寸正在重走CNN的老路;马斯克:在特斯拉也是这样
Transformer大模型尺寸变化,正在重走CNN的老路! 看到大家都被LLaMA3.1吸引了注意力,贾扬清发出如此感慨。 拿大模型尺寸的发展,和CNN的发展作对比,就能发现一个明显的趋势和现象: 在ImageNet时代,研究人员和技术从业者见证了参数规...
-
大模型行业,根本没有什么“真”开源?
最近一段时间开源大模型市场非常热闹,先是苹果开源了 70 亿参数小模型DCLM,然后是重量级的Meta的Llama 3.1 和Mistral Large2 相继开源,在多项基准测试中Llama 3. 1 超过了闭源SOTA模型。 不过开源派和闭源派之间的争...
-
从炒菜到缝针!斯坦福炒虾团队打造自主「AI达芬奇」,苦练神指当外科医生
【新智元导读】斯坦福炒虾机器人作者,又出新作了!通过模仿学习,达芬奇机器人学会了自己做「手术」——提起组织、拾取针头、缝合打结。最重要的是,以上动作全部都是它自主完成的。 斯坦福炒虾机器人作者,又出新作了。 这次,机器人不是给我们炒饭了,而是给我们做外科手...
-
阿里大模型元老杨红霞去向官宣:入职香港高校!被曝创业项目也在推进
最新消息,阿里大模型元老杨红霞入职香港理工大学,任电子计算机系教授。 杨红霞是AI领域知名科学家。她曾在IBM T.J.沃森研究中心担任研究人员,并在雅虎担任首席科学家。2016年加入阿里巴巴,就职于达摩院智能计算实验室;2023年3月入职字节跳动。 她在...
-
OpenAI发布最新大模型安全对齐奖励方法——RBR
随着ChatGPT等产品的广泛应用,确保其输出的安全性成为场景化落地的关键。传统方法是使用RLHF(人类反馈强化学习)来进行安全对齐,但有两大局限性难以持续使用。 1)收集和维护人类反馈数据不仅成本高昂,并且随着大模型能力的提高以及用户行为的变化,现有的数...
-
Llama-3.1-70B有哪些功能?Meta AI最新模型怎么使用方法详细教程指南
Meta-Llama-3.1-70B 是什么? Meta-Llama-3.1-70B是Meta公司推出的大型语言模型,拥有 70 亿个参数,支持 8 种语言的文本生成。该模型采用优化的Transformer架构,并通过监督式微调和人类反馈强化学习进一步优化...
-
Llama-3.1-8B功能介绍及免费使用指南 Meta AI最新模型体验地址入口
Meta-Llama-3.1-8B简介 Meta-Llama-3.1-8B是一款多语言大型语言模型(LLMs),包含8B大小的版本,支持 8 种语言,专为多语言对话用例优化,并在行业基准测试中表现优异。它采用自回归语言模型,使用优化的Transformer...
-
DeepMind CEO:AI可以发现室温超导;Llama 3.1算对9.9>9.11 | AI头条
整理 | 王启隆 出品 | AI 科技大本营(ID:rgznai100) 一分钟速览新闻点! DeepMind CEO:AI 将增强科学,如设计新药、发现室温超导、破解数学猜想 传谷歌、Meta 竞购雷朋眼镜母公司...
-
【技术追踪】SDSeg:医学图像的 Stable Diffusion 分割(MICCAI-2024)
这医学图像分割领域啊,终究还是被 Stable Diffusion 闯进去了~ SDSeg:第一个基于 Stable Diffusion 的 latent 扩散医学图像分割模型,在五个不同医学影像模态的基准数据集上超越了现有的最先进方法~ 论...
-
AIGC 原理与代码实例讲解
AIGC 原理与代码实例讲解 1. 背景介绍 1.1 问题的由来 随着人工智能技术的快速发展,生成式AI成为了科技界的一大热点。在众多生成技术中,AIGC(Artificial Intelligence for Generation and Crea...
-
长上下文能力只是吹牛?最强GPT-4o正确率仅55.8%,开源模型不如瞎蒙
【新智元导读】当今的LLM已经号称能够支持百万级别的上下文长度,这对于模型的能力来说,意义重大。但近日的两项独立研究表明,它们可能只是在吹牛,LLM实际上并不能理解这么长的内容。 大数字一向吸引眼球。 千亿参数、万卡集群,——还有各大厂商一直在卷的超长上下...
-
谷歌AI「神算」NeuralGCM震撼Nature:30秒完成22天天气模拟,效率提升10万倍!
想象一下,如果有一种技术,能够准确预测未来几天甚至几十年的天气和气候,那将会怎样改变我们的生活?这听起来像是科幻小说里的情节,但现在,一项名为NeuralGCM的新技术,正将这一梦想变为现实。 NeuralGCM是一种新型的神经通用循环模型,它结合了传统天...
-
视频大语言模型调研论文《Video-LLaMA: An Instruction-tuned Audio-Visual Language Model for Video Understanding》解读
本文是关于论文《Video-LLaMA: An Instruction-tuned Audio-Visual Language Model for Video Understanding》的简要介绍。Video-LLaMA是阿里达摩院的一个多模态大语言模型...
-
AI日报:微软推设计神器Microsoft Designer;苹果开源小模型 DCLM-Baseline-7B;小爱宣布新增AI文档问答等功能
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、微软推设计神器Microsof...
-
OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源
【新智元导读】小模型时代来了?OpenAI带着GPT-4o mini首次入局小模型战场,Mistral AI、HuggingFace本周接连发布了小模型。如今,苹果也发布了70亿参数小模型DCLM,性能碾压Mistral-7B。 小模型的战场,打起来了!...
-
Stable Diffusion原理与代码实例讲解
Stable Diffusion原理与代码实例讲解 1. 背景介绍 1.1 问题的由来 在图像处理和生成领域,扩散模型(Diffusion Models)作为一种新型的生成模型,逐渐成为了研究热点。这类模型通过模拟真实世界的物理扩散过程,为生成高质量...
-
AIGC降重指南:如何有效使用AI工具降低论文查重率
论文查重和降重是确保学术成果原创性及学术诚信的关键步骤,直接影响我们的学业成果和毕业资格。传统的论文查重方法主要包括使用查重软件和个人自查,而论文降重通常涉及改写、使用同义词替换、内容的扩展和深化,以及正确的引用和注释等方式来增强原创性。 然而,这些传统...
-
OpenAI发布PVG:用小模型验证大模型输出,解决“黑盒”难题
7月18日凌晨,OpenAI在官网发布了最新技术研究——Prover-Verifier-Games。 随着ChatGPT在法律、金融、营销等领域的广泛使用,确保模型的安全、准确输出同时被很好理解变得非常重要。但由于神经网络的复杂和多变性,我们根本无法验证其...
-
微软发现“万能钥匙”,成功入侵GPT-4o、Claude 3
微软Azure首席技术官Mark Russinovich在官网分享了新型大模型入侵技术——“Skeleton Key”(万能钥匙)。 据悉,万能钥匙是一种越狱攻击方法,其核心原理是使用多轮强制、诱导策略使大模型的安全护栏完全失效,让其回答一些禁止的答案,包...
-
6700万参数比肩万亿巨兽GPT-4!微软MIT等联手破解Transformer推理密码
「因果推理」绝对是当前GenAI热潮下的小众领域,但是它有一个大佬级的坚定支持者——Yann LeCun。 他在推特上的日常操作之一,就是炮轰Sora等生成模型,并为自己坚信的因果推理领域摇旗呐喊。 甚至,早在2019年VentureBeat的采访中,他...
-
OpenAI秘密武器「草莓」计划曝光!Q*推理能力大爆发,逼近AGI L2里程碑
【新智元导读】OpenAI被曝出了新项目「草莓」,据悉能提前计划,自主浏览网页,还能进行深度研究。草莓由大量通用数据上后训练而成,推理能力显著提高。根据OpenAI最近的AGI路线图,草莓疑似已达Level2。 昨天刚刚被曝出AGI五级路线图,今天Open...
-
OpenAI首次提出AGI的5个等级,我们接近第2级
彭博消息,OpenAI在最近一次内部会议上,向员工们分享了关于AGI(通用人工智能)的5个等级划分,并表示我们目前处于第1等级,非常接近第2级。 在这次会议上一位OpenAI的领导,展示了最新研究,可以明显提升推理能力达到甚至超越人类的水平。 而根据7月1...
-
突破AI性能瓶颈 揭秘LLaMA-MoE模型的高效分配策略
获取本文论文原文PDF,请在公众号【AI论文解读】留言:论文解读 本文介绍了一种名为“LLaMA-MoE”的方法,通过将现有的大型语言模型(LLMs)转化为混合专家网络(MoE),从而解决了训练MoE时遇到的数据饥饿和不稳定性问题。该方法基于著名的LLa...
-
Llama 3 与 GPT-4:哪个更好?
Llama 3 和 GPT-4 是目前公开可用的两种最先进的大型语言模型(LLM)。让我们通过比较这两个模型的多模态性、上下文长度、性能和成本,来看看哪个 LLM 更好。 什么是 GPT-4? GPT-4 是 OpenAI 开发的最新大型语言模型(...
-
WhisperLive:实时语音转文本的革命性工具
WhisperLive:实时语音转文本的革命性工具 WhisperLive是一个基于OpenAI Whisper模型的实时语音转文本应用。它不仅能够处理来自麦克风的实时音频输入,还支持预先录制的音频文件进行转录。通过高效的技术手段,WhisperLi...
-
AI日报:Claude推Artifacts分享、重新混合功能;Magnific发布PS插件;Ollama0.2版本发布
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、独立开发者狂喜!Claude推...
-
免费的降以及查询aigc的工具来了
论文查重和降重是确保学术成果原创性及学术诚信的关键步骤,直接影响我们的学业成果和毕业资格。传统的论文查重方法主要包括使用查重软件和个人自查,而论文降重通常涉及改写、使用同义词替换、内容的扩展和深化,以及正确的引用和注释等方式来增强原创性。 然而,这些传统...
-
大模型AIGC转行记录(一)
自从22年11月chat gpt上线以来,这一轮的技术浪潮便变得不可收拾。我记得那年9月份先是在技术圈内讨论,然后迅速地,全社会在讨论,各个科技巨头、金融机构、政府部门快速跟进。 软件开发行业过去与现状 我19年决定转码的时候,互联网的情况可比现在好...