-
GPT-4化身黑客搞破坏,成功率87%!OpenAI要求保密提示词,网友复现ing
91行代码、1056个token,GPT-4化身黑客搞破坏! 测试成功率达87%,单次成本仅8.8美元(折合人民币约63元)。 这就是来自伊利诺伊大学香槟分校研究团队的最新研究。他们设计了一个黑客智能体框架,研究了包括GPT-4、GPT-3.5和众多开源模...
-
开源模型打败GPT-4!LLM竞技场最新战报,Cohere Command R+上线
GPT-4又又又被超越了! 近日,LLM竞技场更新了战报,人们震惊地发现:居然有一个开源模型干掉了GPT-4! 这就是Cohere在一周多前才发布的Command R+。 排行榜地址:https://huggingface.co/spaces/lmsys...
-
AI日报:最强大模型Llama 3发布;Midjourney推社交新功能Room;超强AI视频自动剪辑工具Captions;手机上可以玩大模型了
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、最强大模型Llama3 正式发...
-
大模型开源还是闭源好,周鸿祎与李彦宏针尖对麦芒
开源大模型还是闭源大模型,究竟谁才是“版本答案”?围绕这个问题,360创始人周鸿祎和百度创始人李彦宏最近就来了一次隔空论战。 先是在4月12日,有媒体曝光了李彦宏在百度内部的讲话。其中就有他认为闭源大模型在能力上会持续领先、而不是一时领先,并且开源大模型的...
-
全球首个「开源GPT-4」出世!Llama 3震撼发布,Meta AI免登录可用
LLM界的「真·Open AI」,又来整顿AI圈了! 业内惊呼:首个开源GPT-4级的模型,终于来了!开源模型追上闭源模型的历史性一刻,或许就在眼前了? 一石激起千层浪,Llama3才刚刚发布没几小时,就破纪录地登顶了Hugging Face排行榜。 这...
-
Meta 发布Llama 3,能力直逼GPT-4,一己之力拉高开源大模型水位
编辑|伊风、诺亚 出品 | 51CTO技术栈(微信号:blog51cto) Meta麾下“羊驼”一路狂奔在开源的大道上。 在过去的一年里,Llama系列可以说开辟了开源LLM的半壁江山。 嫌弃开源模型能力只有GPT-3.5,不够用? 如今Llam...
-
李彦宏内部讲话谈大模型:闭源才有真正的商业模式
4月11日,一则关于大模型的李彦宏内部讲话流出。在讲话中李彦宏对大模型的开源闭源路线之争给出了自己的解答。 他说,市场上已经有足够多的开源大模型,“不缺我们这一家开源的模型。我们要开源还得自己去维护一套开源的版本,这是不划算的。” 他还表示,闭源模型...
-
开源模型首胜GPT-4!竞技场最新战报引热议,Karpathy:这是我唯二信任的榜单
能打得过GPT-4的开源模型出现了! 大模型竞技场最新战报: 1040亿参数开源模型Command R+攀升至第6位,与GPT-4-0314打成平手,超过了GPT-4-0613。 图片 这也是第一个在大模型竞技场上击败GPT-4的开放权重模型。 大模型竞...
-
谷歌向微软英特尔全面宣战!首款自研Arm CPU,最强大模型公测,AI视频对垒Sora
昨天的谷歌Next大会可是太精彩了,谷歌一连放出不少炸弹。 - 升级「视频版」Imagen 2.0,下场AI视频模型大混战 - 发布时被Sora光环掩盖的Gemini 1.5 Pro,正式开放 - 首款Arm架构CPU发布,全面对垒微软/亚马逊/英伟达/...
-
大概是最全的开源大模型LLM盘点了吧!
LLM(Large Language Model, 大型语言模型 是指那些规模庞大、参数数量众多的深度神经网络模型,用于理解和生成自然语言文本。在自然语言处理(NLP)领域有着广泛的应用,因其强大的语言理解和生成能力,能够处理各种复杂的文本任务,包括但不...
-
120亿Stable LM 2上线即开源!2万亿token训练,碾压Llama 2 70B
继16亿轻量级Stable LM 2推出之后,12B参数的版本在今天亮相了。 见状,不少网友纷纷喊话:干的漂亮!但,Stable Diffusion 3啥时候出啊? 总得来说,Stable LM 2 12B参数更多,性能更强。 120亿参数版本包含了...
-
玩转大模型!用Replicate一键部署
Replicate是一个云端的机器学习模型运行平台。它可以让用户使用云端API 直接运行机器学习模型,而无需了解复杂的机器学习模型内部构造。 Replicate允许用户在Python或Jupyter Notebook中运行模型,并在云端进行模型的部...
-
Fireworks.ai开源API使任何开发者都能使用生成式AI
随着人们对生成式 AI 的热情不断高涨,越来越多的公司试图涉足这一领域。Fireworks.ai 就是其中之一。虽然公司名气不及 OpenAI、Anthropic 和 Cohere 等大牌厂商,但据该公司称,它拥有超过12,000名用户的最大开源模型 AP...
-
中科大等意外发现:大模型不看图也能正确回答视觉问题!
想了解更多AIGC的内容, 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 大模型不看图,竟也能正确回答视觉问题?! 中科大、香港中文大学、上海AI Lab的研究团队团队意外发现了这一离奇现象。 他们首先看到像...
-
论文笔记:Llama 2: Open Foundation and Fine-Tuned Chat Models
导语 Llama 2 是之前广受欢迎的开源大型语言模型 LLaMA 的新版本,该模型已公开发布,可用于研究和商业用途。本文记录了阅读该论文的一些关键笔记。 链接:https://arxiv.org/abs/2307.09288 1 引言 大型语言...
-
首个开源世界模型LWM :百万级上下文,长视频理解超GPT-4
来自加州大学伯克利分校的研究人员最近发布并开源了首个世界模型,被称为 LWM(LargeWorldModel)系列模型。这一模型采用了大量视频和书籍数据集,通过 RingAttention 技术实现了长序列的可扩展训练,使得模型的上下文长度达到了1M to...
-
华人开源最强「AI 程序员」炸场,让 GPT-4 自己修 Bug!
自从“AI 程序员”Devin问世之后,近期的一大趋势就是程序员们争先恐后地要让自己失业,试图抢先造出比自己更强大的程序员。 普林斯顿大学为软件工程界迎来了一位新星——SWE-agent,论文将在4月10日正式发布,目前项目已在 GitHub 上开源。...
-
多忽悠几次AI全招了!Anthropic警告:长上下文成越狱突破口,GPT羊驼Claude无一幸免
大模型厂商在上下文长度上卷的不可开交之际,一项最新研究泼来了一盆冷水—— Claude背后厂商Anthropic发现,随着窗口长度的不断增加,大模型的“越狱”现象开始死灰复燃。 无论是闭源的GPT-4和Claude2,还是开源的Llama2和Mistral...
-
性能强,成本低,运行快!最强开源大模型出现,超越ChatGPT和Llama!
大数据人工智能公司 Databricks放大招了! 3月27日,该公司开源了通用大模型 DBRX,并声称该模型是迄今为止全球最强大的开源大型语言模型,比 Meta 的 Llama 2 更为强大。 GPT-3.5研究测试: https://huj...
-
马斯克开源 Grok:参数量近 Llama 四倍,成全球最大开源模型
本周一,马斯克在他的社交媒体平台 X 上宣布 xAI 开源 Grok,这也兑现了他上周的开源承诺。截至目前,Grok 已经在 GitHub 上获得了 4.3k 颗 Star。 开源地址:https://github.com/xai-org/grok-1...
-
我的领导马斯克:痛恨开会,不要非技术中层,推崇裁员
马斯克称得上是个“魔鬼老板”这事儿,已经出了名了。 现在,他的老部下卡帕西(Andrej Karpathy)又在最新访谈中“锤”了他一把(doge): 我不得不恳求他允许我招人。 他(马斯克)总是默认要裁掉员工。 喜欢裁人之外,在这场红杉组织的AI A...
-
【AIGC调研系列】Grok大模型与其他模型相比的优势和劣势
Grok大模型与其他模型相比,具有以下优势和劣势: 优势: 实时了解世界的能力:Grok能够通过X平台实时了解世界,这是其独特而根本的优势之一[2][6][17]。这意味着Grok能够在回答问题时提供最新的信息和数据。 处理尖锐问题的能力:Gro...
-
开源AI到底是什么?业界:超出开源软件范畴,需要重新界定
最近AI圈突然流行起开源概念。Meta承诺将会打造开源AI,马斯克起诉OpenAI,说它缺少开源模型。与此同时,一批科技领袖和科技企业纷纷为开源概念呐喊。不过科技界碰到一个难以解决的根本问题:它们对“开源AI”的概念无法达成共识。 照字面意思,开源A...
-
首个基于SSM-Transformer混合架构,开源商业大模型Jamba
3月29日,知名AI研究实验室AI21在官网开源了,首个基于SSM-Transformer混合架构的商业大模型——Jamba。 目前,ChatGPT、Stable Difusion 、Lyria等产品使用的皆是Transformer架构,虽然在捕捉序列内长...
-
开源大模型DBRX:1320亿参数,比Llama2-70B快1倍
大数据公司Databricks最近发布了一款名为DBRX的MoE大模型,引发了开源社区的热议。DBRX在基准测试中击败了Grok-1、Mixtral等开源模型,成为了新的开源之王。这款模型的总参数量达到了1320亿,但每次激活只有360亿参数,并且其生成速...
-
铁了心要打败OpenAI!坚信开源打败闭源!这家知名数据厂商4个月打造最强开源大模型!性能超越Claude3,速度是羊驼2倍
撰稿 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) 大模型领域,迭代的速度简直要以天计算。昨天,大家还在热议Claude3超大杯版Opus在Elo Rating榜单上取代GPT4-Turbo-1106成为了新王。今天大家又发现开源...
-
新开源之王来了!1320亿参数,逻辑数理全面打赢Grok,还比Llama2-70B快1倍
“最强”开源大模型之争,又有新王入局: 大数据巨头Databricks,刚刚发布MoE大模型DBRX,并宣称: 它在基准测试中击败了此前所有开源模型。 包括同为混合专家模型的Grok-1和Mixtral。 新王搅局,迅速引发了开源社区的热议。 毕竟,仅...
-
号称全球最强开源 AI 模型,DBRX 登场:1320 亿参数,语言理解、编程能力等均超 GPT-3.5
3 月 28 日消息,初创公司 Databricks 近日发布公告,推出了开源 AI 模型 DBRX,声称是迄今为止全球最强大的开源大型语言模型,比 Meta 的 Llama 2 更为强大。 DBRX 采用 transformer 架构,包含 1320...
-
Stable Diffusion 3 来了 —— 充满了巨大的改进
文章目录 什么是Stable Diffusion 3? Stable Diffusion 3 有哪些新功能? Stable Diffusion 3 对比 Dall-E 3 和 Gemini 如何获得Stable Diffusion 3 的访问权...
-
46秒AI生成真人视频爆火,遭在线打假「换口型、声音」
AI 生成视频已经发展到这个程度了吗? 前段时间,英国王室凯特王妃的 P 图事件,再次将人们的注意力吸引到了图像或视频造假上来。随着 AI 伪造工具的「进化」,以假乱真、无中生有的内容也随之不断出现。 今天,一段宣称完全由 AI 生成的不到 50 秒的视...
-
开源文生图大模型Playground v2.5发布:超越SD、DALL·E 3和 Midjourney
前言 在AI技术迅速发展的今天,文生图模型成为了艺术创作、设计创新等领域的重要工具。Playground v2.5的发布,不仅在技术上取得了突破,更在开源文化的推广与实践上迈出了重要一步。 Huggingface模型下载:https://huggi...
-
离职谷歌的Transformer作者创业,连发3个模型(附技术报告)
去年 8 月,两位著名的前谷歌研究人员 David Ha、Llion Jones 宣布创立一家人工智能公司 Sakana AI,总部位于日本东京。其中,Llion Jones 是谷歌 2017 年经典研究论文《Attention is all you n...
-
图像生成地表最强!Playground v2.5技术报告解读重磅来袭!超越SD、DALL·E 3和 Midjourney
文章链接:https://arxiv.org/pdf/2402.17245 模型地址: https://huggingface.co/playgroundai/playground-v2.5-1024px-aesthetic 本文分享了在文本到图像生成模...
-
Sora不开源,微软给你开源!全球最接近Sora视频模型诞生,12秒生成效果逼真炸裂
微软版Sora诞生了! Sora虽爆火但闭源,给学术界带来了不小的挑战。学者们只能尝试使用逆向工程来对Sora复现或扩展。 尽管提出了Diffusion Transformer和空间patch策略,但想要达到Sora的性能还是很难,何况还缺乏算力和数据集...
-
符尧大佬一作发文,仅改训练数据,就让LLaMa-2上下文长度扩展20倍!
引言:探索语言模型的长上下文能力 近日,谷歌推出了Gemini Pro 1.5,将上下文窗口长度扩展到100万个tokens,目前领先世界。而其他语言模型也正在不断探索长上下文能力,也就是模型处理和理解超出其训练时所见上下文长度的能力。例如,一个模型可能...
-
【AIGC调研系列】embeding模型有哪些,各有什么优势
在AIGC中,Embedding模型是一种将文本数据转换为多维向量数组的技术,这些向量可以代表任何事物,如文本、音乐、视频等[2]。有几种不同的Embedding模型,它们各有其优势和应用领域。 Word2vec:这是一种经典的嵌入模型,通过学习单词...
-
马斯克突然开源Grok:3140亿参数巨无霸,免费可商用
马斯克说到做到: 旗下大模型Grok现已开源! 代码和模型权重已上线GitHub。官方信息显示,此次开源的Grok-1是一个3140亿参数的混合专家模型—— 就是说,这是当前开源模型中参数量最大的一个。 消息一出,Grok-1的GitHub仓库已揽获4...
-
为了保护客户隐私,使用Ruby在本地运行开源AI模型
译者 | 陈峻 审校 | 重楼 最近,我们实施了一个定制化的人工智能(AI)项目。鉴于甲方持有着非常敏感的客户信息,为了安全起见,我们不能将它们传递给OpenAI或其他专有模型。因此,我们在AWS虚拟机中下载并运行了一个开源的AI模型,使之完全处于我们的...
-
AI图像平台Fotor推出一站式AI长视频平台Clipfly
近日,图像编辑平台Fotor正式拓展视频领域,推出名为Clipfly的全新一站式AI长视频平台。Clipfly集成了AI视频生成、增强和编辑等多种功能,用户可在该平台完成从构思到最终视频输出的整个流程。 Fotor创始人兼CEO段江表示,凭借公司在图像AI...
-
发现 AI 宝藏:你不能错过的AI产品推荐
hi, 大家好, 我是徐小夕, 一名前端资深玩家. 今天暂时不分享前端技术, 带大家聊聊AI和AIGC产品。 这两年AI非常火, 国内也涌现出很多AI相关的产品. 作为一名非AI专业人才,怎么去做AI产品呢? 这个也是我一直探索的课题. 好在很多AI项...
-
Stable Diffusion 3 技术论文解读:开源能赢得文生图竞赛吗?
在大语言模型领域,闭源模型正在赢得比赛,无论是 OpenAI 还是刚刚发布新模型的 Anthropic,都是闭源模型的代表。 但在文生图领域,开源模型却表现出了足够强的竞争力。 2 周前,开源模型的代表企业 Stability AI 发布了最新...
-
【AIGC调研系列】StarCoder2模型与其他模型对比的优势和劣势
StarCoder2模型的优势主要包括: 性能:StarCoder2模型具备性能优势,旨在为代码生成、编辑和推理任务提供强大的支持[6]。 透明度:该系列模型希望成为代码生成领域的新标准,提高了模型的透明度和可访问性[1][4][11]。 成本效...
-
前端不存在了?盲测64%的人更喜欢GPT-4V的设计,杨笛一等团队新作
3 月 9 日央视的一档节目上,百度创始人、董事长兼 CEO 李彦宏指出,以后不会存在「程序员」这种职业了,因为只要会说话,人人都会具备程序员的能力。「未来的编程语言只会剩下两种,一种叫做英文,一种叫做中文。」 自大模型技术突破以来,越来越多的行业拥有...
-
清华系2B模型杀出支持离线本地化部署,可以个人电脑或者手机上部署的多模态大模型,超越 Mistral-7B、LLaMA-13B
清华系2B模型杀出支持离线本地化部署,可以个人电脑或者手机上部署的多模态大模型,超越 Mistral-7B、LLaMA-13B。 2 月 1 日,面壁智能与清华大学自然语言处理实验室共同开源了系列端侧语言大模型 MiniCPM,主体语言模型 Mini...
-
AI绘画与虚拟人生成实践(三):让虚拟形象动起来!照片生成说话的视频
书接上回,本篇的目的是结合上篇生成虚拟的女生形象,以及上一篇生成的关于介绍AI绘画领域的脚本,让生成的虚拟形象来念这段文案。先进入正题说明怎么来生成想要的动态视频。 1. Yanderify项目 Yanderify 教程 来实际手把手操作一下这个项...
-
谷歌最强轻量级开源大模型Gemma:小尺寸可商用,性能超越Llama-2,个人PC就能用
前言 谷歌近日发布了其最新的轻量级、开源AI模型——Gemma,这一举措无疑在AI领域引起了广泛的关注。不同于其他闭源大模型,Gemma的推出标志着谷歌在开放模型领域的重要一步,意图通过开放、共享的方式,加速AI技术的普及和应用。 Gemma模型概...
-
消费级显卡可用!李开复零一万物发布并开源90亿参数Yi模型,代码数学能力史上最强
李开复旗下AI公司零一万物,又一位大模型选手登场: 90亿参数Yi-9B。 它号称Yi系列中的“理科状元”,“恶补”了代码数学,同时综合能力也没落下。 在一系列类似规模的开源模型(包括Mistral-7B、SOLAR-10.7B、Gemma-7B、De...
-
【AIGC】Gemma和ChatGLM3-6B使用体验
近期,谷歌发布了全新的开源模型Gemma,同时智谱AI和清华大学KEG实验室合作推出了ChatGLM3-6B。这两个模型都是先进的对话预训练模型,本文将对它们进行对比,并分享使用体验。 先上效果 ChatGLM3-6B: ChatG...
-
通义千问1.5(Qwen1.5)大语言模型在PAI-QuickStart的微调与部署实践
作者:汪诚愚(熊兮)、高一鸿(子洪)、黄俊(临在) Qwen1.5(通义千问1.5)是阿里云最近推出的开源大型语言模型系列。作为“通义千问”1.0系列的进阶版,该模型推出了多个规模,从0.5B到72B,满足不同的计算需求。此外,该系列模型还包括了Base...
-
零一万物发布新一代AI模型Yi-9B,专为中英双语场景优化
近日,由李开复旗下的AI公司零一万物发布的新一代开源模型Yi-9B引起了业界的广泛关注。该模型是Yi系列中最强的模型,实际参数为8.8B,默认上下文长度为4K tokens。 Yi-9B在处理代码编写和数学问题解答方面表现出色,适合技术和学术领域的应用。这...