开源模型第4页 - AIGC资讯

GPT-4化身黑客搞破坏，成功率87%，OpenAI要求保密提示词，网友复现ing

91行代码、1056个token，GPT-4化身黑客搞破坏! 测试成功率达87%，单次成本仅8.8美元（折合人民币约63元）。这就是来自伊利诺伊大学香槟分校研究团队的最新研究。他们设计了一个黑客智能体框架，研究了包括GPT-4、GPT-3.5和众多开源模...

生成式AI 2024-04-22 人工智能

810阅读

采用OpenAI还是DIY?揭开自托管大型语言模型的真实成本

你自豪地将你的服务标榜为“AI驱动”，通过整合大型语言模型。你的网站首页自豪地展示了你的AI驱动服务带来的革命性影响，通过互动演示和案例研究，这也是你的公司在全球GenAI领域留下的第一个印记。你的小而忠实的用户基础正在享受提升后的客户体验，并且你可...

大数据 2024-04-22 人工智能

855阅读

GPT-4化身黑客搞破坏，成功率87%！OpenAI要求保密提示词，网友复现ing

91行代码、1056个token，GPT-4化身黑客搞破坏! 测试成功率达87%，单次成本仅8.8美元（折合人民币约63元）。这就是来自伊利诺伊大学香槟分校研究团队的最新研究。他们设计了一个黑客智能体框架，研究了包括GPT-4、GPT-3.5和众多开源模...

生成式AI 2024-04-22 人工智能

853阅读

开源模型打败GPT-4！LLM竞技场最新战报，Cohere Command R+上线

GPT-4又又又被超越了! 近日，LLM竞技场更新了战报，人们震惊地发现:居然有一个开源模型干掉了GPT-4! 这就是Cohere在一周多前才发布的Command R+。排行榜地址:https://huggingface.co/spaces/lmsys...

人工智能 2024-04-21 人工智能

827阅读

AI日报：最强大模型Llama 3发布；Midjourney推社交新功能Room；超强AI视频自动剪辑工具Captions；手机上可以玩大模型了

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、最强大模型Llama3 正式发...

AIGC 2024-04-20 人工智能

892阅读

大模型开源还是闭源好，周鸿祎与李彦宏针尖对麦芒

开源大模型还是闭源大模型，究竟谁才是“版本答案”?围绕这个问题，360创始人周鸿祎和百度创始人李彦宏最近就来了一次隔空论战。先是在4月12日，有媒体曝光了李彦宏在百度内部的讲话。其中就有他认为闭源大模型在能力上会持续领先、而不是一时领先，并且开源大模型的...

人工智能 2024-04-20 人工智能

801阅读

全球首个「开源GPT-4」出世！Llama 3震撼发布，Meta AI免登录可用

LLM界的「真·Open AI」，又来整顿AI圈了! 业内惊呼:首个开源GPT-4级的模型，终于来了!开源模型追上闭源模型的历史性一刻，或许就在眼前了? 一石激起千层浪，Llama3才刚刚发布没几小时，就破纪录地登顶了Hugging Face排行榜。这...

人工智能 2024-04-20 人工智能

942阅读

Meta 发布Llama 3，能力直逼GPT-4,一己之力拉高开源大模型水位

编辑|伊风、诺亚出品 | 51CTO技术栈（微信号：blog51cto） Meta麾下“羊驼”一路狂奔在开源的大道上。在过去的一年里，Llama系列可以说开辟了开源LLM的半壁江山。嫌弃开源模型能力只有GPT-3.5,不够用? 如今Llam...

大数据 2024-04-20 人工智能

904阅读

李彦宏内部讲话谈大模型：闭源才有真正的商业模式

4月11日，一则关于大模型的李彦宏内部讲话流出。在讲话中李彦宏对大模型的开源闭源路线之争给出了自己的解答。他说，市场上已经有足够多的开源大模型，“不缺我们这一家开源的模型。我们要开源还得自己去维护一套开源的版本，这是不划算的。” 他还表示，闭源模型...

生成式AI 2024-04-12 人工智能

879阅读

开源模型首胜GPT-4！竞技场最新战报引热议，Karpathy：这是我唯二信任的榜单

能打得过GPT-4的开源模型出现了！大模型竞技场最新战报： 1040亿参数开源模型Command R+攀升至第6位，与GPT-4-0314打成平手，超过了GPT-4-0613。图片这也是第一个在大模型竞技场上击败GPT-4的开放权重模型。大模型竞...

大数据 2024-04-10 人工智能

791阅读

谷歌向微软英特尔全面宣战！首款自研Arm CPU，最强大模型公测，AI视频对垒Sora

昨天的谷歌Next大会可是太精彩了，谷歌一连放出不少炸弹。 - 升级「视频版」Imagen 2.0，下场AI视频模型大混战 - 发布时被Sora光环掩盖的Gemini 1.5 Pro，正式开放 - 首款Arm架构CPU发布，全面对垒微软/亚马逊/英伟达/...

AIGC 2024-04-10 人工智能

861阅读

大概是最全的开源大模型LLM盘点了吧！

LLM(Large Language Model, 大型语言模型是指那些规模庞大、参数数量众多的深度神经网络模型，用于理解和生成自然语言文本。在自然语言处理（NLP）领域有着广泛的应用，因其强大的语言理解和生成能力，能够处理各种复杂的文本任务，包括但不...

大数据 2024-04-10 人工智能

870阅读

120亿Stable LM 2上线即开源！2万亿token训练，碾压Llama 2 70B

继16亿轻量级Stable LM 2推出之后，12B参数的版本在今天亮相了。见状，不少网友纷纷喊话：干的漂亮！但，Stable Diffusion 3啥时候出啊？总得来说，Stable LM 2 12B参数更多，性能更强。 120亿参数版本包含了...

AIGC 2024-04-09 人工智能

812阅读

玩转大模型！用Replicate一键部署

Replicate是一个云端的机器学习模型运行平台。它可以让用户使用云端API 直接运行机器学习模型，而无需了解复杂的机器学习模型内部构造。 Replicate允许用户在Python或Jupyter Notebook中运行模型，并在云端进行模型的部...

人工智能 2024-04-08 人工智能

990阅读

Fireworks.ai开源API使任何开发者都能使用生成式AI

随着人们对生成式 AI 的热情不断高涨，越来越多的公司试图涉足这一领域。Fireworks.ai 就是其中之一。虽然公司名气不及 OpenAI、Anthropic 和 Cohere 等大牌厂商，但据该公司称，它拥有超过12，000名用户的最大开源模型 AP...

人工智能 2024-04-08 人工智能

902阅读

中科大等意外发现：大模型不看图也能正确回答视觉问题！

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 大模型不看图，竟也能正确回答视觉问题？！中科大、香港中文大学、上海AI Lab的研究团队团队意外发现了这一离奇现象。他们首先看到像...

人工智能 2024-04-07 人工智能

796阅读

论文笔记：Llama 2: Open Foundation and Fine-Tuned Chat Models

导语 Llama 2 是之前广受欢迎的开源大型语言模型 LLaMA 的新版本，该模型已公开发布，可用于研究和商业用途。本文记录了阅读该论文的一些关键笔记。链接：https://arxiv.org/abs/2307.09288 1 引言大型语言...

人工智能 2024-04-07 人工智能

1054阅读

首个开源世界模型LWM ：百万级上下文，长视频理解超GPT-4

来自加州大学伯克利分校的研究人员最近发布并开源了首个世界模型，被称为 LWM（LargeWorldModel）系列模型。这一模型采用了大量视频和书籍数据集，通过 RingAttention 技术实现了长序列的可扩展训练，使得模型的上下文长度达到了1M to...

生成式AI 2024-04-04 人工智能

933阅读

华人开源最强「AI 程序员」炸场，让 GPT-4 自己修 Bug！

自从“AI 程序员”Devin问世之后，近期的一大趋势就是程序员们争先恐后地要让自己失业，试图抢先造出比自己更强大的程序员。普林斯顿大学为软件工程界迎来了一位新星——SWE-agent，论文将在4月10日正式发布，目前项目已在 GitHub 上开源。...

大数据 2024-04-04 人工智能

870阅读

多忽悠几次AI全招了！Anthropic警告：长上下文成越狱突破口，GPT羊驼Claude无一幸免

大模型厂商在上下文长度上卷的不可开交之际，一项最新研究泼来了一盆冷水—— Claude背后厂商Anthropic发现，随着窗口长度的不断增加，大模型的“越狱”现象开始死灰复燃。无论是闭源的GPT-4和Claude2，还是开源的Llama2和Mistral...

人工智能 2024-04-03 人工智能

822阅读

性能强，成本低，运行快！最强开源大模型出现，超越ChatGPT和Llama！

大数据人工智能公司 Databricks放大招了！ 3月27日，该公司开源了通用大模型 DBRX，并声称该模型是迄今为止全球最强大的开源大型语言模型，比 Meta 的 Llama 2 更为强大。 GPT-3.5研究测试： https://huj...

大数据 2024-04-02 人工智能

912阅读

马斯克开源 Grok：参数量近 Llama 四倍，成全球最大开源模型

本周一，马斯克在他的社交媒体平台 X 上宣布 xAI 开源 Grok，这也兑现了他上周的开源承诺。截至目前，Grok 已经在 GitHub 上获得了 4.3k 颗 Star。开源地址：https://github.com/xai-org/grok-1...

生成式AI 2024-04-01 人工智能

942阅读

我的领导马斯克：痛恨开会，不要非技术中层，推崇裁员

马斯克称得上是个“魔鬼老板”这事儿，已经出了名了。现在，他的老部下卡帕西（Andrej Karpathy）又在最新访谈中“锤”了他一把（doge）：我不得不恳求他允许我招人。他（马斯克）总是默认要裁掉员工。喜欢裁人之外，在这场红杉组织的AI A...

生成式AI 2024-04-01 人工智能

772阅读

【AIGC调研系列】Grok大模型与其他模型相比的优势和劣势

Grok大模型与其他模型相比，具有以下优势和劣势：优势：实时了解世界的能力：Grok能够通过X平台实时了解世界，这是其独特而根本的优势之一[2][6][17]。这意味着Grok能够在回答问题时提供最新的信息和数据。处理尖锐问题的能力：Gro...

大数据 2024-03-31 人工智能

2478阅读

开源AI到底是什么？业界：超出开源软件范畴，需要重新界定

最近AI圈突然流行起开源概念。Meta承诺将会打造开源AI，马斯克起诉OpenAI，说它缺少开源模型。与此同时，一批科技领袖和科技企业纷纷为开源概念呐喊。不过科技界碰到一个难以解决的根本问题：它们对“开源AI”的概念无法达成共识。照字面意思，开源A...

AIGC 2024-03-29 人工智能

819阅读

首个基于SSM-Transformer混合架构，开源商业大模型Jamba

3月29日，知名AI研究实验室AI21在官网开源了，首个基于SSM-Transformer混合架构的商业大模型——Jamba。目前，ChatGPT、Stable Difusion 、Lyria等产品使用的皆是Transformer架构，虽然在捕捉序列内长...

AIGC 2024-03-29 人工智能

929阅读

开源大模型DBRX：1320亿参数，比Llama2-70B快1倍

大数据公司Databricks最近发布了一款名为DBRX的MoE大模型，引发了开源社区的热议。DBRX在基准测试中击败了Grok-1、Mixtral等开源模型，成为了新的开源之王。这款模型的总参数量达到了1320亿，但每次激活只有360亿参数，并且其生成速...

人工智能 2024-03-28 人工智能

831阅读

铁了心要打败OpenAI！坚信开源打败闭源！这家知名数据厂商4个月打造最强开源大模型！性能超越Claude3，速度是羊驼2倍

撰稿 | 言征出品 | 51CTO技术栈（微信号：blog51cto）大模型领域，迭代的速度简直要以天计算。昨天，大家还在热议Claude3超大杯版Opus在Elo Rating榜单上取代GPT4-Turbo-1106成为了新王。今天大家又发现开源...

生成式AI 2024-03-28 人工智能

935阅读

新开源之王来了！1320亿参数，逻辑数理全面打赢Grok，还比Llama2-70B快1倍

“最强”开源大模型之争，又有新王入局：大数据巨头Databricks，刚刚发布MoE大模型DBRX，并宣称：它在基准测试中击败了此前所有开源模型。包括同为混合专家模型的Grok-1和Mixtral。新王搅局，迅速引发了开源社区的热议。毕竟，仅...

AIGC 2024-03-28 人工智能

919阅读

号称全球最强开源 AI 模型，DBRX 登场：1320 亿参数，语言理解、编程能力等均超 GPT-3.5

3 月 28 日消息，初创公司 Databricks 近日发布公告，推出了开源 AI 模型 DBRX，声称是迄今为止全球最强大的开源大型语言模型，比 Meta 的 Llama 2 更为强大。 DBRX 采用 transformer 架构，包含 1320...

人工智能 2024-03-28 人工智能

860阅读

Stable Diffusion 3 来了 —— 充满了巨大的改进

文章目录什么是Stable Diffusion 3？ Stable Diffusion 3 有哪些新功能？ Stable Diffusion 3 对比 Dall-E 3 和 Gemini 如何获得Stable Diffusion 3 的访问权...

大数据 2024-03-28 人工智能

956阅读

46秒AI生成真人视频爆火，遭在线打假「换口型、声音」

AI 生成视频已经发展到这个程度了吗？前段时间，英国王室凯特王妃的 P 图事件，再次将人们的注意力吸引到了图像或视频造假上来。随着 AI 伪造工具的「进化」，以假乱真、无中生有的内容也随之不断出现。今天，一段宣称完全由 AI 生成的不到 50 秒的视...

人工智能 2024-03-27 人工智能

793阅读

开源文生图大模型Playground v2.5发布：超越SD、DALL·E 3和 Midjourney

前言在AI技术迅速发展的今天，文生图模型成为了艺术创作、设计创新等领域的重要工具。Playground v2.5的发布，不仅在技术上取得了突破，更在开源文化的推广与实践上迈出了重要一步。 Huggingface模型下载：https://huggi...

生成式AI 2024-03-25 人工智能

1239阅读

离职谷歌的Transformer作者创业，连发3个模型（附技术报告）

去年 8 月，两位著名的前谷歌研究人员 David Ha、Llion Jones 宣布创立一家人工智能公司 Sakana AI，总部位于日本东京。其中，Llion Jones 是谷歌 2017 年经典研究论文《Attention is all you n...

人工智能 2024-03-25 人工智能

870阅读

图像生成地表最强！Playground v2.5技术报告解读重磅来袭！超越SD、DALL·E 3和 Midjourney

文章链接：https://arxiv.org/pdf/2402.17245 模型地址： https://huggingface.co/playgroundai/playground-v2.5-1024px-aesthetic 本文分享了在文本到图像生成模...

AIGC 2024-03-25 人工智能

1260阅读

Sora不开源，微软给你开源！全球最接近Sora视频模型诞生，12秒生成效果逼真炸裂

微软版Sora诞生了！ Sora虽爆火但闭源，给学术界带来了不小的挑战。学者们只能尝试使用逆向工程来对Sora复现或扩展。尽管提出了Diffusion Transformer和空间patch策略，但想要达到Sora的性能还是很难，何况还缺乏算力和数据集...

大数据 2024-03-22 人工智能

913阅读

符尧大佬一作发文，仅改训练数据，就让LLaMa-2上下文长度扩展20倍！

引言：探索语言模型的长上下文能力近日，谷歌推出了Gemini Pro 1.5，将上下文窗口长度扩展到100万个tokens，目前领先世界。而其他语言模型也正在不断探索长上下文能力，也就是模型处理和理解超出其训练时所见上下文长度的能力。例如，一个模型可能...

生成式AI 2024-03-22 人工智能

1009阅读

【AIGC调研系列】embeding模型有哪些，各有什么优势

在AIGC中，Embedding模型是一种将文本数据转换为多维向量数组的技术，这些向量可以代表任何事物，如文本、音乐、视频等[2]。有几种不同的Embedding模型，它们各有其优势和应用领域。 Word2vec：这是一种经典的嵌入模型，通过学习单词...

AIGC 2024-03-18 人工智能

3032阅读

马斯克突然开源Grok：3140亿参数巨无霸，免费可商用

马斯克说到做到：旗下大模型Grok现已开源！代码和模型权重已上线GitHub。官方信息显示，此次开源的Grok-1是一个3140亿参数的混合专家模型—— 就是说，这是当前开源模型中参数量最大的一个。消息一出，Grok-1的GitHub仓库已揽获4...

AIGC 2024-03-18 人工智能

829阅读

为了保护客户隐私，使用Ruby在本地运行开源AI模型

译者 | 陈峻审校 | 重楼最近，我们实施了一个定制化的人工智能（AI）项目。鉴于甲方持有着非常敏感的客户信息，为了安全起见，我们不能将它们传递给OpenAI或其他专有模型。因此，我们在AWS虚拟机中下载并运行了一个开源的AI模型，使之完全处于我们的...

AIGC 2024-03-18 人工智能

960阅读

AI图像平台Fotor推出一站式AI长视频平台Clipfly

近日，图像编辑平台Fotor正式拓展视频领域，推出名为Clipfly的全新一站式AI长视频平台。Clipfly集成了AI视频生成、增强和编辑等多种功能，用户可在该平台完成从构思到最终视频输出的整个流程。 Fotor创始人兼CEO段江表示，凭借公司在图像AI...

人工智能 2024-03-15 人工智能

875阅读

发现 AI 宝藏：你不能错过的AI产品推荐

hi, 大家好, 我是徐小夕, 一名前端资深玩家. 今天暂时不分享前端技术, 带大家聊聊AI和AIGC产品。这两年AI非常火, 国内也涌现出很多AI相关的产品. 作为一名非AI专业人才,怎么去做AI产品呢? 这个也是我一直探索的课题. 好在很多AI项...

人工智能 2024-03-15 人工智能

967阅读

Stable Diffusion 3 技术论文解读：开源能赢得文生图竞赛吗？

在大语言模型领域，闭源模型正在赢得比赛，无论是 OpenAI 还是刚刚发布新模型的 Anthropic，都是闭源模型的代表。但在文生图领域，开源模型却表现出了足够强的竞争力。 2 周前，开源模型的代表企业 Stability AI 发布了最新...

AIGC 2024-03-15 人工智能

865阅读

【AIGC调研系列】StarCoder2模型与其他模型对比的优势和劣势

StarCoder2模型的优势主要包括：性能：StarCoder2模型具备性能优势，旨在为代码生成、编辑和推理任务提供强大的支持[6]。透明度：该系列模型希望成为代码生成领域的新标准，提高了模型的透明度和可访问性[1][4][11]。成本效...

大数据 2024-03-14 人工智能

1349阅读

前端不存在了？盲测64%的人更喜欢GPT-4V的设计，杨笛一等团队新作

3 月 9 日央视的一档节目上，百度创始人、董事长兼 CEO 李彦宏指出，以后不会存在「程序员」这种职业了，因为只要会说话，人人都会具备程序员的能力。「未来的编程语言只会剩下两种，一种叫做英文，一种叫做中文。」自大模型技术突破以来，越来越多的行业拥有...

人工智能 2024-03-11 人工智能

765阅读

清华系2B模型杀出支持离线本地化部署，可以个人电脑或者手机上部署的多模态大模型，超越 Mistral-7B、LLaMA-13B

清华系2B模型杀出支持离线本地化部署，可以个人电脑或者手机上部署的多模态大模型，超越 Mistral-7B、LLaMA-13B。 2 月 1 日，面壁智能与清华大学自然语言处理实验室共同开源了系列端侧语言大模型 MiniCPM，主体语言模型 Mini...

人工智能 2024-03-11 人工智能

881阅读

AI绘画与虚拟人生成实践（三）：让虚拟形象动起来！照片生成说话的视频

书接上回，本篇的目的是结合上篇生成虚拟的女生形象，以及上一篇生成的关于介绍AI绘画领域的脚本，让生成的虚拟形象来念这段文案。先进入正题说明怎么来生成想要的动态视频。 1. Yanderify项目 Yanderify 教程来实际手把手操作一下这个项...

生成式AI 2024-03-10 人工智能

1639阅读

谷歌最强轻量级开源大模型Gemma：小尺寸可商用，性能超越Llama-2，个人PC就能用

前言谷歌近日发布了其最新的轻量级、开源AI模型——Gemma，这一举措无疑在AI领域引起了广泛的关注。不同于其他闭源大模型，Gemma的推出标志着谷歌在开放模型领域的重要一步，意图通过开放、共享的方式，加速AI技术的普及和应用。 Gemma模型概...

人工智能 2024-03-10 人工智能

1016阅读

消费级显卡可用！李开复零一万物发布并开源90亿参数Yi模型，代码数学能力史上最强

李开复旗下AI公司零一万物，又一位大模型选手登场： 90亿参数Yi-9B。它号称Yi系列中的“理科状元”，“恶补”了代码数学，同时综合能力也没落下。在一系列类似规模的开源模型（包括Mistral-7B、SOLAR-10.7B、Gemma-7B、De...

生成式AI 2024-03-07 人工智能

827阅读

【AIGC】Gemma和ChatGLM3-6B使用体验

近期，谷歌发布了全新的开源模型Gemma，同时智谱AI和清华大学KEG实验室合作推出了ChatGLM3-6B。这两个模型都是先进的对话预训练模型，本文将对它们进行对比，并分享使用体验。先上效果 ChatGLM3-6B: ChatG...

人工智能 2024-03-07 人工智能

1209阅读