开源模型第3页 - AIGC资讯

英伟达新研究：上下文长度虚标严重，32K性能合格的都不多

无情戳穿“长上下文”大模型的虚标现象—— 英伟达新研究发现，包括GPT-4在内的10个大模型，生成达到128k甚至1M上下文长度的都有。但一番考验下来，在新指标“有效上下文”上缩水严重，能达到32K的都不多。新基准名为RULER，包含检索、多跳追踪、...

大数据 2024-06-03 人工智能

798阅读

ICML2024高分！魔改注意力，让小模型能打两倍大的模型

改进Transformer核心机制注意力，让小模型能打两倍大的模型！ ICML 2024高分论文，彩云科技团队构建DCFormer框架，替换Transformer核心组件多头注意力模块（MHA），提出可动态组合的多头注意力（DCMHA）。 DCMHA解除...

AIGC 2024-06-03 人工智能

814阅读

国产大模型全阵容，中文大模型竞技场推出！

LMSYS Org推出的大模型竞技场Chatbot Arena，已成为海外最具公信力的大模型榜单之一，但该榜单中文化程度相对不足。近日，上海人工智能实验室联合魔搭社区推出中国大语言模型评测竞技场Compass Arena，首度集齐国内主流大模型全阵容，阿...

生成式AI 2024-05-31 人工智能

983阅读

腾讯正式发布AI助手App“腾讯元宝”：提供口语陪练特色应用

快科技5月30日消息，腾讯今日正式上线AI助手App腾讯元宝”。据官方介绍，腾讯今日正式推出了全新的AI助手App腾讯元宝”，这款应用基于腾讯的混元大模型，集成了AI搜索、AI总结、AI写作等强大功能，为用户带来前所未有的智能体验。腾讯元宝的亮点在于其...

AIGC 2024-05-30 人工智能

884阅读

AI日报｜微软推出Copilot+PC，通义主模型大幅降价，文心两大模型全面免费...

文章推荐 AI晚报｜GPT-4o最新语音交互模式即将上线，微软Build 2024开发者大会即将开幕... AI Agent深度解析：潜力与挑战并存的智能新世界 GPT-4o重磅发布，第一时间用户测评，OpenAI也存在夸张宣传？微软让Windo...

大数据 2024-05-29 人工智能

863阅读

CIO指南：采用开源生成式AI需要注意的十件事

开源生成式AI模型是可以免费下载的、大规模使用而无需增加API调用成本的，并且可以在企业防火墙后面安全运行。但你不要放松警惕，风险仍然存在，有些风险不仅被放大了，而且针对生成式AI的新风险正在出现。如今似乎任何人都可以制作AI模型，即使你没有训练数...

人工智能 2024-05-28 人工智能

935阅读

微软的Copilot+ PC将重塑企业计算的四种方式

微软CEO Satya Nadella说：“Copilot将知识和专业技能置于你的指尖，帮助你加以利用，它在各类设备、每个角色、功能和行业中工作。Copilot正在赋能地球上的每一个人和每一个企业，使其更加知识渊博、高效、富有创意，并真正与一切重...

AIGC 2024-05-28 人工智能

850阅读

众神听令，王者归位！Meta最强开源大模型 Llama 3 重磅来袭

整理 | 王轶群责编 | 唐小引出品丨AI 科技大本营（ID：rgznai100） 4月19日凌晨，Meta重磅发布了全球最大开源大模型Llama 3，一夜间重新坐稳王者之位。模型下载链接：https://llama.meta.com/lla...

AIGC 2024-05-28 人工智能

881阅读

只需单卡RTX 3090，低比特量化训练就能实现LLaMA-3 8B全参微调

自 2010 年起，AI 技术历经多个重大发展阶段，深度学习的崛起和 AlphaGo 的标志性胜利显著推动了技术前进。尤其是 2022 年底推出的 ChatGPT，彰显了大语言模型（LLM）的能力达到了前所未有的水平。自此，生成式 AI 大模型迅速进入高...

AIGC 2024-05-27 人工智能

798阅读

阿里开源截止目前为止参数规模最大的Qwen1.5-110B模型：MMLU评测接近Llama-3-70B，略超Mixtral-8×22B！

本文原文来自DataLearnerAI官方网站：阿里开源截止目前为止参数规模最大的Qwen1.5-110B模型：MMLU评测接近Llama-3-70B，略超Mixtral-8×22B！ | 数据学习者官方网站(Datalearner https://www...

AIGC 2024-05-26 人工智能

970阅读

你想要的照片，AI都能帮你画出来：记录Stable Diffusion的力量

目录前言一、配置软件环境（可以跳过直接看第二部分效果图） 1.启动界面二、解锁新功能 2.1 开源模型的获取三、如何生成细节更加可控的内容呢？ 3.1 充分利用prompt: 3.2 词不达意时，充分使用lora 3.2 使用多个lo...

AIGC 2024-05-25 人工智能

995阅读

Llama3-8B+ LLaMA-Factory 中文微调

Llama3-8B+ LLaMA-Factory 中文微调 Llama3是目前开源大模型中最优秀的模型之一，但是原生的Llama3模型训练的中文语料占比非常低，因此在中文的表现方便略微欠佳！本教程就以Llama3-8B-Instruct开源模型为模...

大数据 2024-05-25 人工智能

834阅读

微软如何看待其“模型即服务”功能使AI普及化

如今的工具使构建AI驱动的应用程序变得容易，但一个复杂的领域是，几乎所有开发人员都希望避免处理如何托管所使用的模型，这不仅是选择OpenAI的GPT-4o、Meta的Llama 3、Google的Gemini或市场上众多开源模型的问题，更是部署它们的...

人工智能 2024-05-24 人工智能

932阅读

蔡崇信吴泳铭发布上任首封致股东信：AI将带来巨大机遇

昨日，蔡崇信、吴泳铭发布了第一封联合署名的致股东信。在信中，蔡崇信、吴泳铭表示，未来十年，没有哪个行业能免于AI带来的颠覆。AI不会为旧的做事方式提供保护，而是重新点燃我们的创业激情和想象力。我们的每个业务都有大量应用场景，所有场景都可以通过人工智能创造...

生成式AI 2024-05-24 人工智能

827阅读

ambientGPT：开源多模态MacOS基础模型操作界面可调用GPT-4o API

最近，一款名为 ambientGPT 的开源项目备受关注。这款工具是一款多模态 MacOS 基础模型操作界面，可以调用 GPT-4o API 或者本地开源模型进行问答，并能直接访问屏幕内容而不需要截图。它的本地模型是基于 Apple 的 MLX 库，技术栈...

人工智能 2024-05-23 人工智能

835阅读

击穿全网底价，通义千问GPT-4级大模型直降97%！1块钱能买200万tokens

通义千问GPT-4级大模型，直接击穿全网底价! 就在刚刚，阿里突然放出大招，官宣9款通义大模型降价。其中，性能对标GPT-4的主力模型Qwen-Long，API输入价格从0.02元/千tokens降至0.0005元/千tokens，也就是1块钱能买200...

AIGC 2024-05-21 人工智能

874阅读

AI初创公司CEO下场做网红，创立5个月，吸引用户超70万

创立仅5个月，吸引注册用户超70万。那个制造了AI产品快速盈利神话的、两人公司Magnific AI最近被收购了。 Magnific AI（以下简称Magnific）是一家西班牙人工智能初创公司，由Javi Lopez担任CEO、Emilio Nico...

大数据 2024-05-21 人工智能

926阅读

通义千问GPT-4级主力模型Qwen-Long API输入费用暴跌97%

今日阿里云宣布将其GPT-4级主力模型Qwen-Long的API输入价格从每千tokens0.02元降至每千tokens0.0005元，直降了惊人的97%。这一举动意味着，现在用户只需花费1块钱就可以购买200万tokens，相当于5本《新华字典》的文字...

AIGC 2024-05-21 人工智能

936阅读

通义千问GPT-4级主力模型降价97%，1块钱200万tokens

5月21日，阿里云抛出重磅炸弹：通义千问GPT-4级主力模型Qwen-Long，API输入价格从0.02元/千tokens降至0.0005元/千tokens，直降97%。这意味着，1块钱可以买200万tokens，相当于5本《新华字典》的文字量。这款模型...

大数据 2024-05-21 人工智能

744阅读

腾讯混元将发布大模型C端App腾讯元宝：超万亿参数规模

在腾讯云生成式AI产业应用峰会上，腾讯表示，将于5月30日正式发布面向C端的全新App——“腾讯元宝”。这款应用的背后，是腾讯全链路自研的通用大语言模型——混元大模型，它以其超过万亿的参数规模，展现了卓越的中文理解与创作能力、逻辑推理能力以及可靠的任务执行...

生成式AI 2024-05-17 人工智能

961阅读

使用开源GenAI时需要注意的十个问题

如今似乎任何人都可以制作AI模型。即使你没有训练数据或编程技巧，你也可以选择你喜欢的开源模型，对其进行调整，并以新的名字发布。根据斯坦福大学在4月发布的AI指数报告，2023年发布了149个基础模型，其中三分之二是开源的，而且有大量的变体。Huggi...

大数据 2024-05-16 人工智能

840阅读

首个中文原生DiT架构！腾讯混元文生图大模型全面开源，免费商用

中文 AI 社区迎来了一个好消息：与 Sora 同架构的开源文生图大模型来了！ 5 月 14 日，腾讯宣布旗下混元文生图大模型全面升级并全面开源，目前已在 Hugging Face 平台及 GitHub 上发布，包含模型权重、推理代码、模型算法等完整模型...

生成式AI 2024-05-15 人工智能

1130阅读

腾讯宣布混元文生图大模型开源： Sora 同架构，可免费商用

5月14日，腾讯宣布旗下的混元文生图大模型全面升级并对外开源，目前已在 Hugging Face 平台及 Github 上发布，包含模型权重、推理代码、模型算法等完整模型，可供企业与个人开发者免费商用。这是业内首个中文原生的 DiT 架构文生图开源模型...

AIGC 2024-05-14 人工智能

925阅读

重磅！腾讯宣布混元文生图大模型开源： Sora 同架构，中英文原生DiT，可免费商用

5月14日，腾讯宣布旗下的混元文生图大模型全面升级并对外开源，目前已在 Hugging Face 平台及 Github 上发布，包含模型权重、推理代码、模型算法等完整模型，可供企业与个人开发者免费商用。这是业内首个中文原生的DiT架构文生图开源模型，支...

人工智能 2024-05-14 人工智能

851阅读

微调工程师岗位可能并不存在，但使用 AI 编码工具已经成为刚需

智能编码工具的快速普及是否会带来全新的编程模式?“大力出奇迹”的规律还将继续适用吗?本文节选自 QCon 北京特别策划圆桌节目，内容摘自阿里云通义灵码产品技术负责人陈鑫在圆桌对话里的精彩回答。全文见:Sora很难跟进?微调就不是一个岗位?大力出奇迹将继续适...

生成式AI 2024-05-13 人工智能

878阅读

研究表明：AI 系统已经擅长欺骗和操纵人类

人工智能（AI）系统已经学会了如何欺骗人类即使这些系统被训练成有益和诚实的。研人员在5月10日发表在《Patterns》杂志上的一篇综述文章中描述了 AI 系统欺骗行为的风险呼吁各国政府尽快制定强有力的监管措施来解决这一问题。首席作者、麻省理工学 AI...

生成式AI 2024-05-11 人工智能

997阅读

太酷了！手机上部署最新AI大模型！只需两步！

在当前的AI革命中，大模型扮演着至关重要的角色，而这背后的基础便是Scaling Law。简而言之，随着数据、参数和计算能力的不断提升，大模型的能力也随之增强，展现出小规模模型所无法比拟的“涌现能力”。越来越多的AI企业纷纷推出开源大模型，按照扩展定律实...

AIGC 2024-05-10 人工智能

1036阅读

闭源赶超GPT-4 Turbo、开源击败Llama-3-70B，歪果仁：这中国大模型真香

国内的开发者们或许没有想到，有朝一日，他们开发的 AI 大模型会像出海的网文、短剧一样，让世界各地的网友坐等更新。甚至，来自韩国的网友已经开始反思:为什么我们就没有这样的模型? 这个「别人家的孩子」就是阿里云的通义千问（英文名为 Qwen）。在过去的一...

大数据 2024-05-10 人工智能

865阅读

阿里云发布通义千问2.5版性能赶超GPT-4 Turbo

阿里云今日正式发布通义千问2.5版本，该版本在模型性能上全面赶超了GPT-4Turbo，展现了其强大的技术实力。与此同时，通义千问最新开源的1100亿参数模型Qwen1.5-110B在多个基准测评中取得了卓越成绩，超越了Meta的Llama-3-70B模型...

生成式AI 2024-05-09 人工智能

856阅读

AlphaGo核心算法增强，7B模型数学能力直逼GPT-4，阿里大模型新研究火了

把AlphaGo的核心算法用在大模型上，“高考”成绩直接提升了20多分。在MATH数据集上，甚至让7B模型得分超过了GPT-4。一项来自阿里的新研究引发关注：研究人员用蒙特卡洛树搜索（MCTS）给大语言模型来了把性能增强，无需人工标注解题步骤，也能...

AIGC 2024-05-09 人工智能

879阅读

法国AI公司Mistral AI即将完成新融资估值飙升至60亿美元

站长之家（ChinaZ.com）5月9日消息:法国人工智能初创公司Mistral AI近日宣布即将达成一项新的融资协议，其估值高达60亿美元，较半年前翻了近三倍。这一成就不仅彰显了公司在人工智能领域的强大实力，也反映了市场对其未来发展潜力的高度认可。回...

AIGC 2024-05-09 人工智能

813阅读

《2024年人工智能准备度报告》发布！6成企业拟采用AI，投入生产的仅占其中三分之一；OpenAI稳坐王位；比起RAG更爱微调…

整理 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）最近，人工智能公司 Scale AI发布《2024年人工智能准备度报告》。该系列报告已经是连续第三年进行发布，本次报告调查采访了1800 多名在企业中构建或应用人...

人工智能 2024-05-09 人工智能

861阅读

清华首个AI医院小镇来了！AI医生自进化击败人类专家，数天诊完1万名患者

斯坦福AI小镇曾火遍了全网，25个智能体生活交友，堪称现实版的「西部世界」。而现在，AI「医院小镇」也来了！最近，来自清华团队的研究人员开发了一个名为「Agent Hospital」的模拟医院。论文地址：https://arxiv.org/pdf...

大数据 2024-05-09 人工智能

855阅读

阿里巴巴推出通义千问2.5 号称性能超越GPT-4 Turbo

在人工智能领域，阿里巴巴再次取得重大进展，于5月9日正式发布了通义千问2.5版本。该版本在模型性能上全面超越了GPT-4Turbo，标志着阿里巴巴在AI技术发展上的又一重要里程碑。通义千问2.5的主要提升包括: 理解能力提升9%:在文本理解方面，相较...

生成式AI 2024-05-09 人工智能

878阅读

一块钱100万token，超强MoE模型开源，性能直逼GPT-4-Turbo

开源大模型领域，又迎来一位强有力的竞争者。近日，探索通用人工智能（AGI）本质的 DeepSeek AI 公司开源了一款强大的混合专家 (MoE 语言模型 DeepSeek-V2，主打训练成本更低、推理更加高效。项目地址：https://gi...

人工智能 2024-05-07 人工智能

953阅读

国产开源MoE指标炸裂：GPT-4级别能力，API价格仅百分之一

最新国产开源MoE大模型，刚刚亮相就火了。 DeepSeek-V2性能达GPT-4级别，但开源、可免费商用、API价格仅为GPT-4-Turbo的百分之一。因此一经发布，立马引发不小讨论。从公布的性能指标来看，DeepSeek-V2的中文综合能力超越...

人工智能 2024-05-07 人工智能

1034阅读

挑战OpenAI，微软自研5000亿参数绝密武器曝光！前谷歌DeepMind高管带队

不需要OpenAI，微软或许也会成为AI领头羊！外媒Information爆料称，微软内部正在开发自家首款5000亿参数的大模型MAl-1。这恰好是，纳德拉带领团队证明自己的时候到了。在向OpenAI投资100多亿美元之后，微软才获得了GPT-3...

生成式AI 2024-05-07 人工智能

802阅读

全球最强开源 MoE 模型来了，中文能力比肩 GPT-4，价格仅为 GPT-4-Turbo 的近百分之一

想象一下，一个人工智能模型，不仅拥有超越传统计算的能力，还能以更低的成本实现更高效的性能。这不是科幻，DeepSeek-V2[1]，全球最强开源 MoE 模型来了。 DeepSeek-V2 是一个强大的专家混合（MoE）语言模型，具有训练经济、推理高效...

大数据 2024-05-07 人工智能

986阅读

那些可免费使用的在线大语言模型服务

2022年底以ChatGPT[1]为代表的大语言模型的出现掀起了人工智能应用的新浪潮。这些庞大的语言模型经过对海量文本数据的训练，能够理解和生成逼近人类水平的自然语言，在对话、问答、文本生成、代码编写等领域展现出了惊人的能力。最初这种能力“垄断”在Op...

AIGC 2024-05-07 人工智能

1289阅读

报道称微软准备推新AI模型，内部代号MAI-1、约5000亿参数

据外媒the Information报道，微软正准备推出一种新的、内部 AI 语言模型。新模型内部代号为 MAI-1，由最近加入微软的梅斯塔法・苏莱曼负责，他是谷歌 DeepMind 的联合创始人，也是人工智能初创公司 Inflection 的前 CEO...

大数据 2024-05-07 人工智能

821阅读

终于有人调查了小模型过拟合：三分之二都有数据污染，微软Phi-3、Mixtral 8x22B被点名

当前最火的大模型，竟然三分之二都存在过拟合问题？刚刚出炉的一项研究，让领域内的许多研究者有点意外。提高大型语言模型的推理能力是当前研究的最重要方向之一，而在这类任务中，近期发布的很多小模型看起来表现不错，比如微软 Phi-3、Mistral 8x2...

人工智能 2024-05-06 人工智能

869阅读

开源大模型王座再易主，通义千问1100亿参数拿下SOTA，3个月已推出8款模型

开源大模型，已经开启大卷特卷模式。全球范围，太平洋两岸，双雄格局正在呼之欲出。 Llama 3中杯大杯刚惊艳亮相，国内通义千问就直接开源千亿级参数模型Qwen1.5-110B，一把火上Hacker News榜首。不仅相较于自家720亿参数模型性能明...

AIGC 2024-04-30 人工智能

840阅读

OpenAI神秘搞事，GPT-4.5默默上线？推理碾压GPT-4网友震惊，奥特曼笑而不语

【新智元导读】就在昨夜，整个AI社区都被一个神秘大模型震撼到了:它名为gpt2-chatbot，性能直接超越很多开源模型和GPT-4!网友们展开猜测，有说它是GPT-4.5的，有说是GPT-5的，还有人猜它是GPT-4+Q*，或GPT-2+Q*。奥特曼也卖...

人工智能 2024-04-30 人工智能

843阅读

巨人网络发布2023年报：称将持续研究GiantGPT应用场景

4月29日，巨人网络发布2023年年度报告及2024年一季度报告。报告显示，2023年公司实现营业收入29.24亿元，同比增长43.50%，实现归属于上市公司股东的净利润10.86亿元，同比增长27.67%;实现归属于上市公司股东的扣除非经常性损益的净利...

生成式AI 2024-04-30 人工智能

881阅读

全球最大开源模型再刷爆纪录！4800亿参数MoE击败Llama 3、Mixtral

全球最大开源模型再刷爆纪录！4800亿参数MoE击败Llama 3、Mixtral...

大数据 2024-04-25 人工智能

703阅读

发布几小时，微软秒删媲美GPT-4开源大模型！竟因忘记投毒测试

上周，微软空降了一个堪称GPT-4级别的开源模型WizardLM-2。却没想到发布几小时之后，立马被删除了。有网友突然发现，WizardLM的模型权重、公告帖子全部被删除，并且不再微软集合中，除了提到站点之外，却找不到任何证据证明这个微软的官方项目。...

人工智能 2024-04-23 人工智能

844阅读

微软发布iPhone可运行的ChatGPT级AI模型Phi-3系列挑战OpenAI地位

近日，微软推出了一款名为Phi-3系列的小型AI模型，该模型在AI领域引起了广泛关注。Phi-3系列中的Phi-3-mini模型，仅拥有3.8B参数，却在多项基准测试中超越了拥有8B参数的Llama3模型。微软特别强调，经过4bit量化处理的Phi-3-...

AIGC 2024-04-23 人工智能

834阅读

开源模型打败GPT-4！LLM竞技场最新战报，Cohere Command R+上线

GPT-4又又又被超越了！近日，LLM竞技场更新了战报，人们震惊地发现：居然有一个开源模型干掉了GPT-4！这就是Cohere在一周多前才发布的Command R+。排行榜地址：https://huggingface.co/spaces/lmsy...

人工智能 2024-04-22 人工智能

905阅读

Llama 3每秒输出800个token逼宫openAI！下周奥特曼生日或放出GPT-5？

【新智元导读】Llama3的开源，或将催生数十亿美元新产业。发布不到一周的时间，全网各种测试微调都开启了。甚至，Llama3在Groq上的输出速度实现了每秒800个token。 Llama3诞生之后便艳压群雄，开源界已无「模」能敌。甚至，让网友为Open...

生成式AI 2024-04-22 人工智能

811阅读

Mistral 不相信AGI，开源大模型CEO发出警告，科技带不来“新造的人”

出品 | 51CTO技术栈（微信号：blog51cto） Mistral的首席执行官亚瑟·门施（Arthur Mensch）表示，对于创造通用人工智能的迷恋，其实质是关于“创造上帝”。这位CEO并不相信埃隆·马斯克（Elon Musk）和山姆·奥特曼...

大数据 2024-04-22 人工智能

737阅读