-
苹果大模型MM1入场:参数达到300亿 超半数作者是华人
苹果公司最新发布了一款名为MM1的大型多模态基础模型,拥有300亿参数,采用了MoE架构,并且超过一半的作者是华人。该模型在多模态领域具有重要意义,可能预示着苹果未来推出与此相关的产品。 今年以来,苹果明显加大了对生成式人工智能(GenAI)领域的投入,这...
-
苹果大模型MM1杀入场:300亿参数、多模态、MoE架构,超半数作者是华人
今年以来,苹果显然已经加大了对生成式人工智能(GenAI)的重视和投入。此前在 2024 苹果股东大会上,苹果 CEO 蒂姆・库克表示,今年将在 GenAI 领域实现重大进展。此外,苹果宣布放弃 10 年之久的造车项目之后,一部分造车团队成员也开始转向...
-
直接干到未来!DriveDreamer-2:世界首个自定义驾驶场景流生成,提升50%!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 世界车型在自动驾驶方面表现出了优势,尤其是在多视图驾驶视频的生成方面。然而,在生成自定义驾驶视频方面仍然存在重大挑战。在本文中,我们提出了DriveDreamer-2...
-
首次攻克「图基础模型」三大难题!港大开源OpenGraph:零样本学习适配多种下游任
图学习(Graph Learning)技术能够对复杂的关系数据进行挖掘和学习,在推荐系统、社交网络分析、引用网络和交通网络等多个领域都显示出了巨大的应用价值。 图神经网络(Graph Neural Networks, GNNs)基于迭代的消息传递机制,能...
-
【AIGC调研系列】大模型的system prompt破解方法汇总
本文不提供具体方法,只汇总!!! 大模型的system prompt破解方法主要包括提示注入(prompt injection)、命令注入、提示自动迭代精炼(Prompt Automatic Iterative Refinement, PAIR)等技术。...
-
图技术在 LLM 下的应用:知识图谱驱动的大语言模型 Llama Index
LLM 如火如荼地发展了大半年,各类大模型和相关框架也逐步成型,可被大家应用到业务实际中。在这个过程中,我们可能会遇到一类问题是:现有的哪些数据,如何更好地与 LLM 对接上。像是大家都在用的知识图谱,现在的图谱该如何借助大模型,发挥更大的价值呢? 在本...
-
零一万物发布API开放平台
3月14日,零一万物正式发布 Yi 大模型 API 开放平台,为开发者提供通用 Chat、200k 超长上下文、多模态交互等模型。 同时,零一万物表示,近期零一万物将为开发者提供更多更强模型和 AI 开发框架。主要亮点包括: 推出一系列的模型 API,...
-
大模型的DenseNet时刻!DenseMamba:精度显著提升
本文经自动驾驶之心公众号授权转载,转载请联系出处。 随着 ChatGPT 的突破性进展,大型语言模型(LLMs)迎来了一个崭新的里程碑。这些模型在语言理解、对话交互和逻辑推理方面展现了卓越的性能。过去一年,人们目睹了 LLaMA、ChatGLM 等模型...
-
论文笔记:Code Llama: Open Foundation Models for Code
导语 Code Llama是开源模型Llama 2在代码领域的一个专有模型,作者通过在代码数据集上进行进一步训练得到了了适用于该领域的专有模型,并在测试基准中超过了同等参数规模的其他公开模型。 链接:https://arxiv.org/abs/23...
-
万字带你了解ChatGLM
本文分享自华为云社区《【云驻共创】华为云之昇思MindSpore大模型专题(第二期)-第一课:ChatGLM》,作者: 愚公搬代码。 前言 1.昇思MindSpore 昇思MindSpore是华为公司推出的一款全场景AI计算框架。它提供了自动...
-
用大模型测试人格/抑郁/认知模式!通过游戏剧情发展测量心理特质
心理测量在精神健康、自我了解、和个人发展方面都发挥着重要的作用。 传统的心理测量范式以自我报告类型的问卷为主,常常通过参与者回忆自己的日常生活行为模式或情绪状态进行测量。 这样的测量方式虽然高效便捷,但可能引发参与者的抗拒心理,降低被测意愿。 随着大语言...
-
揭开LLM智慧涌现的面纱:OpenAI开源调试工具Transformer Debugger深入LLM的神经元秘密
在人工智能的浪潮中,大型语言模型(LLM)以其惊人的语言理解和生成能力成为了研究和应用的热点。从简单的文本分类到复杂的自然语言理解,LLM的应用领域不断扩展,涵盖了机器翻译、情感分析、自动摘要、聊天机器人等多个方面。随着模型规模的增长,它们的内部工作机制...
-
Apollo开源轻量级多语言医疗 LLM:助力将医疗 AI 民主化推广至60亿人口
医疗人工智能(AI)技术正在迅速发展,旨在利用大型语言模型(LLMs 的巨大潜力彻底改变医疗保健交付方式。这些技术进步承诺提高诊断准确性,个性化治疗方案,并解锁全面医学知识的获取,从根本上改变患者护理。将 AI 整合到医疗保健中旨在提高医疗服务的效率和精确...
-
OpenAI官宣开源Transformer Debugger!不用写代码,人人可以破解LLM黑箱
AGI真的越来越近了! 为了确保人类不被AI杀死,在解密神经网络/Transfomer黑箱这一方面,OpenAI从未停下脚步。 去年5月,OpenAI团队发布了一个令人震惊的发现:GPT-4竟可以解释GPT-2的三十万神经元! 网友纷纷惊呼,智慧原来是这...
-
Sora是『神笔马良』还是AI怪物?首篇综述一探乾坤!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 Sora是一种文本到视频生成的人工智能模型,由OpenAI于2024年2月发布。该模型经过训练,能够从文本指令中生成逼真或想象的场景视频,并显示出在模拟物理世界方面的潜...
-
仅一行命令本地 CPU 环境快速上手 Google 开源大模型 Gemma
Google Gemma 是什么? 2月底 Google 发布的 Gemma 相比自家的 Gemini 更加轻量级,不仅可以在笔记本电脑上运行,而且还免费可商用,支持中文,相比其他开源在各个方面都占了上风。科技巨头出品、领先地位、全面对外开放、免费可商用...
-
构建本地运行的LLM语音助理
译者 | 朱先忠 审校 | 重楼 引言 我不得不承认,我最初对大型语言模型(LLM)生成实际有效的代码片段的能力持怀疑态度。我抱着最坏的打算尝试了一下,结果我感到很惊喜。就像与聊天机器人的任何互动一样,问题的格式很重要;但随着时间的推移,你会知道如何...
-
人工智能提示指南:天才还是噱头?
每个人都知道,你不应该向《阿拉丁神灯》中的精灵许愿要更多的愿望。但是,当我得到一个拥有令人印象深刻的大型语言模型(LLM)的AI驱动聊天机器人,并且它用它的回答让我感到惊讶时,我还是这样做了。我要求它为我写一个提示指南,将每个提示变成魔法咒语,着迷于让L...
-
LimSim++:多模态大模型在自动驾驶中的新舞台
本文经自动驾驶之心公众号授权转载,转载请联系出处。 论文名称:LimSim++: A Closed-Loop Platform for Deploying Multimodal LLMs in Autonomous Driving 项目主页:https:...
-
前端不存在了?盲测64%的人更喜欢GPT-4V的设计,杨笛一等团队新作
3 月 9 日央视的一档节目上,百度创始人、董事长兼 CEO 李彦宏指出,以后不会存在「程序员」这种职业了,因为只要会说话,人人都会具备程序员的能力。「未来的编程语言只会剩下两种,一种叫做英文,一种叫做中文。」 自大模型技术突破以来,越来越多的行业拥有...
-
DenseMamba:大模型的DenseNet时刻,Mamba和RetNet精度显著提升
随着 ChatGPT 的突破性进展,大型语言模型(LLMs)迎来了一个崭新的里程碑。这些模型在语言理解、对话交互和逻辑推理方面展现了卓越的性能。过去一年,人们目睹了 LLaMA、ChatGLM 等模型的诞生,它们基于 Transformer 架构,采用多...
-
AI芯片创企Taalas获5000万美元融资 定制专用芯片助力AI模型
据外媒SiliconANGLE报道,由Tenstorrent创始人Ljubisa Bajic领导的AI芯片创企Taalas已成功完成两轮共计5000万美元的融资,旨在为特定AI模型打造定制化专用芯片。 图源备注:图片由AI生成,图片授权服务商Midjo...
-
奥特曼重新加入OpenAI董事会,对他被罢免的调查接近尾声
OpenAI上周五宣布了新的董事会,并结束了美国律师事务所WilmerHale对导致OpenAI的首席执行官奥特曼下台的事件的内部调查。 奥特曼也将重新加入OpenAI的董事会。 新的董事会成员包括: •Dr. Sue Desmond-Hellmann...
-
研究表明:AI眼镜将成为取代AR眼镜的“杀手级应用”
随着时间的推移和技术的进步,有些人认为,增强现实(AR 作为技术驱动的概念正在逐渐消失。 有人可能要将这种情况归咎于苹果公司,该公司要求Apple Vision Pro开发者将其应用程序称为空间计算应用程序,不再将应用体验描述为增强现实(AR 、虚拟现...
-
清华系2B模型杀出支持离线本地化部署,可以个人电脑或者手机上部署的多模态大模型,超越 Mistral-7B、LLaMA-13B
清华系2B模型杀出支持离线本地化部署,可以个人电脑或者手机上部署的多模态大模型,超越 Mistral-7B、LLaMA-13B。 2 月 1 日,面壁智能与清华大学自然语言处理实验室共同开源了系列端侧语言大模型 MiniCPM,主体语言模型 Mini...
-
奥特曼老黄齐预测:AGI五年内降临,代替95%工作!但马斯克断言AGI将被电力卡脖子
Claude 3、Sora、Gemini 1.5 Pro的纷纷出现,以及或许今年内就会被放出的GPT-5,让所有人都不约而同地隐隐感觉:我们似乎离AGI似乎越来越近了。 OpenAI CEO Sam Altman坚定地认为,AGI将在5年内实现。 不过,...
-
清华NLP组发布InfLLM:无需额外训练,「1024K超长上下文」100%召回!
大模型只能够记忆与理解有限的上下文已经成为大模型在真实应用中的能力瓶颈,例如对话式AI系统往往无法记忆你前一天对话的内容,利用大模型构建智能体会产生前后不一致的行为与记忆。 为了让大模型能够记忆并处理更长的上下文,来自清华大学、麻省理工学院和人民大学的研...
-
当prompt策略遇上分治算法,南加大、微软让大模型炼成「火眼金睛」
近年来,大语言模型(LLMs)由于其通用的问题处理能力而引起了大量的关注。现有研究表明,适当的提示设计(prompt enginerring),例如思维链(Chain-of-Thoughts),可以解锁 LLM 在不同领域的强大能力。 然而,在处理涉及重...
-
如何管理生成式AI
作者丨Dom Couldwell 编译丨诺亚 出品 | 51CTO技术栈(微信号:blog51cto) 根据麦肯锡公司的估计,生成式人工智能预计每年将为全球经济带来2.6万亿至4.4万亿美元的经济效益。这一预测基于63个新的应用场景,这些场景有望在多个...
-
估值40亿的Pi大更新:性能接近 GPT-4,日均使用时长已经超过 Instagram
当OepnAI和马斯克连日互杠、Google因文化偏见麻烦缠身、号称抢走GPT- 4 王位的Claude3 全力瞄准企业级部署的时候,在另一个角落,致力于「为每个人开发服务型AI」的人工智能初创公司Inflection AI,悄悄更新了他们的聊天机器人Pi...
-
关于大语言模型LLM相关的数据集、预训练模型、提示词、微调的文心一言问答
文章目录 关于大语言模型LLM相关的数据集、预训练模型、提示词、微调的文心一言问答 先总结一下 Q:LLM模型预训练前与提示词关系,LLM模型预训练后与提示词关系 Q:预训练用的数据集与提示词有什么异同 Q:为什么我看到的数据集结构和提示词结...
-
LeCun最新专访:为什么物理世界终将成为LLM的「死穴」?
在人工智能领域,很少有像 Yann LeCun 这样的学者,在 65 岁的年龄还能高度活跃于社交媒体。 一直以来,Yann LeCun 都是以「直言不讳的批评者」形象活跃于人工智能领域。他始终支持开源,并带领 Meta 的团队推出了占据如今开源大模型领域...
-
谷歌工程师硬核长篇预测,证实黄仁勋观点:AGI或在2029年出现,AI五年内通过人类测试
最近,英伟达CEO黄仁勋表示,AI会在五年内通过人类测试,AGI将很快到来! 在斯坦福大学举行的一个经济论坛上,黄仁勋回答了这个问题:人类何时能创造像人类一样思考的计算机? 这也是硅谷的长期目标之一。 老黄是这样回答的:答案很大程度上取决于我们如何定义...
-
Pika放大招:今天起,视频和音效可以“一锅出”了!
就在刚刚,Pika发布了一项新功能: 很抱歉我们之前一直处于静音状态。 今天起,大家可以给视频无缝生成音效了——Sound Effects! 生成的方式有两种: 要么给一句Prompt,描述你想要的声音; 要么直接让Pika根据视频内容自动生成。...
-
【AIGC调研系列】inflection-2.5与其他模型相比的优势和劣势
Inflection -2.5作为一款升级的内部模型,其与其他模型相比的优势主要体现在以下几个方面: 性能提升:Inflection -2.5被认为是世界上最好的语言模型之一,其性能可与GPT-4、Gemini等世界领先的大型语言模型相媲美[1]。这...
-
奥特曼重返OpenAI董事会:看完3万份文件,调查组认定了
特别独立调查委员会发现,在去年 OpenAI 管理层动荡时,首席执行官萨姆・奥特曼(Sam Altman)的行为「不构成强制解雇」,现在他重新加入董事会了。 历时超过 110 天,OpenAI 的宫斗剧现在迎来了盖棺定论的时刻。 没有通用人工智能危机,...
-
大模型在复杂推理任务上潜力如何?多智能体互动框架ThinkThrice玩转剧本杀
剧本杀是一种广受欢迎的多角色扮演侦探游戏,要求玩家扮演不同的角色。通过阅读角色文本、理解各自的故事、搜集线索、以及逻辑推理,玩家们共同努力揭开谜团。游戏角色通常被分为平民和凶手两大类:平民的目标是找出隐藏在他们中间的凶手,而凶手则尽力隐藏自己的身份,避免...
-
用AI短视频「反哺」长视频理解,腾讯MovieLLM框架瞄准电影级连续帧生成
在视频理解这一领域,尽管多模态模型在短视频分析上取得了突破性进展,展现出了较强的理解能力,但当它们面对电影级别的长视频时,却显得力不从心。因而,长视频的分析与理解,特别是对于长达数小时电影内容的理解,成为了当前的一个巨大挑战。 究其原因,导致模型理解长视...
-
怎么劝ChatGPT干活效果最好?我们尝试了100种方法,有图有真相
在 ChatGPT API 中,系统提示是一项很有亮点的功能,它允许开发人员控制 LLM 输出的「角色」,包括特殊规则和限制。系统提示中的命令比用户输入提示中的命令要有效得多,这让开发人员拥有了更大的发挥空间,而不是像现在使用 ChatGPT 网页应用程序...
-
让大模型“瘦身”90%!清华&哈工大提出极限压缩方案:1bit量化,能力同时保留83%
对大模型进行量化、剪枝等压缩操作,是部署时最常见不过的一环了。 不过,这个极限究竟有多大? 清华大学和哈工大的一项联合研究给出的答案是: 90%。 他们提出了大模型1bit极限压缩框架OneBit,首次实现大模型权重压缩超越90%并保留大部分(83%)能力...
-
LLaMA-2 下载&demo使用
LLaMA-2 下载&demo使用 1. LLaMA-2 下载&demo使用 1.1 meta官网 1.2 huggingface 1.3 其他源 1.4 huggingface下载模型和数据加速 1. LLaM...
-
StarCoder 2:GitHub Copilot本地开源LLM替代方案
GitHub CoPilot拥有超过130万付费用户,部署在5万多个组织中,是世界上部署最广泛的人工智能开发工具。使用LLM进行编程辅助工作不仅提高了生产力,而且正在永久性地改变数字原住民开发软件的方式,我也是它的付费用户之一。 低代码/无代码平台将使应...
-
挑战OpenAI的新模型免费上线,40%计算量性能逼近GPT-4
本周四,美国 AI 创业公司 Inflection AI 正式发布新一代大语言模型 Inflection-2.5。 据介绍,Inflection-2.5 将强大的 LLM 能力与 Inflection 标志性的「同理心微调」结合在一起,兼具高情商与高智商...
-
AI初创公司新旦智能完成千万级别天使轮融资 用于发展 xDAN 模型
「新旦智能」是一家新兴的人工智能初创公司,最近完成了千万级的天使轮融资。这轮融资是由全球化人工智能企业 APUS 和 AI 行业资深投资人周弘扬联合投资的。融资资金将用于进一步发展他们的 xDAN 模型,这个模型具有独特的高情商和强大的推理能力,旨在打造新...
-
田渊栋等人新作:突破内存瓶颈,让一块4090预训练7B大模型
上个月,Meta FAIR 田渊栋参与的一项研究广受好评,他们在论文《 MobileLLM: Optimizing Sub-billion Parameter Language Models for On-Device Use Cases》中开始卷 10...
-
今日AI:GPT4强敌Inflection-2.5模型发布;Midjourney要推中国版APP;MovieLLM一句话生成电影
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ ???AI新鲜事 媲美GPT4!...
-
Hume.AI官网体验入口 人工智能情感理解工具使用地址
Hume.AI是一家专注于开发能够理解人类情感和表情的技术的公司。他们提供表情测量API和自定义模型API,以帮助预测和改善人类福祉。无论是研究人员、开发者还是企业,都可以从Hume.AI的技术中受益。 点击前往Hume.AI官网体验入口 Hume.A...
-
神经网络之父Hinton最新公开演讲:数字智能会取代生物智能吗?
Geoffrey Hinton教授,人称“人工智能教父”,他是英国皇家学会院士(FRS ,也是加拿大皇家学会院士( FRSC 和加拿大国家勋章(CC 获得者。 牛津大学于2024年2月19日在谢尔顿剧院举办了年度Romanes讲座,Geoffrey Hi...
-
创建内部大型语言模型(LLM)前必须思考的五个关键问题
译者 | 晶颜 审校 | 重楼 业务领导者一直深感压力,他们需要找到将生成式人工智能(GenAI)纳入其战略的最佳方式,以便为其组织和利益相关者带来最佳收益。根据Gartner的调查,38%的业务领导者指出,客户体验和留存率是他们投资GenAI的主要目的...
-
Inflection-2.5官网体验入口 人工智能个人AI对话聊天模型免费使用地址
Inflection-2.5是Inflection公司推出的升级版个人AI模型,它结合了强大的原始能力和独特的情感微调。该模型在训练时仅使用了GPT- 4 的40%计算资源,但在性能上接近GPT-4。Inflection-2. 5 在编程和数学等智力领域取...