-
X AI 发布Grok-1.5更新:性能显著提升 支持128K上下文长度
昨天,X AI 发布了其最新的大型语言模型更新——Grok-1.5。该版本在编码和与数学相关的任务中表现出了显著的性能提升。 据详细介绍,Grok-1.5在 MATH 基准测试中获得了50.6%的分数,在 GSM8K 基准测试中获得了90%的分数,这标志着...
-
知乎AI革命:智能搜索与实时问答的融合
在生成式人工智能(Generative AI)的信息技术跃迁背景下,如何看待知乎当下和未来,有三个基本的视角: 它是大语言模型预训练中文语料最重要来源之一,例如最近现象级的大模型聊天应用Kimi Chat,就以知乎为重要的训练资料来源(甚至是80%以上的...
-
大型语言模型如何教会自己遵循人类指令?
译者 | 李睿 审校 | 重楼 如今,人们对能够使大型语言模型(LLM 在很少或没有人为干预的情况下改进功能的技术越来越感兴趣。大型语言模型(LLM 自我改进的领域之一是指令微调(IFT ,也就是让大型语言模型教会自己遵循人类指令。 指令微调(IFT ...
-
AI写作的未来:从困惑度与爆发度的视角探索
大家好,小发猫降ai今天来聊聊AI写作的未来:从困惑度与爆发度的视角探索,希望能给大家提供一点参考。降ai辅写 以下是针对论文AI辅写率高的情况,提供一些修改建议和技巧,可以借助此类工具: 还有: AI写作的未来:从困惑度与爆发度的视角探索...
-
(给自己挖坑中)一些还比较有趣的AIGC开源项目和部署教程
文章目录 一、开源项目 二、部署情况 三、问题总结 一、开源项目 https://www.naviai.cn/ AI 导航站 | 收录了国内外2000+优质AI工具,人工智能工具和模型的介绍及链接 https://zhuanla...
-
【AIGC调研系列】AIGC企业级模型Command-R介绍
Command-R与其他大语言模型的主要区别在于其专为企业级应用设计,特别是在检索增强生成(RAG)和工具使用方面。Command-R是一个350亿参数的高性能生成模型,具有开放式权重,能够支持多种用例,包括推理、摘要和问答[2]。它特别针对大规模生产工作...
-
今日Arxiv最热NLP大模型论文:Llama-2上下文扩大48倍的方法来了,港大发布,无需训练
引言:大语言模型的长上下文理解能力 在当今的人工智能领域,大语言模型(Large Language Models,简称LLMs)的长上下文理解能力成为了一个重要的研究方向。这种能力对于模型来说至关重要,因为它使得LLMs能够有效地应对各种应用场景,例如在...
-
和 GPT-4 并列第一,LMSYS 基准测试显示 Claude-3 模型表现优异
3 月 28 日消息,根据 LMSYS Org 公布的最新基准测试报告,Claude-3 得分以微弱优势超越 GPT-4,成为该平台“最佳”大语言模型。 IT之家首先介绍下 LMSYS Org,该机构是由加州大学伯克利分校、加州大学圣地亚哥分校和卡内...
-
DBRX抢占开源大模型王座 编程、数学等领域超越GPT-3.5
最新开源大语言模型DBRX以其惊人的1320亿参数量成为业界新宠。该模型不仅在语言理解、编程和数学等方面超越了业内领先的开源模型,还在效率上有所突破。DBRX的基础和微调版本均已发布,为研究和商业应用提供了丰富的资源。 GitHub 链接:https:/...
-
Zscaler发现企业AI采用率在不到一年的时间里飙升了600%,将数据置于风险之中
企业对AI/ML工具的依赖激增近 600%,从 2023年4月的5.21亿笔交易激增至2024年1月的每月31亿笔。对安全性的高度关注导致了所有AI/ML交易中有18.5%被阻止,仅在九个月内就增长了577%。 CISO及确保企业安全的人员有充分的理...
-
Hume AI发布对话AI——EVI:具备情感感知能力
Hume AI近日发布了一款具有情感感知能力的对话AI:EVI,这款产品采用了一种被称为情感大语言模型(eLLM)的多模态生成AI技术。 情感大语言模型(eLLM)是一种结合了大型语言模型(LLMs 的语言理解能力和表情测量技术的情感感知能力的新技术。这种...
-
深夜里,女朋友给我讲解AI大语言模型的技术原理,搞得我又失眠了
随着ChatGPT的横空出世,各种大模型如雨后春笋一般涌现。女朋友最近研究了大模型,准备深夜给我讲解技术原理。可是我真的好困啊,但她说,AI最近那么火,你确定不想学习下吗? 她说,大语言模型是一种人工智能技术,它可以理解和生成人类语言。这种模型的技术原...
-
谷歌推出”自我发现“框架,极大增强GPT-4等大模型推理能力
随着ChatGPT的出现,大语言模型在生成连贯文本和遵循指令方面获得了巨大技术突破。然后在推理和解决复杂内容方面,面临内容不准确、安全等难题。 谷歌Deepmind和南加州大学的研究人员提出了“SELF-DISCOVER”。这是一种用于大语言模型的通用框架...
-
前谷歌工程师创业造AI芯片,要比英伟达好十倍!已融资2500万美元
3月28日消息,英伟达在AI芯片市场的主导地位激发了其他公司自主设计芯片的决心。尽管从头开始设计芯片充满挑战,耗时多年且成本高昂,通常以失败告终,但人工智能的巨大潜力驱使业界人士勇敢尝试。 在这一背景下,两位前谷歌工程师共同创立了MatX。他们利用在谷...
-
【关注】国内外经典大模型(ChatGPT、LLaMA、Gemini、DALL·E、Midjourney、文心一言、千问等
以ChatGPT、LLaMA、Gemini、DALL·E、Midjourney、Stable Diffusion、星火大模型、文心一言、千问为代表AI大语言模型带来了新一波人工智能浪潮,可以面向科研选题、思维导图、数据清洗、统计分析、高级编程、代码调试、算...
-
Video-LLaMa:利用多模态增强对视频内容理解
在数字时代,视频已经成为一种主要的内容形式。但是理解和解释视频内容是一项复杂的任务,不仅需要视觉和听觉信号的整合,还需要处理上下文的时间序列的能力。本文将重点介绍称为video - llama的多模态框架。Video-LLaMA旨在使LLM能够理解视频中的...
-
近屿智能成功完成A轮融资,打造独家AIGC工程师与产品经理学习路径图引发热议
近屿智能OJAC的发展历程与行业实力 在2024年1月,上海近屿智能科技有限公司(简称近屿智能)宣布成功完成A轮融资。智望资本作为领头投资者,金沙江创投也参与了增资。这一里程碑事件不仅突显了近屿智能在人力资源技术领域的领先地位,也显示了投资者对其技术实力...
-
银行业中GenAI的规模化应用:选择优秀运营模式
GenAI正在给银行业带来革命性的变化,因为金融机构使用这项技术来为面向客户的聊天机器人增压,防止欺诈,并加快开发代码、准备推荐书草稿和汇总监管报告等耗时的任务。 麦肯锡全球研究所估计,在整个全球银行业,GenAI每年可增加2000亿至3400亿美元的...
-
智能体DS-Agent基于案例推理,让GPT-4数据科学任务接近100%
在大数据时代,数据科学覆盖了从数据中挖掘见解的全周期,包括数据收集、处理、建模、预测等关键环节。鉴于数据科学项目的复杂本质以及对人类专家知识的深度依赖,自动化在改变数据科学范式方面拥有极大的发展空间。随着生成式预训练语言模型的兴起,让大语言模型智能体处理...
-
Grammarly AI推出新AI功能,想用户提供智能建议
Grammarly近日推出了一项新的AI功能,旨在在您发送之前审查您的商业写作,并提供“战略性建议”,以使您的消息更清晰、更具影响力。无论您是在Gmail标签、文字处理器还是像Slack这样的聊天工具中撰写,这一新功能都旨在检测您何时大致完成一篇商业写作。...
-
CLIP-BEVFormer:显式监督BEVFormer结构,提升长尾检测性能
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 目前,在整个自动驾驶系统当中,感知模块扮演了其中至关重要的角色,行驶在道路上的自动驾驶车辆只有通过感知模块获得到准确的感知结果后,才能让自动驾驶系统中的下游规控模块做...
-
CIO分享:如何在企业中驾驭生成式AI
生成式AI正在大规模地为企业敞开创新的大门,但在这个新时代,高管层必须仔细监督对生成式AI的采用,以保证代码质量并减轻技术债务。 生成式AI在起步阶段就已经改变组织并且给IT战略带来了深刻的影响。但是,虽然大型语言模型加速了工程敏捷性,但也打开了一道闸...
-
等不及公开了!最新Sora模型细节揭秘:预计峰值需要72万块H100!每月至少4200块H100!缩放定律依旧有效!
作者 | Matthias·Plappert 翻译 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) OpenAI的Sora模型能够生成各种场景的极其逼真的视频,令世界惊叹不已。除了一篇公开的技术报告和TikTok上放出的酷炫视频,就...
-
清华和微软联合起来对提示词下手了!直接缩短80%,跟大模型对话的头疼系数直线下降!变相扩大了上下文窗口!
出品 | 51CTO技术栈(微信号:blog51cto) 想一下,现在普通人调用个大模型有多别扭,你得一个个上传文件,然后再告诉它自己想要什么样的输出,最好给它一套优秀的模版,它才能给出个像样的回答。 这就好比你自己的大脑都快想出答案来了,它只不过是帮...
-
苹果再发多模态论文!陪我们走过十年的“Hey Siri”会被更智能的交互方式取代吗?
编辑 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto) 全面发力AI的苹果,再出新研究! 随着人工智能技术的发展,我们熟悉的“Hey Siri”或将成为历史。 苹果团队最新出炉的论文《利用大型语言模型进行设备指向性语音检测的多模...
-
Stability AI发布最新代码模型升级版本Stable Code Instruct 3B
Stability AI 在昨晚发布了其最新的代码模型升级版本——Stable Code Instruct3B。这一开源项目是继之前工作的延续,暗示着SD3模型的开源发布应该能够顺利进行,尽管后续模型的发展情况还不太明朗。 这个模型以3B的规模提供了业界领...
-
AIGC实战——Transformer模型
AIGC实战——Transformer模型 0. 前言 1. T5 2. GPT-3 和 GPT-4 3. ChatGPT 小结 系列链接 0. 前言 我们在 GPT (Generative Pre-trained Transfo...
-
突破性的百万级视频和语言世界模型:Large World Model~
本文经自动驾驶之心公众号授权转载,转载请联系出处。 在探索如何让AI更好地理解世界方面,最近的一项突破性研究引起了广泛关注。来自加州大学伯克利分校的研究团队发布了“Large World Model, LWM”,能够同时处理百万级长度的视频和语言序列,...
-
在Raspberry Pi上运行本地LLM和VLM
译者 | 朱先忠 审校 | 重楼 在树莓派上使用Ollama的本地LLM和VLM(作者本人提供照片) 前言 有没有想过在自己的设备上运行自己的大型语言模型(LLM)或视觉语言模型(VLM)?你可能想过,但一想到从头开始设置,必须管理有关环境,还要下载正...
-
新研究:大语言模型“涌现”能力不令人惊讶也不难预测
3月26日消息,一项新的研究认为,大语言模型性能的显著提升并不令人意外,也并非无法预测,实际上这是由我们衡量人工智能性能的方式所决定的。 两年前,450位研究人员在一个名为超越模仿游戏基准(Beyond the Imitation Game Bench...
-
通用图大模型HiGPT:一己之力建模任何图结构关系!来自港大数据智能实验室&百度
一个模型建模所有图结构关系—— 香港大学数据智能实验室最新图结构大模型来了。 它叫HiGPT,由GraphGPT原班人马打造。 后者是将图数据与大模型结合的代表方法之一: 通过用图指令微调将图数据与大模型对齐,在下游任务上一度彰显了惊人的泛化性(Zero...
-
利用MindsDB和Anyscale微调Mistral 7B模型
在我们为面向客户的聊天应用制作大语言模型 (LLM 时,预训练模型往往是很好的起点,但随着时间的推移,您可能希望去控制该模型聊天的整体行为和给客户带去的“感觉”,而不仅仅由基本模型所能提供。对此,我们虽然可以通过提示工程(prompt engineeri...
-
3D版Sora来了?UMass、MIT等提出3D世界模型,具身智能机器人实现新里程碑
在最近的研究中,视觉-语言-动作(VLA,vision-language-action)模型的输入基本都是2D数据,没有集成更通用的3D物理世界。 此外,现有的模型通过学习「感知到动作的直接映射」来进行动作预测,忽略了世界的动态性,以及动作和动态之间的关...
-
公司即将在AI上浪费数十亿美元,如何避免成为其中之一
“这是风险投资,不是冒险资金。”这是一位亲爱的朋友曾经在提出一个想法时从一位风投那里得到的充满爱意的回应,但当我们处于一项新技术的炒作周期阶段时,这种谨慎就不复存在了。毕竟,风投公司必须动用他们筹集的所有资金,错过一家大公司的成本要高于摇摆和错失的负面...
-
讨论下一个token预测时,我们可能正在走进陷阱
自香农在《通信的数学原理》一书中提出「下一个 token 预测任务」之后,这一概念逐渐成为现代语言模型的核心部分。最近,围绕下一个 token 预测的讨论日趋激烈。 然而,越来越多的人认为,以下一个 token 的预测为目标只能得到一个优秀的「即兴表演艺...
-
预见AI的下一个十年!从Suleyman到LeCun,三位大佬坐而论道:颠覆医疗保健业、图灵测试升级、AI与物理世界交融
编译丨诺亚 出品 | 51CTO技术栈(微信号:blog51cto) 近日,人工智能界三位大佬聚首了! 一位是最近“跳槽”微软的Inflection AI 联合创始人 Mustafa Suleyman、一位是Cohere的联合创始人兼首席执行官Aida...
-
离职谷歌的Transformer作者创业,连发3个模型(附技术报告)
去年 8 月,两位著名的前谷歌研究人员 David Ha、Llion Jones 宣布创立一家人工智能公司 Sakana AI,总部位于日本东京。其中,Llion Jones 是谷歌 2017 年经典研究论文《Attention is all you n...
-
使用GaLore在本地GPU进行高效的LLM调优
训练大型语言模型(llm ,即使是那些“只有”70亿个参数的模型,也是一项计算密集型的任务。这种水平的训练需要的资源超出了大多数个人爱好者的能力范围。为了弥补这一差距,出现了低秩适应(LoRA 等参数高效方法,可以在消费级gpu上对大量模型进行微调。 G...
-
清华微软开源全新提示词压缩工具,长度骤降80%!GitHub怒砍3.1K星
在自然语言处理中,有很多信息其实是重复的。 如果能将提示词进行有效地压缩,某种程度上也相当于扩大了模型支持上下文的长度。 现有的信息熵方法是通过删除某些词或短语来减少这种冗余。 然而,作为依据的信息熵仅仅考虑了文本的单向上下文,进而可能会遗漏对于压缩至关...
-
通用文档理解新SOTA,多模态大模型TextMonkey来了
最近,华中科技大学和金山的研究人员在多模态大模型 Monkey [1](Li et al., CVPR2024)工作的基础上提出 TextMonkey。在多个场景文本和文档的测试基准中,TextMonkey 处于国际领先地位,有潜力带来办公自动化、智慧教...
-
文心一言使用指南
文心一言是一款由百度推出的大语言模型,基于百度自主研发的知识和语义理解技术。以下是文心一言的使用指南: 1. 注册登录:首先,你需要注册并登录百度账号。如果你已经拥有百度账号,可以直接登录。 2. 创建实例:在百度AI开放平台(***/),选择“产品服...
-
AIGC 实战:Ollama 和 Hugging Face 是什么关系?
HuggingFace(拥抱脸)和Ollama都与**大型语言模型(LLMs)**有关,但它们的用途不同: HuggingFace: HuggingFace 是一个知名的平台,提供各种预训练的LLMs,包括流行的模型如GPT-3、BERT和...
-
Stable Diffusion老板也跑了!核心研发已集体辞职,“稳定AI”乱成一锅粥
好突然! 就在今天,Stability AI CEO宣布辞职了。 Emad Mostaque,既不再担任CEO,公司董事会也退出。 消息一出,大伙都无比震惊。 据悉,首席运营官Shan Shan Wong和首席技术官Christian Laforte...
-
基于腾讯云高性能应用服务HAI,快速搭建AI绘画环境介绍
目录 1、什么是HAI服务 2、HAI服务的优势 2.1 简单易用 2.2 快速部署 2.3 灵活性高 2.4 多种使用方式 2.5 算力种类丰富 3、应用场景 3.1 AI 作画 3.2 AI 写...
-
文心一言里面的内容会重复吗
大家好,今天来聊聊文心一言里面的内容会重复吗,希望能给大家提供一点参考。 以下是针对论文重复率高的情况,提供一些修改建议和技巧,可以借助此类工具: 文心一言里面的内容会重复吗 一、引言 随着人工智能技术的不断发展,文心一言作...
-
LangChain+llama.cpp+llama-cpp-python工程学习笔记(一)
LangChain 是一个开发由语言模型驱动的应用程序的框架,有以下特性。 数据感知 : 将语言模型连接到其他数据源 具有代理性质 : 允许语言模型与其环境交互 pip install langchain 报错ERROR: Could not...
-
苹果为了AI,上了谷歌的船
这几天,苹果公司CEO蒂姆·库克现身上海,成了各大社交媒体的焦点事件。 除了和男演员郑恺在上海外滩漫步并品尝传统上海早餐、参加苹果公司在上海的第8家直营店“Apple静安店”的揭幕仪式外,库克还接受了媒体的采访,赞扬了中国地区的苹果供应链。 最受人关注的是...
-
【八股】2024春招八股复习笔记1(搜索推荐、AIGC)
【八股】2024春招八股复习笔记1(搜索推荐、AIGC) 文章目录 1、推荐系统 1.1 推荐系统流程 1.2 协同过滤 、 矩阵分解 1.3 逻辑回归 2、算法常识(应用算法) 2.1 重点复习 xgboost 2.2 大模型 t...
-
一图揽尽全球LLM崛起之路;LLM概念速查清单;DALL·E提示词红宝书·在线版;fast.ai新课带你从零实现Stable Diffusion | ShowM
👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦! 👀 LLM 崛起之路:全球大语言模型「规模增长」可视化交互图 informationisbeautiful.net/visualizati…...
-
OpenAI CEO 表示GPT-5的发布将带来令人激动的事情
一年前,OpenAI 公司发布了当时最先进的人工智能模型 GPT-4,让人们惊叹不已。自那时起,人们都在猜测下一个版本 GPT-5何时发布,期待它带来的重大飞跃。尽管 OpenAI 公司的首席执行官 Sam Altman 迄今尚未透露任何消息,但本周我们首...