-
3分钟学会写文心一言指令
码到三十五 : 个人主页 心中有诗画,指尖舞代码,目光览世界,步履越千山,人间尽值得 ! 文心一言是百度研发的 人工智能大语言模型产品,能够通过上一句话,预测生成下一段话。 任何人都可以通过输入【指令】和文心一言进行对...
-
AIGC|Agentbot的构建实践
最近这几个月,智能体这一概念逐渐进入人们的视野并受到广泛讨论,各智能体和类智能体项目层出不穷。智能体不断被冠以“大模型下半场”,“软件2.0”等等称号,被认为是迈向通用人工智能的一大步,BabyGPT, AutoGPT等实验性产品相继出新。不满足于现在的聊...
-
AI写作的困惑与突破:深度探索其可能性与局限性
大家好,小发猫降重今天来聊聊AI写作的困惑与突破:深度探索其可能性与局限性,希望能给大家提供一点参考。 以下是针对论文重复率高的情况,提供一些修改建议和技巧,可以借助此类工具: AI写作的困惑与突破:深度探索其可能性与局限性 随着人工智能技术的飞...
-
AI绘画Imagen大力出奇迹生成图像
AI绘画Imagen大力出奇迹生成图像 介绍 Imagen是一个文本到图像的扩散模型,由Google大脑团队研究所开发。 Imagen通过创新的设计,摈弃了需要预训练视觉-语言模型的繁琐步骤,直接采用了T5等大规模语言模型作为文...
-
AI漫画自动生成器Al Comic Factory 支持批量生成不同语言的漫画
Al Comic Factory是一个独特的项目,它运用先进的技术自动生成具有情感和故事性的漫画内容。这个项目的核心是大型语言模型和SDXL技术,它们共同工作,根据用户提供的简单文本提示,自动创建出包含人物对话和场景描述的漫画。 项目地址:https:/...
-
AI写作辅写疑似度查看方法:从困惑度到爆发度的探索
大家好,小发猫降重今天来聊聊AI写作辅写疑似度查看方法:从困惑度到爆发度的探索,希望能给大家提供一点参考。 以下是针对论文重复率高的情况,提供一些修改建议和技巧,可以借助此类工具: AI写作辅写疑似度查看方法:从困惑度到爆发度的探索 在AI写作的...
-
生成式AI为什么受到各行业追捧?
生成式AI是人类一种人工智能技术,可以生成各种类型的内容,包括文本、图像、音频和合成数据。那么什么是人工智能?人工智能和机器学习之间的区别是什么? 人工智能是一门学科,是计算机科学的一个分支,研究智能代理的创建,这些智能代理是可以推理、学习和自主行动的...
-
如何开始定制你自己的大型语言模型
2023年的大型语言模型领域经历了许多快速的发展和创新,发展出了更大的模型规模并且获得了更好的性能,那么我们普通用户是否可以定制我们需要的大型语言模型呢? 首先你需要有硬件的资源,对于硬件来说有2个路径可以选。高性能和低性能,这里的区别就是是功率,因为精...
-
Hume AI EVI对话人工智能体验入口 情感大语言模型eLLM使用地址
Hume.AI专注于开发能够理解人类情感和表情的技术,提供表情测量API和自定义模型API,以预测和改善人类福祉。近日发布的EVI是一款具有情感感知能力的对话AI,采用了情感大语言模型(eLLM)技术。 点击前往Hume.AI EVI体验入口 谁可以从H...
-
密传!苹果牵手Anthropic,加码iOS 18,挑战ChatGPT!
整理丨诺亚 出品 | 51CTO技术栈(微信号:blog51cto) 苹果公司被广泛传言正在与多家人工智能公司进行接洽,其中包括OpenAI、谷歌以及谷歌支持的创业公司Anthropic,旨在为预计今年晚些时候推出的iOS 18提供一系列全新AI特性支撑...
-
DeepMind终结大模型幻觉?标注事实比人类靠谱、还便宜20倍,全开源
DeepMind 这篇论文一出,人类标注者的饭碗也要被砸了吗? 大模型的幻觉终于要终结了? 今日,社媒平台 reddit 上的一则帖子引起网友热议。帖子讨论的是谷歌 DeepMind 昨日提交的一篇论文《Long-form factuality in la...
-
伊克罗德信息与墨奇科技战略合作,共创生成式AI新未来
3月28日伊克罗德信息在北京举办“AI引领未来 探索大模型世界”活动,与墨奇科技、亚马逊云科技共同探讨生成式AI与向量数据库大力量,并与大家共同探讨人工智能大模型在各个行业的创新应用,为企业实现更高效、创新的数智化转型! 活动现场,伊克罗德信息与墨奇科技...
-
X AI 发布Grok-1.5更新:性能显著提升 支持128K上下文长度
昨天,X AI 发布了其最新的大型语言模型更新——Grok-1.5。该版本在编码和与数学相关的任务中表现出了显著的性能提升。 据详细介绍,Grok-1.5在 MATH 基准测试中获得了50.6%的分数,在 GSM8K 基准测试中获得了90%的分数,这标志着...
-
知乎AI革命:智能搜索与实时问答的融合
在生成式人工智能(Generative AI)的信息技术跃迁背景下,如何看待知乎当下和未来,有三个基本的视角: 它是大语言模型预训练中文语料最重要来源之一,例如最近现象级的大模型聊天应用Kimi Chat,就以知乎为重要的训练资料来源(甚至是80%以上的...
-
大型语言模型如何教会自己遵循人类指令?
译者 | 李睿 审校 | 重楼 如今,人们对能够使大型语言模型(LLM 在很少或没有人为干预的情况下改进功能的技术越来越感兴趣。大型语言模型(LLM 自我改进的领域之一是指令微调(IFT ,也就是让大型语言模型教会自己遵循人类指令。 指令微调(IFT ...
-
AI写作的未来:从困惑度与爆发度的视角探索
大家好,小发猫降ai今天来聊聊AI写作的未来:从困惑度与爆发度的视角探索,希望能给大家提供一点参考。降ai辅写 以下是针对论文AI辅写率高的情况,提供一些修改建议和技巧,可以借助此类工具: 还有: AI写作的未来:从困惑度与爆发度的视角探索...
-
(给自己挖坑中)一些还比较有趣的AIGC开源项目和部署教程
文章目录 一、开源项目 二、部署情况 三、问题总结 一、开源项目 https://www.naviai.cn/ AI 导航站 | 收录了国内外2000+优质AI工具,人工智能工具和模型的介绍及链接 https://zhuanla...
-
【AIGC调研系列】AIGC企业级模型Command-R介绍
Command-R与其他大语言模型的主要区别在于其专为企业级应用设计,特别是在检索增强生成(RAG)和工具使用方面。Command-R是一个350亿参数的高性能生成模型,具有开放式权重,能够支持多种用例,包括推理、摘要和问答[2]。它特别针对大规模生产工作...
-
今日Arxiv最热NLP大模型论文:Llama-2上下文扩大48倍的方法来了,港大发布,无需训练
引言:大语言模型的长上下文理解能力 在当今的人工智能领域,大语言模型(Large Language Models,简称LLMs)的长上下文理解能力成为了一个重要的研究方向。这种能力对于模型来说至关重要,因为它使得LLMs能够有效地应对各种应用场景,例如在...
-
和 GPT-4 并列第一,LMSYS 基准测试显示 Claude-3 模型表现优异
3 月 28 日消息,根据 LMSYS Org 公布的最新基准测试报告,Claude-3 得分以微弱优势超越 GPT-4,成为该平台“最佳”大语言模型。 IT之家首先介绍下 LMSYS Org,该机构是由加州大学伯克利分校、加州大学圣地亚哥分校和卡内...
-
DBRX抢占开源大模型王座 编程、数学等领域超越GPT-3.5
最新开源大语言模型DBRX以其惊人的1320亿参数量成为业界新宠。该模型不仅在语言理解、编程和数学等方面超越了业内领先的开源模型,还在效率上有所突破。DBRX的基础和微调版本均已发布,为研究和商业应用提供了丰富的资源。 GitHub 链接:https:/...
-
Zscaler发现企业AI采用率在不到一年的时间里飙升了600%,将数据置于风险之中
企业对AI/ML工具的依赖激增近 600%,从 2023年4月的5.21亿笔交易激增至2024年1月的每月31亿笔。对安全性的高度关注导致了所有AI/ML交易中有18.5%被阻止,仅在九个月内就增长了577%。 CISO及确保企业安全的人员有充分的理...
-
Hume AI发布对话AI——EVI:具备情感感知能力
Hume AI近日发布了一款具有情感感知能力的对话AI:EVI,这款产品采用了一种被称为情感大语言模型(eLLM)的多模态生成AI技术。 情感大语言模型(eLLM)是一种结合了大型语言模型(LLMs 的语言理解能力和表情测量技术的情感感知能力的新技术。这种...
-
深夜里,女朋友给我讲解AI大语言模型的技术原理,搞得我又失眠了
随着ChatGPT的横空出世,各种大模型如雨后春笋一般涌现。女朋友最近研究了大模型,准备深夜给我讲解技术原理。可是我真的好困啊,但她说,AI最近那么火,你确定不想学习下吗? 她说,大语言模型是一种人工智能技术,它可以理解和生成人类语言。这种模型的技术原...
-
谷歌推出”自我发现“框架,极大增强GPT-4等大模型推理能力
随着ChatGPT的出现,大语言模型在生成连贯文本和遵循指令方面获得了巨大技术突破。然后在推理和解决复杂内容方面,面临内容不准确、安全等难题。 谷歌Deepmind和南加州大学的研究人员提出了“SELF-DISCOVER”。这是一种用于大语言模型的通用框架...
-
前谷歌工程师创业造AI芯片,要比英伟达好十倍!已融资2500万美元
3月28日消息,英伟达在AI芯片市场的主导地位激发了其他公司自主设计芯片的决心。尽管从头开始设计芯片充满挑战,耗时多年且成本高昂,通常以失败告终,但人工智能的巨大潜力驱使业界人士勇敢尝试。 在这一背景下,两位前谷歌工程师共同创立了MatX。他们利用在谷...
-
【关注】国内外经典大模型(ChatGPT、LLaMA、Gemini、DALL·E、Midjourney、文心一言、千问等
以ChatGPT、LLaMA、Gemini、DALL·E、Midjourney、Stable Diffusion、星火大模型、文心一言、千问为代表AI大语言模型带来了新一波人工智能浪潮,可以面向科研选题、思维导图、数据清洗、统计分析、高级编程、代码调试、算...
-
Video-LLaMa:利用多模态增强对视频内容理解
在数字时代,视频已经成为一种主要的内容形式。但是理解和解释视频内容是一项复杂的任务,不仅需要视觉和听觉信号的整合,还需要处理上下文的时间序列的能力。本文将重点介绍称为video - llama的多模态框架。Video-LLaMA旨在使LLM能够理解视频中的...
-
近屿智能成功完成A轮融资,打造独家AIGC工程师与产品经理学习路径图引发热议
近屿智能OJAC的发展历程与行业实力 在2024年1月,上海近屿智能科技有限公司(简称近屿智能)宣布成功完成A轮融资。智望资本作为领头投资者,金沙江创投也参与了增资。这一里程碑事件不仅突显了近屿智能在人力资源技术领域的领先地位,也显示了投资者对其技术实力...
-
银行业中GenAI的规模化应用:选择优秀运营模式
GenAI正在给银行业带来革命性的变化,因为金融机构使用这项技术来为面向客户的聊天机器人增压,防止欺诈,并加快开发代码、准备推荐书草稿和汇总监管报告等耗时的任务。 麦肯锡全球研究所估计,在整个全球银行业,GenAI每年可增加2000亿至3400亿美元的...
-
智能体DS-Agent基于案例推理,让GPT-4数据科学任务接近100%
在大数据时代,数据科学覆盖了从数据中挖掘见解的全周期,包括数据收集、处理、建模、预测等关键环节。鉴于数据科学项目的复杂本质以及对人类专家知识的深度依赖,自动化在改变数据科学范式方面拥有极大的发展空间。随着生成式预训练语言模型的兴起,让大语言模型智能体处理...
-
Grammarly AI推出新AI功能,想用户提供智能建议
Grammarly近日推出了一项新的AI功能,旨在在您发送之前审查您的商业写作,并提供“战略性建议”,以使您的消息更清晰、更具影响力。无论您是在Gmail标签、文字处理器还是像Slack这样的聊天工具中撰写,这一新功能都旨在检测您何时大致完成一篇商业写作。...
-
CLIP-BEVFormer:显式监督BEVFormer结构,提升长尾检测性能
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 目前,在整个自动驾驶系统当中,感知模块扮演了其中至关重要的角色,行驶在道路上的自动驾驶车辆只有通过感知模块获得到准确的感知结果后,才能让自动驾驶系统中的下游规控模块做...
-
CIO分享:如何在企业中驾驭生成式AI
生成式AI正在大规模地为企业敞开创新的大门,但在这个新时代,高管层必须仔细监督对生成式AI的采用,以保证代码质量并减轻技术债务。 生成式AI在起步阶段就已经改变组织并且给IT战略带来了深刻的影响。但是,虽然大型语言模型加速了工程敏捷性,但也打开了一道闸...
-
等不及公开了!最新Sora模型细节揭秘:预计峰值需要72万块H100!每月至少4200块H100!缩放定律依旧有效!
作者 | Matthias·Plappert 翻译 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) OpenAI的Sora模型能够生成各种场景的极其逼真的视频,令世界惊叹不已。除了一篇公开的技术报告和TikTok上放出的酷炫视频,就...
-
清华和微软联合起来对提示词下手了!直接缩短80%,跟大模型对话的头疼系数直线下降!变相扩大了上下文窗口!
出品 | 51CTO技术栈(微信号:blog51cto) 想一下,现在普通人调用个大模型有多别扭,你得一个个上传文件,然后再告诉它自己想要什么样的输出,最好给它一套优秀的模版,它才能给出个像样的回答。 这就好比你自己的大脑都快想出答案来了,它只不过是帮...
-
苹果再发多模态论文!陪我们走过十年的“Hey Siri”会被更智能的交互方式取代吗?
编辑 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto) 全面发力AI的苹果,再出新研究! 随着人工智能技术的发展,我们熟悉的“Hey Siri”或将成为历史。 苹果团队最新出炉的论文《利用大型语言模型进行设备指向性语音检测的多模...
-
Stability AI发布最新代码模型升级版本Stable Code Instruct 3B
Stability AI 在昨晚发布了其最新的代码模型升级版本——Stable Code Instruct3B。这一开源项目是继之前工作的延续,暗示着SD3模型的开源发布应该能够顺利进行,尽管后续模型的发展情况还不太明朗。 这个模型以3B的规模提供了业界领...
-
AIGC实战——Transformer模型
AIGC实战——Transformer模型 0. 前言 1. T5 2. GPT-3 和 GPT-4 3. ChatGPT 小结 系列链接 0. 前言 我们在 GPT (Generative Pre-trained Transfo...
-
突破性的百万级视频和语言世界模型:Large World Model~
本文经自动驾驶之心公众号授权转载,转载请联系出处。 在探索如何让AI更好地理解世界方面,最近的一项突破性研究引起了广泛关注。来自加州大学伯克利分校的研究团队发布了“Large World Model, LWM”,能够同时处理百万级长度的视频和语言序列,...
-
在Raspberry Pi上运行本地LLM和VLM
译者 | 朱先忠 审校 | 重楼 在树莓派上使用Ollama的本地LLM和VLM(作者本人提供照片) 前言 有没有想过在自己的设备上运行自己的大型语言模型(LLM)或视觉语言模型(VLM)?你可能想过,但一想到从头开始设置,必须管理有关环境,还要下载正...
-
新研究:大语言模型“涌现”能力不令人惊讶也不难预测
3月26日消息,一项新的研究认为,大语言模型性能的显著提升并不令人意外,也并非无法预测,实际上这是由我们衡量人工智能性能的方式所决定的。 两年前,450位研究人员在一个名为超越模仿游戏基准(Beyond the Imitation Game Bench...
-
通用图大模型HiGPT:一己之力建模任何图结构关系!来自港大数据智能实验室&百度
一个模型建模所有图结构关系—— 香港大学数据智能实验室最新图结构大模型来了。 它叫HiGPT,由GraphGPT原班人马打造。 后者是将图数据与大模型结合的代表方法之一: 通过用图指令微调将图数据与大模型对齐,在下游任务上一度彰显了惊人的泛化性(Zero...
-
利用MindsDB和Anyscale微调Mistral 7B模型
在我们为面向客户的聊天应用制作大语言模型 (LLM 时,预训练模型往往是很好的起点,但随着时间的推移,您可能希望去控制该模型聊天的整体行为和给客户带去的“感觉”,而不仅仅由基本模型所能提供。对此,我们虽然可以通过提示工程(prompt engineeri...
-
3D版Sora来了?UMass、MIT等提出3D世界模型,具身智能机器人实现新里程碑
在最近的研究中,视觉-语言-动作(VLA,vision-language-action)模型的输入基本都是2D数据,没有集成更通用的3D物理世界。 此外,现有的模型通过学习「感知到动作的直接映射」来进行动作预测,忽略了世界的动态性,以及动作和动态之间的关...
-
公司即将在AI上浪费数十亿美元,如何避免成为其中之一
“这是风险投资,不是冒险资金。”这是一位亲爱的朋友曾经在提出一个想法时从一位风投那里得到的充满爱意的回应,但当我们处于一项新技术的炒作周期阶段时,这种谨慎就不复存在了。毕竟,风投公司必须动用他们筹集的所有资金,错过一家大公司的成本要高于摇摆和错失的负面...
-
讨论下一个token预测时,我们可能正在走进陷阱
自香农在《通信的数学原理》一书中提出「下一个 token 预测任务」之后,这一概念逐渐成为现代语言模型的核心部分。最近,围绕下一个 token 预测的讨论日趋激烈。 然而,越来越多的人认为,以下一个 token 的预测为目标只能得到一个优秀的「即兴表演艺...
-
预见AI的下一个十年!从Suleyman到LeCun,三位大佬坐而论道:颠覆医疗保健业、图灵测试升级、AI与物理世界交融
编译丨诺亚 出品 | 51CTO技术栈(微信号:blog51cto) 近日,人工智能界三位大佬聚首了! 一位是最近“跳槽”微软的Inflection AI 联合创始人 Mustafa Suleyman、一位是Cohere的联合创始人兼首席执行官Aida...
-
离职谷歌的Transformer作者创业,连发3个模型(附技术报告)
去年 8 月,两位著名的前谷歌研究人员 David Ha、Llion Jones 宣布创立一家人工智能公司 Sakana AI,总部位于日本东京。其中,Llion Jones 是谷歌 2017 年经典研究论文《Attention is all you n...
-
使用GaLore在本地GPU进行高效的LLM调优
训练大型语言模型(llm ,即使是那些“只有”70亿个参数的模型,也是一项计算密集型的任务。这种水平的训练需要的资源超出了大多数个人爱好者的能力范围。为了弥补这一差距,出现了低秩适应(LoRA 等参数高效方法,可以在消费级gpu上对大量模型进行微调。 G...