-
像人类一样在批评中学习成长,1317条评语让LLaMA2胜率飙升30倍
现有的大模型对齐方法包括基于示例的监督微调(SFT)和基于分数反馈的强化学习(RLHF)。然而,分数只能反应当前回复的好坏程度,并不能明确指出模型的不足之处。相较之下,我们人类通常是从语言反馈中学习并调整自己的行为模式。就像审稿意见不仅仅是一个分数,还包...
-
陶哲轩看了都直呼内行!谷歌等用LLM自动证明定理拿顶会杰出论文,上下文越全证得越好
Transformer的技能树是越来越厉害了。 来自马萨诸塞大学、谷歌和伊利诺伊大学厄巴纳-香槟分校(UIUC)的研究人员发表了一篇论文,利用大语言模型自动生成定理的完整证明。 论文地址:https://arxiv.org/pdf/2303.04910...
-
超高真空度精密控制解决方案设计中百度“文心一言”的具体应用
摘要:本文采用国产版本ChatGPT百度“文心一言”作为一种辅助工具,针对超高真空度精密控制装置的开发进行了初期的技术路线设计,对话调研的重点是了解可调节式微流量进气阀门和可用于连接非线性输出信号型真空计的PID控制器。总体而言,目前的人工智能技术所能提供...
-
Amazon CodeWhisperer 免费的 AI 代码生成助手!最新体验反馈~
文章作者:段小草 自这一波生成式 AI 浪潮以来,大家尝鲜之余最关心的问题还是如何提高生产力。我们在测试大语言模型能力的时候,往往会将代码能力作为一项重要的评价指标,也说明程序员还是希望能在 AI 的加持下更快捷安全地编写代码。 亚马逊云科技...
-
扎克伯格分红7亿刀,Meta股价大涨14%,开源大计成了?
伴随着 Meta 的股价周四盘后上涨近 14%,升至历史新高,这家公司宣布了有史以来的首次股息派发。 最近一次财报电话会议公布内容显示,Meta 公布的 2023 全年营收为 1349 亿美元,较 2022 年增长 16%;净利润为 391 亿美元,同比...
-
「我在淘天做技术」1688的AIGC商业化落地实践探索
作者:吴越涛 近期淘天集团秋季 2024 届校园招聘正式启动,预计将发放 2000 多个 offer,其中技术类岗位占比超过 50%。为了方便大家更真实地了解淘天技术的布局和现状,我们策划了「我在淘天做技术」系列,首次全面分享淘天技术进展和创新...
-
史上最全知识图谱建模实践(下):多元关系架构
在“知识图谱之本体结构与语义解耦——基于OpenSPG的建模实践(上)”一文中,我们从实体关系设计和概念语义建模2种场景,讲解了基于SPG的知识建模的方法和案例。 本文中,我们将继续讲解多元关系架构场景中的知识建模实践。如果你的图谱,涉及对带有时空信息的...
-
UCLA华人提出全新自我对弈机制!LLM自己训自己,效果碾压GPT-4专家指导
合成数据已经成为了大语言模型进化之路上最重要的一块基石了。 在去年底,有网友扒出前OpenAI首席科学家Ilya曾经在很多场合表示过,LLM的发展不存在数据瓶颈,合成数据可以解决大部分的问题。 图片 英伟达高级科学家Jim Fan在看了最近的一批论文后也...
-
讯飞星火大模型重磅升级,对标GPT-4 Turbo!星火语音大模型发布,37个主流语种识别超OpenAI!
出品 | 51CTO技术栈(微信号:blog51cto) 1月30日,讯飞星火认知大模型V3.5成功发布!用核心能力的突破,回应时代的疑问。迈向更通用、实用的全民开放大模型,讯飞星火全面对标国际先进水平,同时首次发布星火语音大模型和星火开源大模型。 1、...
-
火爆到崩溃!揭秘字节版GPTs背后部门Flow
整理丨诺亚 出品 | 51CTO技术栈(微信号:blog51cto) “大语言模型只能编个贪吃蛇,而AI Agent可以整出一个王者荣耀。” 曾有人这样描述关于AI Agent的终极想象。 过去一年,国内外无数科技公司卷入了大模型混战中,随之兴起的...
-
云原生场景下,AIGC 模型服务的工程挑战和应对
“成本”、“性能”和 “效率”正在成为影响大模型生产和应用的三个核心因素,也是企业基础设施在面临生产、使用大模型时的全新挑战。AI 领域的快速发展不仅需要算法的突破,也需要工程的创新。 01 大模型推理对基础设施带来更多挑战 首先,AI 商业化的时代,...
-
对比分析ChatGPT 和文心一言。
目录 ChatGPT 和文心一言哪个更好用? ChatGPT 文心一言 对人工智能的看法 ChatGPT 和文心一言哪个更好用? ChatGPT和文心一言是目前两种比较流行的大语言模型,他们的出现迎来了人工智能时代。那么,这两种语言哪...
-
阿里北交大实习生论文火了!MobileAgent 可模拟人类玩转手机,网友:加速剁手、吃土!
编辑 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) “太酷了,以后就靠AI帮我加速剁手吃土了。”近日一款名为MobileAgent的移动智能代理引起了圈内人的注意。 一个惊艳之处在于,这款Agent为“手机+GPT4”结合,做出...
-
五角大楼启动AI赏金计划,寻找偏见证据
美国国防部最近启动了一项赏金计划,旨在寻找人工智能模型中的法律偏见。该计划要求参与者从Meta的开源LLama-270B模型中提取明显的偏见例证。 据五角大楼的解释,这是为了在实际应用中找到大语言模型可能呈现偏见或在国防部背景下产生系统错误输出的现实情境。...
-
技术融合下的虚拟角色创建与实践
作者 | 崔皓 审校 | 重楼 摘要 文章详细介绍了百川大模型在创建个性化虚拟角色方面的创新技术和应用。这项技术结合了LangChain和Qianfan微调的Llama2-Chinese大模型,提供了高度个性化的角色定制功能。 作者通过实际体验和技术模...
-
揭秘NVIDIA大模型推理框架:TensorRT-LLM
一、TensorRT-LLM 的产品定位 TensorRT-LLM 是 NVIDIA 用于做 LLM(Large Language Model)的可扩展推理方案。该方案是基于 TensorRT 深度学习编译框架来构建、编译并执行计算图,并借鉴了许多 Fa...
-
AIGC内容分享(四十):生成式人工智能(AIGC)应用进展浅析
目录 0 引言 1 以ChatGPT为代表的AIGC发展现状 1.1 国外AIGC应用发展现状 1.2 国内AIGC应用发展现状 2 AIGC的技术架构 (1)数据层 (2)算力基础设施层 (3)算法及大模型层 (4)AI...
-
ChatGPT与文心一言的较量:智能回复、语言准确度及知识库维度对比分析
在人工智能技术飞速发展的今天,自然语言处理领域的两大翘楚——美国OpenAI研发的ChatGPT和中国百度推出的文心一言,各自凭借其强大的自然语言生成能力引发了全球范围内的广泛关注。本文将深入探讨两者在智能回复、语言准确性以及知识库丰富度等方面的表现,...
-
AIGC内容分享(六十):拆解AIGC的基础及各行业应用
目录 一、揭开AIGC的神秘面纱 二、为何2022年爆发AIGC? 1、文本类 2、图像类 3、音频类 4、视频类 三、AI对电商的影响 挖掘ChatGPT的潜力 举个例子:如果你想通过OpenAI平台创业 四、AIGC/GPT可以做什...
-
谷歌DeepMind核心大佬被曝离职创业,瞄准AI智能体!曾是Gemini关键负责人
谷歌又被曝出有核心员工离职了! 这次跑路的竟是DeepMind的核心技术大佬,Gemini项目的四位主要开发者之一,Ioannis Antonoglou。 上图左半部分列出了Gemini项目的36位领导者,自去年九月以来,包括Ioannis Anton...
-
Code Llama 70B霸榜3连发,练习5个月击败GPT-4!小扎LeCun亲自官宣上新
今天,Meta正式发布了Code Llama 70B,作为Code Llama系列中规模最大,性能最强的版本,一举击败了GPT-4! 目前,模型共有三个版本,均可免费用于研究和商业目的: CodeLlama - 70B:基础代码模型; CodeLlama...
-
Mobile-Agent官网体验入口 自主多模移动设备AI在线使用地址
Mobile-Agent是一款自主多模移动设备代理,采用先进的多模大语言模型(MLLM)技术。该代理利用视觉感知工具准确识别和定位应用程序前端界面的视觉和文字元素,实现了自主规划和分解复杂操作任务,通过逐步操作导航移动应用程序。与以往依赖应用程序的XML文...
-
近200+自动驾驶数据集全面调研!一览如何数据闭环全流程
写在前面&个人理解 自动驾驶技术在硬件和深度学习方法的最新进展中迅速发展,并展现出令人期待的性能。高质量的数据集对于开发可靠的自动驾驶算法至关重要。先前的数据集调研试图回顾这些数据集,但要么集中在有限数量的数据集上,要么缺乏对数据集特征的详细调查...
-
纯文本模型训出「视觉」表征!MIT最新研究:语言模型用代码就能作画
只会「看书」的大语言模型,有现实世界的视觉感知力吗?通过对字符串之间的关系进行建模,关于视觉世界,语言模型到底能学会什么? 最近,麻省理工学院计算机科学与人工智能实验室(MIT CSAIL)的研究人员对语言模型的视觉能力进行了系统的评估,从简单形状、物体...
-
【探索科技 感知未来】文心一言大模型
【探索科技 感知未来】文心大模型 ?本文介绍 文心一言大模型是由中国科技巨头百度公司研发的一款大规模语言模型,其基于先进的深度学习技术和海量数据训练而成。这款大模型具备强大的自然语言处理能力,可以理解并生成自然语言,为用户提供自然、流畅的语言交...
-
准确率不足20%,GPT-4V/Gemini竟看不懂漫画!首个图像序列基准测试开源
OpenAI的GPT-4V和谷歌最新的Gemini多模态大语言模型一经推出就得到业界和学界的热切关注: 一系列工作都从多角度展示了这些多模态大语言模型对视频的理解能力。人们似乎相信我们离通用人工智能artificial general intellige...
-
百川智能发布千亿参数大模型,中文能力超越GPT-4!
“追上ChatGPT水平,我觉得今年内可能就能够实现,但对于GPT-4或者GPT-5,我认为可能需要3年左右的时间,应该不会低于两年。”去年4月,百川智能创始人王小川当初曾这样判断自己入局大模型赛道后的进度。就在昨天,千亿参数规模的百川大模型终于来了!...
-
copilot和chatGPT的区别分析
Copilot是一个基于人工智能的代码提示工具,由GitHub和人工智能公司合作开发。它可以利用机器学习技术和大量训练数据生成高质量的代码,提高开发者的编码效率。Copilot的工作原理是基于自然语言处理、机器学习和深度神经网络技术,以及大规模实际编码数据...
-
微软使用AI加HPC分析3200万种新材料
微软与太平洋西北国家实验室合作,利用AI与高性能计算(HPC)技术对3200种新型候选材料进行建模,希望加快高效可充电电池材料的发现速度。该项目还希望进一步支撑微软的发展目标,在未来25年内将绵延250年的人类化学研究史纳入数据模型。 Azure量子元...
-
把图像视为外语,快手、北大多模态大模型媲美DALLE-3
当前的大型语言模型如 GPT、LLaMA 等在自然语言处理领域取得了显著进展,能够理解和生成复杂的文本内容。但你是否想过,如果能够将大语言模型这强大的理解和生成能力迁移到多模态数据上,就可以轻松理解海量的图像与视频,并辅助创作图文并茂的内容。近期,来自快...
-
Baichuan 3体验入口 百川智能超千亿参数大语言AI模型在线使用地址
Baichuan 3是一款卓越的语言模型,拥有超过千亿的参数规模。在多个权威通用能力评测中,Baichuan3 展现出色,特别在中文任务上超越了GPT-4。它在自然语言处理、代码生成、医疗任务等领域表现出色,采用了多项创新技术手段提升模型能力,包括动态数据...
-
每日一看大模型新闻(2023.11.14)谷歌提出新型生成式AI模型IGN;谷歌天气预报模型GraphCast登刊Science;贾扬清吐槽国产大模型套壳Llama 假装自研,零一万物回应
1.产品发布 1.1面壁智能:发布AI Agents首个SaaS级产品ChatDev 发布日期:2023-11-15 面壁智能打造首个“大模型+Agent” SaaS级产品ChatDev 主要内容:面壁智能已经推出了基于群体智能和其新一代千...
-
探索星辰大海:成为AIGC大模型领域的精英 - 近屿智能OJAC深度训练营招募中!
朋友,面对AIGC这股新的AIGC技术革命浪潮,您还在旁观吗? 近屿智能OJAC第六期AIGC星辰大海:大模型工程师和产品专家线上训练营,正在寻找像您这样有梦想、有热情的学员!OJAC的AIGC星辰大海第六期训练营,一个为您量身打造的AI大模型学习之...
-
Llama-2+Mistral+MPT=? 融合多个异构大模型显奇效
随着 LLaMA、Mistral 等大语言模型的成功,各家大厂和初创公司都纷纷创建自己的大语言模型。但从头训练新的大语言模型所需要的成本十分高昂,且新旧模型之间可能存在能力的冗余。 近日,中山大学和腾讯 AI Lab 的研究人员提出了 FuseLLM,用...
-
微软开发新型大模型压缩方法SliceGPT
SliceGPT是微软开发的一种新型的大语言模型压缩方法。通过SLICE GPT,可以在保持99%,99%,和90%零样本任务性能的同时,将LLAMA2-70B、OPT66B和Phi-2模型分别去除高达25%的模型参数(包括嵌入)。 这意味着使用SLICE...
-
GenAI成功道路上的十个“坑”
想要实现生成式人工智能(GenAI)?是个好消息!大多数IT决策者都看到了这种变革性技术的潜力,您可以将自己视为其中之一。虽然GenAI有可能为业务增加显著的效率,但它也带来了一系列必须克服的挑战。 以下是实施GenAI的十大挑战,按重要性降序排列。...
-
全球代码质量骤降,罪魁祸首竟是AI!1.53亿行代码深度分析报告出炉
AI正在使全球的代码质量下降! 最近,GitClear发布的一项调查报告显示,用AI写代码,会让代码的质量和可维护性不断下降。 这引起了全网热烈讨论: 「借助AI提供商,您可以将代码生成速度提高50%(即使是您不理解或无法编写的代码),但代价是代码的质...
-
GPT-4准确率最高飙升64%!斯坦福OpenAI重磅研究:全新Meta-Prompting方法让LLM当老板
当你让大模型写一首「莎士比亚十四行诗」,并以严格的韵律「ABAB CDCD EFEF GG」执行。 同时,诗中还要包含提供的3个词。 对于这么高难度的创作题,LLM在收到指令后,并不一定能够按要求做出这首诗。 正所谓,人各有所长,LLM也是如此,仅凭单...
-
百川智能发布大模型Baichuan3 称中文评测超越GPT-4
百川智能于 1 月 29 日推出了拥有超过千亿参数的大型语言模型Baichuan 3。该模型在多个公认的通用能力评估,如CMMLU、GAOKAO和AGI-Eval等,都展示了卓越的表现,特别是在中文任务上更是超过了GPT- 4 的水平。同时,该模型在数学和...
-
比亚迪发布璇玑AI大模型;微软推出Copilot Pro;国内首个MoE模型上线
比亚迪发布璇玑 AI 大模型 1 月 16 日,在 2024 比亚迪梦想日活动上,比亚迪正式发布了整车智能化架构「璇玑」及「璇玑 AI 大模型」。 比亚迪产品规划及汽车新技术研究院院长杨冬生称,「璇玑」是行业首个智电融合的智能化架构,让汽车拥有...
-
500行代码构建对话搜索引擎,贾扬清被内涵的Lepton Search真开源了
来了,贾扬清承诺的 Lepton Search 开源代码来了。 前天,贾扬清在 Twitter 上公布了 Lepton Search 的开源项目链接,并表示任何人、任何公司都可以自由使用开源代码。 项目链接:https://github.com/le...
-
大模型开山鼻祖!InstructGPT发布两周年了
今天是InstructGPT发布两周年的纪念日,它是现代大语言模型的开山鼻祖。Jim Fan介绍了InstructGPT的重要性并且说了几条关于InstructGPT非常有意思的点。还展示了InstructGPT中非常经典的三步LLM训练方法的图片,我也顺...
-
未来五年AI如何改变各学科?从LLM到AI蛋白设计、医疗保健......
五年前(2019 年 1 月),《Nature Machine Intelligence》创刊。当然,就人工智能(AI)而言,五年前似乎是一个不同的时代。 1 月 24 日,Nature Machine Intelligence 杂志在《Annivers...
-
从20亿数据中学习物理世界,基于Transformer的通用世界模型成功挑战视频生成
建立会做视频的世界模型,也能通过Transformer来实现了! 来自清华和极佳科技的研究人员联手,推出了全新的视频生成通用世界模型——WorldDreamer。 它可以完成自然场景和自动驾驶场景多种视频生成任务,例如文生视频、图生视频、视频编辑、动作序...
-
谷歌再雪前耻,新Bard逆袭GPT-4冲上LLM排行榜第二!Jeff Dean高呼我们回来了
一夜之间,Bard逆袭GPT-4,性能直逼最强GPT-4 Turbo! 这个听起来似乎像梦里的事情,确确实实地发生了。 就在昨天,谷歌首席Jeff Dean发推提前透露了谷歌的最新版模型——Gemini Pro-scale。 基于此,Bard相较于3月份...
-
Llama-2 推理和微调的硬件要求总结:RTX 3080 就可以微调最小模型
大语言模型微调是指对已经预训练的大型语言模型(例如Llama-2,Falcon等)进行额外的训练,以使其适应特定任务或领域的需求。微调通常需要大量的计算资源,但是通过量化和Lora等方法,我们也可以在消费级的GPU上来微调测试,但是消费级GPU也无法承载比...
-
开源一个整合了AIGC大语言模型的SpringBoot智慧医药系统
前言 哈喽兄弟们,好久不见哦~ 最近整理了一下之前写过的一些小项目/毕业设计。发现还是有很多存货的,虽然这些项目普遍都写的比较简单,但想一想既然放在电脑里面也吃灰,那么还不如开源分享出去,没准还可以帮助到一些小白新手。 本期就在其中选取了一个医...
-
大语言模型部署:基于llama.cpp在Ubuntu 22.04及CUDA环境中部署Llama-2 7B
llama.cpp是近期非常流行的一款专注于Llama/Llama-2部署的C/C++工具。本文利用llama.cpp来部署Llama 2 7B大语言模型,所采用的环境为Ubuntu 22.04及NVIDIA CUDA。文中假设Linux的用户目录(一般为...
-
首届百度商业AI技术创新大赛启动 点燃AIGC革新“星火”
随着生成式AI在全球范围的热议,AIGC前沿技术也在快速迭代,正如百度CEO李彦宏所说 “人工智能发生了方向性改变,从辨别式AI走向生成式AI,生成式AI会带来极大的效率提升” 。而这一领域的发展,将推动AI产品应用深化,极有可能在内容创作、客户服务等领域...
-
【网安AIGC专题10.19】论文3代码生成:ChatGPT+自协作代码生成+角色扮演(分析员、程序员、测试员)+消融实验、用于MBPP+HumanEval数据集
Self-collaboration Code Generation via ChatGPT 写在最前面 朋友分享的收获与启发 课堂讨论 代码生成如何协作,是一种方法吗 思路相同 交互实用性 代码生成与自协作框架 摘要 相关工作 PP...