-
AI程序员哪家强?探索Devin、通义灵码和SWE-agent的潜力
4月3日,距世界首个AI程序员Devin诞生不足一个月,普林斯顿大学的NLP团队开发了一个开源AI程序员SWE-agent,它利用GPT-4模型在GitHub存储库中自动解决问题。SWE-agent在SWE-bench测试集上的表现与Devin相似,平均...
-
首个开源世界模型!百万级上下文,长视频理解吊打GPT-4,UC伯克利华人一作
想了解更多AIGC的内容, 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 首个开源「世界模型」来了! 来自UC berkeley的研究人员发布并开源了LWM(LargeWorldModel)系列模型: 论文...
-
2024-03-21 AIGC-FastGPT-本地知识库问答系统
相关文档: 接入 ChatGLM2-6B | FastGPT (fastai.site 相关步骤: FastGPT配置文件及OneAPI程序:百度网盘 请输入提取码 提取码:wuhe 创建fastgpt目录:mkdir fastgpt...
-
GPT-5红队测试邮件曝光,最早6月发布?网友在线逼问Altman,数十亿美元超算26年启动
GPT-5已经开始红队测试了? 就在这几天,网上已经有多人晒出了OpenAI发给自己的红队录取通知书。 此前有传闻说,GPT-5将于今年6月发布。看起来,红队测试与模型发布的时间线十分吻合。 有网友直接晒出了自己收到OpenAI邮件邀请的截图。 这...
-
【保姆级】VsCode 安装GitHub Copilot实操教程
0. 前言 GitHub Copilot,俗称“副驾驶”,是GitHub携手OpenAI共同打造的一款革命性的人工智能代码辅助工具。通过将其插件化集成至编辑器(如VS Code),Copilot能够为用户提供强大的代码自动补全功能,并根据用户输入的注释快...
-
【AIGC调研系列】苹果MM1大模型与其他模型相比的优势和劣势
苹果MM1大模型与其他模型相比,具有以下优势和劣势: 优势: 多模态能力:MM1是基于大规模多模态预训练的,这意味着它能够处理和理解多种类型的数据(如文本、图像等),在上下文预测、多图像和思维链推理等方面表现出色[7][10]。 少样本学习能力:...
-
【AIGC调研系列】通义灵码与copilot的对比
通义灵码与GitHub Copilot的对比主要集中在几个方面:代码编写能力、免费性、操作界面和适配性。 首先,在代码编写能力上,虽然GitHub Copilot在整体上要强于通义灵码,但通义灵码的能力也不算弱,并且在某些特定的小类任务上表现更好[1][...
-
有网友曝光OpenAI 发给红队测试人员邀请邮件:GPT-5已经开始红队测试
今天,有网友曝光了 OpenAI 发给红队测试人员的邀请邮件,表明 GPT-5已经开始红队测试,可能最早在6月发布。网友们开始对 GPT-5展开畅想,呼唤 Altman 发布这一新模型。同时,有外媒报道称,OpenAI 计划启动一项数十亿美元的超级计算机项...
-
LLaMA Factory+ModelScope实战——使用 Web UI 进行监督微调
LLaMA Factory+ModelScope实战——使用 Web UI 进行监督微调 文章原始地址:https://onlyar.site/2024/01/14/NLP-LLaMA-Factory-web-tuning/ 引言 大语...
-
AIGC批量图生成的一些思考
从技术到先进生产力,从先进装备到作战能力,中间隔了一道GAP。现在AI技术进展很快,开源的模型大部分是单点或者一个模块单元的突破。如何把这些技术整装成作战单元,为业务带来实际的价值是我们必须要解决的一个问题。 消费侧技术点 中文clip: 这...
-
首个开源世界模型LWM :百万级上下文,长视频理解超GPT-4
来自加州大学伯克利分校的研究人员最近发布并开源了首个世界模型,被称为 LWM(LargeWorldModel)系列模型。这一模型采用了大量视频和书籍数据集,通过 RingAttention 技术实现了长序列的可扩展训练,使得模型的上下文长度达到了1M to...
-
探索未来编程利器:Code GeeX、Copilot、通义灵码
各位小伙伴们,大家好!小米今天给大家带来的是一篇关于未来编程利器的探索文章。近年来,随着人工智能技术的不断发展,我们看到了越来越多的智能编程辅助工具的出现,其中包括了Code GeeX、Copilot和通义灵码。那么,究竟这三种工具各自是什么,又有什么样的...
-
长文本之罪:Claude团队新越狱技术,Llama 2到GPT-4无一幸免
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 刚刚,人工智能初创公司 Anthropic 宣布了一种「越狱」技术(Many-shot Jailbreaking)—— 这种技术可以用来...
-
OpenAI竞对用256轮对话「灌醉」大模型,Claude被骗造出炸弹!
大模型又被曝出安全问题? 这次是长上下文窗口的锅! 今天,Anthropic发表了自己的最新研究:如何绕过LLM的安全限制?一次越狱不够,那就多来几次! 图片 论文地址:https://www-cdn.anthropic.com/af5633c94ed2...
-
80M参数打平GPT-4!苹果发超强上下文理解模型ReALM,聪明版Siri马上就来
【新智元导读】苹果公司发布了一款参数量仅为80M的最新模型——ReALM,能够将各种形式的上下文转换为文本进行理解,包括解析屏幕、多轮对话以及上下文引用,提升了Siri等智能助手的反应速度和智能程度。 会读心的Siri想不想要? 今天,苹果发布了自家的最新...
-
华人又来炸场!一个命令工具让GPT-4干掉Devin和RAG!Jim Fan:提示工程2.0没必要了!
出品 | 51CTO技术栈(微信号:blog51cto) 华人又来炸场了!昨天,普林斯顿的CS/NLP硕士生John Yang在Github上开源了一款堪比Devin的利器。不到一天,就在Github上斩获了1.3k 星,异常生猛。据悉,4月10日,详细...
-
80M参数打平GPT-4!苹果发超强上下文理解模型,聪明版Siri马上就来
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 会读心的Siri想不想要? 今天,苹果发布了自家的最新模型ReALM,仅需80M参数,就能在上下文理解能力上打平甚至超越GPT-4!...
-
大模型新漏洞!Anthropic警告:新式“多轮越狱”攻破AI防线,或祸起长文本
出品 | 51CTO技术栈(微信号:blog51cto) 撰稿丨诺亚 如何让一个AI回答一个它本不应该作答的问题? 有很多这种所谓的“越狱”技术,而Anthropic的研究人员最近发现了一种新方法:如果首先用几十个危害性较小的问题对大型语言模型(LLM)...
-
开源大模型AI代理操作系统:像Windos一样,操控AI代理
本文经AIGC开放社区 授权转载,转载请联系出处。 想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 去年,AutoGPT的出现让我们见识到了AI代理强大的自动化能力,并开创了一个全新...
-
微软升级365 Copilot,加入GPT-4 Turbo、无限信息、100张图片生成加成等功能
微软公司副总裁、Copilot和Bing的工程与产品负责人Jordi Ribas在社交平台X上发布:“为我们的Microsoft 365 Copilot用户分享一些令人兴奋的更新。从今天开始,你可以优先访问GPT-4 Turbo,以获得更快、更全面...
-
多忽悠几次AI全招了!Anthropic警告:长上下文成越狱突破口,GPT羊驼Claude无一幸免
大模型厂商在上下文长度上卷的不可开交之际,一项最新研究泼来了一盆冷水—— Claude背后厂商Anthropic发现,随着窗口长度的不断增加,大模型的“越狱”现象开始死灰复燃。 无论是闭源的GPT-4和Claude2,还是开源的Llama2和Mistral...
-
LLM超长上下文查询-性能评估实战
在大型语言模型(LLM)的应用中,有几个场景需要以结构化的方式呈现数据,其中信息提取和查询分析是两个典型的例子。我们最近通过更新的文档和一个专门的代码仓库强调了信息提取的重要性。对于查询分析,我们同样更新了相关文档。在这些场景中,数据字段可能包括字符串、...
-
苹果AI放大招!声称其设备端模型性能优于GPT-4
快科技4月2日消息,据媒体报道,在最近的一篇论文中,苹果的研究团队宣称,他们提出了一个可以在设备端运行的模型ReALM,这个模型在某些方面可以超过GPT-4。 ReALM的参数量分别为80M、250M、1B和3B,体积都非常小,适合在手机、平板电脑等设备端...
-
让Siri不再智障!苹果定义新的端侧模型,“大大优于GPT-4,摆脱文本,可视化模拟屏幕信息,最小参数模型相较基线系统仍提升5%
撰稿丨诺亚 出品 | 51CTO技术栈(微信号:blog51cto) 总被用户吐槽“有点智障”的Siri有救了! Siri自诞生以来就是智能语音助手领域的代表之一,但很长一段时间里,其表现并不尽如人意。然而,苹果的人工智能团队最新...
-
Paper Digest | GPT-RE:基于大语言模型针对关系抽取的上下文学习
笔记整理:张廉臣,东南大学硕士,研究方向为自然语言处理、信息抽取 链接:https://arxiv.org/pdf/2305.02105.pdf 持...
-
阿里1号AI「员工」上岗,007写代码助攻大厂程序员!炸掉祖传屎山代码,Java丝滑改Python
就在刚刚,阿里云一口气宣布两个重磅消息: - 内部全面推行AI编程; - 「通义灵码」正式入职成为程序员的AI助理。 虽然最近AI程序员可以说是科技圈的顶流,AI编程工具作为程序员的外挂,并不是什么新鲜事。 但阿里云这次官方宣布全员使用AI,堪称一次突破...
-
苹果AI放大招?新设备端模型超过GPT-4,有望拯救Siri
在最近的一篇论文中,苹果的研究人员宣称,他们提出了一个可以在设备端运行的模型,这个模型在某些方面可以超过 GPT-4。 具体来说,他们研究的是 NLP 中的指代消解(Reference Resolution)问题,即让 AI 识别文本中提到的各种实体...
-
“大海捞针”out!“数星星”成测长文本能力更精准方法,来自鹅厂
大模型长文本能力测试,又有新方法了! 腾讯MLPD实验室,用全新开源的“数星星”方法替代了传统的“大海捞针”测试。 相比之下,新方法更注重对模型处理长依赖关系能力的考察,对模型的评估更加全面精准。 利用这种方法,研究人员对GPT-4和国内知名的Kimi...
-
性能强,成本低,运行快!最强开源大模型出现,超越ChatGPT和Llama!
大数据人工智能公司 Databricks放大招了! 3月27日,该公司开源了通用大模型 DBRX,并声称该模型是迄今为止全球最强大的开源大型语言模型,比 Meta 的 Llama 2 更为强大。 GPT-3.5研究测试: https://huj...
-
苹果研究人员称其设备端模型 ReALM 性能优于 GPT-4,可大幅提升 Siri 智能程度
IT之家 4 月 2 日消息,虽然目前 Siri 可以尝试描述信息中的图像,但效果并不稳定。不过,苹果公司并没有放弃人工智能领域的探索。在最近的一篇研究论文中,苹果的人工智能团队描述了一种可以显著提升 Siri 智能的模型,而且他们认为这个名为 ReA...
-
集体出走的Stability AI 发布全新代码大模型,3B以下性能最优,超越Code Llama和DeepSeek-Coder
Stability AI又有新动作!程序员又有危机了? 3月26日,Stability AI推出了先进的代码语言模型Stable Code Instruct 3B,该模型是在Stable Code 3B的基础上进行指令调优的Code LM。 Stab...
-
描述 Microsoft Copilot for Security
人工智能辅助内容。该模块部分是在人工智能的帮助下创建的。了解更多 熟悉 Microsoft Copilot for Security。我们将向您介绍一些基本术语、Microsoft Copilot for Security...
-
马斯克突发Grok 1.5!上下文长度至128k、HumanEval得分超GPT-4
就在刚刚,马斯克Grok大模型宣布重大升级。 难怪之前突然开源了Grok-1,因为他有更强的Grok-1.5了,主打推理能力。 来自xAI的官方推送啥也没说,直接甩链接。主打一个“字少事大” 图片 新版本Grok有啥突破? 一是上下文长度飙升,从8192...
-
冒泡鸭AI体验入口 多模态AI智能体互动平台使用指南
冒泡鸭AI是基于自研多模态大模型开发的AI互动平台,提供拟人、工具、内容、游戏、娱乐等多个领域的海量智能体。平台具有超长的上下文记忆能力和实时联网搜索能力,能够深度理解用户意图,并提供即时、准确、个性化的回复和选择。用户还可以定制个性化的AI智能体,以满足...
-
大语言模型中常用的旋转位置编码RoPE详解:为什么它比绝对或相对位置编码更好?
自 2017 年发表“ Attention Is All You Need ”论文以来,Transformer 架构一直是自然语言处理 (NLP 领域的基石。它的设计多年来基本没有变化,随着旋转位置编码 (RoPE 的引入,2022年标志着该领域的...
-
马斯克推出Grok-1.5,接近GPT-4级别的性能
马斯克指出,Grok-1.5将为xAI在X平台上的ChatGPT挑战者聊天机器人提供支持,而Grok-2(新模型的继任者 仍在训练阶段。他表示,下一个版本应该能够“在所有指标上超越当前的AI”,但没有分享它可能何时变得可用的具体细节。 Grok-1....
-
Meta将为智能眼镜引入强大AI功能
据《纽约时报》报道,Meta将在4月为其Ray-Ban智能眼镜引入一系列相当强大的AI功能。这些新功能将允许用户通过一个简单的命令快速识别他们正在查看的物体。例如,用户可以说:“Hi,Meta,看看这包糖果里有多少糖”,在几秒钟内就能得到答案。 申请测试...
-
全面综述!大模型到底微调个啥?或者说技术含量到底有多大?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 大型模型代表了多个应用领域的突破性进展,能够在各种任务中取得显著成就。然而,它们前所未有的规模带来了巨大的计算成本。这些模型通常由数十亿个参数组成,需要大量的计算资源才...
-
比人类便宜20倍!谷歌DeepMind推出「超人」AI系统
AI的同行评审来了! 一直以来,大语言模型胡说八道(幻觉)的问题最让人头疼,而近日,来自谷歌DeepMind的一项研究引发网友热议: 大模型的幻觉问题,好像被终结了? 论文地址:https://arxiv.org/pdf/2403.18802.pdf...
-
HOW - Copilot 使用技巧
目录 一、介绍 二、定位:开发者的高水平结对编程助手 三、使用场景 四、常见使用方式 运维团队 数据与算法团队 开发和测试团队 五、对效率的提升 六、常见问题 一、介绍...
-
Code Llama 简介,一种最先进的大型编码语言模型
Code Llama 简介,一种最先进的大型编码语言模型 2023 年 8 月 24 日...
-
3分钟学会写文心一言指令
码到三十五 : 个人主页 心中有诗画,指尖舞代码,目光览世界,步履越千山,人间尽值得 ! 文心一言是百度研发的 人工智能大语言模型产品,能够通过上一句话,预测生成下一段话。 任何人都可以通过输入【指令】和文心一言进行对...
-
零基础用文心一言带你绘制神经网络矩阵相乘组合图
之前写过一些 ChatGPT 的使用体验,确实很好,省了很多事,用起来也方便。 > 代码看不懂?不会优化?ChatGPT 来帮你! > 偷个懒,用ChatGPT 帮我写段生物信息代码 > 1 分钟看 Cha...
-
Midjourney 重大更新!深度解析「角色一致性」命令
Midjourney 重大更新!深度解析「角色一致性」命令 大家期待已久的 MJ 角色一致性功能终于来啦!全新的命令“–cref”现已推出,与之前的样式参考“–sref”功能相似,但不同的是,它不是匹配参考样式,而是试图让角色与“角色参考”图像相匹...
-
大佬出走后首个发布!Stability官宣代码模型Stable Code Instruct 3B
大佬出走后,第一个模型来了! 就在今天,Stability AI官宣了新的代码模型Stable Code Instruct 3B。 图片 要说Stability也是真的很神奇,首席执行官辞职了,Stable Diffusion其中几位作者也离开了,投资公...
-
AI21发布世界首个Mamba的生产级模型Jamba 支持256K上下文长度
AI21发布了世界首个Mamba的生产级模型:Jamba。这个模型采用了开创性的SSM-Transformer架构,具有52B参数,其中12B在生成时处于活动状态。Jamba结合了Joint Attention和Mamba技术,支持256K上下文长度。单个...
-
开源11天,马斯克再发Grok-1.5!128K代码击败GPT-4
Grok-1官宣开源不过半月,新升级的Grok-1.5出炉了。 刚刚,马斯克xAI官宣,128K上下文Grok-1.5,推理能力大幅提升。 并且,很快就会上线。 11天前,Grok-1模型的权重和架构开源,展示了Xai在去年11月之前取得的进展。 Gr...
-
今日AI:OpenAI要给开发者发钱;马斯克Grok-1.5王炸级更新;李玟姐姐称AI“复活”是二次伤害;世界首个Mamba的生产级模型Jamba发布
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ ???AI新鲜事 OpenAI将推...
-
DeepMind终结大模型幻觉?标注事实比人类靠谱、还便宜20倍,全开源
DeepMind 这篇论文一出,人类标注者的饭碗也要被砸了吗? 大模型的幻觉终于要终结了? 今日,社媒平台 reddit 上的一则帖子引起网友热议。帖子讨论的是谷歌 DeepMind 昨日提交的一篇论文《Long-form factuality in la...
-
马斯克突然发布Grok 1.5!上下文长度飙升16倍和GPT-4齐平
快科技3月29日消息,就在刚刚,埃隆马斯克旗下的人工智能初创公司xAI宣布正式推出Grok-1.5,官方推送啥也没说,直接甩链接,主打一个字少事大”。 Grok-1.5有哪些升级呢,主要是两个方面: 1、长上下文理解 对于上下文窗口,Grok-1.5直接提...