-
Llama-2+Mistral+MPT=? 融合多个异构大模型显奇效
随着 LLaMA、Mistral 等大语言模型的成功,各家大厂和初创公司都纷纷创建自己的大语言模型。但从头训练新的大语言模型所需要的成本十分高昂,且新旧模型之间可能存在能力的冗余。 近日,中山大学和腾讯 AI Lab 的研究人员提出了 FuseLLM,用...
-
CMU华人18万打造高能机器人,完爆斯坦福炒虾机器人!全自主操作,1小时学会开12种门
比斯坦福炒虾机器人还厉害的机器人来了! 最近,CMU的研究者只花费2.5万美元,就打造出一个在开放世界中可以自适应移动操作铰接对象的机器人。 论文地址:https://arxiv.org/abs/2401.14403 厉害之处就在于,它是完全自主完成操作...
-
更适合中文LMM体质的基准CMMMU来了:超过30个细分学科,12K专家级题目
近期,随着多模态大模型(LMM) 的能力不断进步,评估 LMM 性能的需求也日益增长。与此同时,在中文环境下评估 LMM 的高级知识和推理能力的重要性更加突出。 在这一背景下,M-A-P 开源社区、港科大、滑铁卢大学、零一万物等联合推出了面向中文大规模多...
-
GenAI成功道路上的十个“坑”
想要实现生成式人工智能(GenAI)?是个好消息!大多数IT决策者都看到了这种变革性技术的潜力,您可以将自己视为其中之一。虽然GenAI有可能为业务增加显著的效率,但它也带来了一系列必须克服的挑战。 以下是实施GenAI的十大挑战,按重要性降序排列。...
-
谷歌与Singular Computing达成AI专利纠纷和解
谷歌刚刚和一家人工智能技术专利诉讼的对手达成了数十亿美元的和解。这家硬件和软件开发公司Singular Computing从谷歌那里获得了一笔未公开的和解金,这结束了Singular的创始人Joseph Bates博士对谷歌提起的长达五年的联邦法院专利侵权...
-
全球代码质量骤降,罪魁祸首竟是AI!1.53亿行代码深度分析报告出炉
AI正在使全球的代码质量下降! 最近,GitClear发布的一项调查报告显示,用AI写代码,会让代码的质量和可维护性不断下降。 这引起了全网热烈讨论: 「借助AI提供商,您可以将代码生成速度提高50%(即使是您不理解或无法编写的代码),但代价是代码的质...
-
GPT-4准确率最高飙升64%!斯坦福OpenAI重磅研究:全新Meta-Prompting方法让LLM当老板
当你让大模型写一首「莎士比亚十四行诗」,并以严格的韵律「ABAB CDCD EFEF GG」执行。 同时,诗中还要包含提供的3个词。 对于这么高难度的创作题,LLM在收到指令后,并不一定能够按要求做出这首诗。 正所谓,人各有所长,LLM也是如此,仅凭单...
-
无需人工标注!LLM加持文本嵌入学习:轻松支持100种语言,适配数十万下游任务
文本嵌入(word embedding)是自然语言处理(NLP)领域发展的基础,可以将文本映射到语义空间中,并转换为稠密的矢量,已经被广泛应用于各种自然语言处理(NLP)任务中,如信息检索(IR)、问答、文本相似度计算、推荐系统等等, 比如在IR领域,第...
-
500行代码构建对话搜索引擎,贾扬清被内涵的Lepton Search真开源了
来了,贾扬清承诺的 Lepton Search 开源代码来了。 前天,贾扬清在 Twitter 上公布了 Lepton Search 的开源项目链接,并表示任何人、任何公司都可以自由使用开源代码。 项目链接:https://github.com/le...
-
大模型开山鼻祖!InstructGPT发布两周年了
今天是InstructGPT发布两周年的纪念日,它是现代大语言模型的开山鼻祖。Jim Fan介绍了InstructGPT的重要性并且说了几条关于InstructGPT非常有意思的点。还展示了InstructGPT中非常经典的三步LLM训练方法的图片,我也顺...
-
未来五年AI如何改变各学科?从LLM到AI蛋白设计、医疗保健......
五年前(2019 年 1 月),《Nature Machine Intelligence》创刊。当然,就人工智能(AI)而言,五年前似乎是一个不同的时代。 1 月 24 日,Nature Machine Intelligence 杂志在《Annivers...
-
RAG高阶技巧-如何实现窗口上下文检索
在本文中,我们将介绍一种提高RAG(Retrieval-Augmented Generation)模型检索效果的高阶技巧,即窗口上下文检索。我们将首先回顾一下基础RAG的检索流程和存在的问题,然后介绍窗口上下文检索的原理和实现方法,最后通过一个实例展...
-
LLM巫师,代码预训练是魔杖!UIUC华人团队揭秘代码数据三大好处
大模型时代的语言模型(LLM)不仅在尺寸上变得更大了,而且训练数据也同时包含了自然语言和形式语言(代码)。 作为人类和计算机之间的媒介,代码可以将高级目标转换为可执行的中间步骤,具有语法标准、逻辑一致、抽象和模块化的特点。 最近,来自伊利诺伊大学香槟分校...
-
OpenAI联创Karpathy发文:用自动驾驶诠释AGI!原贴已删速收藏
对于「通用人工智能」,OpenAI科学家Karpathy下场做出了解释。 前几天,Karpathy在个人blog发表了一篇文章「将自动驾驶作为AGI的一个案例来研究」。 不知是何原因,他却删除了这篇文章,幸而,还有网络备份。 众所周知,Karpat...
-
Llama 2: Open Foundation and Fine-Tuned Chat Models
文章目录 TL;DR Introduction 背景 本文方案 实现方式 预训练 预训练数据 训练细节 训练硬件支持 预训练碳足迹 微调 SFT SFT 训练细节 RLHF 人类偏好数据收集 奖励模型 迭代式微调(RLHF) 拒...
-
Grok犯傻自曝抄袭,ChatGPT拱火,马斯克被“插刀”!看生成式AI如何吞噬互联网
整理丨诺亚 马斯克旗下AI公司xAI推出的首款聊天机器人Grok号称“百无禁忌”,也正是这个无禁忌AI面世不久,就给马斯克捅了个大篓子! 一名安全测试员 Jax Winterbourne 上个月在推特上发布了一张 Grok 拒绝查询的屏幕截图,内容显...
-
让知识图谱成为大模型的伴侣
大型语言模型(LLM 能够在短时间内生成非常流畅和连贯的文本,为人工智能的对话、创造性写作和其他广泛的应用开辟了新的可能性,然而,LLM也有着一些关键的局限性。它们的知识仅限于从训练数据中识别出的模式,这意味着缺乏对世界的真正理解。同时,推理能力也是有限...
-
【随手记录】Llama Tutorial 大语言模型实践 手把手系列带实践源码
这个tutorial的契机是yy突然看到了一个workshop 所以类似于一周大作业的形式,输入command输出使用了自动驾驶哪些模块,代码在这里 所以就干一干,顺便写一个tutorial给大家参考和教程 引申更多的应用 参考资料: https:...
-
【网安AIGC专题10.19】论文3代码生成:ChatGPT+自协作代码生成+角色扮演(分析员、程序员、测试员)+消融实验、用于MBPP+HumanEval数据集
Self-collaboration Code Generation via ChatGPT 写在最前面 朋友分享的收获与启发 课堂讨论 代码生成如何协作,是一种方法吗 思路相同 交互实用性 代码生成与自协作框架 摘要 相关工作 PP...
-
高效底座模型LLaMA
论文标题:LLaMA: Open and Efficient Foundation Language Models 论文链接:https://arxiv.org/abs/2302.13971 论文来源:Meta AI 一、概述 大型语...
-
Midjourney V6更新解读与侵权风险警告;AI Agent智能体创业必读;高清图解Mixtral和MoE;2023年度AI设计实践报告 | ShowMeAI日报
👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦! 🉑 Midjourney V6 文生图细节爆炸,但是被扒叠图电影画面? 左图提示词:a full body editorial santa ho...
-
18LLM4SE革命性技术揭秘:大型语言模型LLM在软件工程SE领域的全景解析与未来展望 - 探索LLM的多维应用、优化策略与软件管理新视角【网安AIGC专题11.15】作者汇报 综述
Large Language Models for Software Engineering: A Systematic Literature Review 写在最前面 论文名片 课堂讨论 RQ1部分:LLMs的选择和优化 RQ2部分:LLM...
-
人工智能AI大战:BARD、ChatGPT、Bing和文心一言谁更具有优势?
首先在开始对比之前我首先要吐槽,不管是bard还是百度的AI现在都得等待候补,也就是排队,所以目前只能无限期等待下去,但是第一批用户已经在查通过平台上遨游了好几个月了,从商业的角度来看,几个月或许不长,但是足以失去了超过80%的用户,所以chatgpt目前...
-
使用推测解码 (Speculative Decoding) 使 Whisper 实现 2 倍的推理加速
Open AI 推出的 Whisper 是一个通用语音转录模型,在各种基准和音频条件下都取得了非常棒的结果。最新的 large-v3 模型登顶了 OpenASR 排行榜,被评为最佳的开源英语语音转录模型。该模型在 Common Voice 15 数据...
-
chatglm2-2b+sdxl1.0+langchain打造私有AIGC(五)
一、实现目标 上篇文章写完LLM的Agent之后,流程应该是进入到了SDXL的“文生图”“图生图”阶段了 目标很明确,使用SDXL为ChatGLM生成的内容进行配图,说明:大部分使用SD模型的大神都是使用SD模型配套的开源WebUI,因为我主打一个...
-
推翻Transformer奠基之作疑被拒收,ICLR评审遭质疑!网友大呼黑幕,LeCun自曝类似经历
去年12月,CMU和普林斯顿的2位研究者发布了Mamba架构,瞬间引起AI社区震动! 结果,这篇被众人看好有望「颠覆Transformer霸权」的论文,今天竟曝出疑似被顶会拒收?! 今早,康奈尔大学副教授Sasha Rush最先发现,这篇有望成为奠基之作...
-
大模型×文本水印:清华、港中文、港科广、UIC、北邮联合发布首个大模型时代下的文本水印综述
论文:A Survey of Text Watermarking in the Era of Large Language Models 论文链接:https://arxiv.org/abs/2312.07913 大模型时代:文本水印新纪元 文本水...
-
工作场所中的人工智能、元宇宙和DEI
随着人工智能和元宇宙重塑工作,领导者应该考虑新兴技术影响DEI的三个关注领域和机会。 2023年夏天,当代表好莱坞演员和作家的工会举行罢工时,一个关键的症结是使用人工智能来完成人类作家和演员的工作。一家领先的商业银行宣布,其正在利用元宇宙和人工智能的结...
-
NeurIPS 2023精选回顾:大模型最火,清华ToT思维树上榜
近日,作为美国前十的科技博客,Latent Space对于刚刚过去的NeurIPS 2023大会进行了精选回顾总结。 在NeurIPS会议总共接受的3586篇论文之中,除去6篇获奖论文,其他论文也同样优秀和具有潜力,甚至有可能预示着下一个AI领域的新突破...
-
甲骨文变身“AI狂战士”,MySQL、Java、OCI,一切技术栈火力全开,猛战AI!
撰稿 | 云昭 出品 | 51CTO技术栈(微信号:blog51cto) 太猛了!甲骨文已经按捺不住,就像找了某种魔法钥匙一般,准备在2024年大干一场! 近日,甲骨文宣布正在将生成式AI功能集成到该公司的整个云服务OCI(Oracle Cloud In...
-
中文性能反超VLM顶流GPT-4V,阿里Qwen-VL超大杯限免!看图秒写编程视觉难题一眼辨出
【新智元导读】多模态大模型将是AI下一个爆点。最近,通义千问VLM模型换新升级,超大杯性能堪比GPT-4V。最最重要的是,还能限时免费用。 最近,通义千问实火。 前段时间被网友玩疯的全民舞王,让「AI科目三」频频登上热搜。 让甄嬛、慈禧、马斯克、猫主子和兵...
-
思科调查:超25%公司在内部实施了生成式AI禁令
根据思科(Cisco 日前进行的一项调查,尽管很多员工了解生成式AI在数据隐私方面的缺陷,但许多人仍在向ChatGPT等类似的AI应用程序输入敏感的公司数据。 思科针对全球12个国家的2600名隐私和安全专业人士进行的年度数据隐私基准调查表明,超过四分...
-
大模型推理成本排行榜来了:贾扬清公司效率领跑
「大模型的 API 是个亏本买卖吗?」 随着大语言模型技术的逐渐实用化,越来越多的科技公司提出了大模型 API 供开发者们使用。但前有 OpenAI「每天烧掉 70 万美元」,我们也有理由怀疑以大模型为基础的业务到底能不能持续。 本周四,AI 创业公司...
-
AI应用自动化构建平台VectorShift 通过无代码界面构建自动化工作流
YC昨天投的那家公司,VectorShift,是一家AI应用自动化构建平台。他们利用人工智能来搜索知识库、生成文档并部署聊天机器人和助手,以帮助任何组织构建企业级AI应用程序。 这家公司通过拖放支持组件来完成各种任务,比如连接不同的节点,如LLM、数据加载...
-
FTC调查微软、OpenAI等五大AI公司大规模生成式AI交易
联邦贸易委员会(FTC)在生成 AI 领域进行了首次重要的竞争行为调查,对五家顶级生成 AI 技术开发者展开了调查。 该机构今天向亚马逊、微软、OpenAI、Anthropic 和 Alphabet 发出了6(b) 令,要求这些公司提供有关最近数十亿美元的...
-
AIGC:大语言模型开放平台OpenLLM简介(提供简易的模型部署体验)
文章目录 @[toc] 简介 一、安装 二、启动LLM服务器 项目链接 简介 该项目旨在为各种大语言模型(LLM)在生产环境中的部署和可观测性提供一个标准的解决方案,用最简单直接的方式把大语言模型(LLM)部署到云端或本...
-
2024 年,3 项技术将为生成式人工智能提供帮助
随着 ChatGPT 惊艳的首年即将落幕,生成式人工智能(genAI)与大型语言模型(LLM)无疑已成为引人瞩目的技术焦点。然而,在企业的黄金时期,它们是否已具备投入使用的能力呢?ChatGPT 所遭遇的挑战众所周知,其在回答问题时的准确性尚待提高。尽...
-
微软推出Copilot Pro高级订阅服务;使用大语言模型处理音频数据;AI新工具Summify-用于总结YouTube视频的人工智能工具
🦉 AI新闻 🚀 微软推出Copilot Pro高级订阅服务,扩展适用范围到更多设备和应用 摘要:微软为其Copilot助手推出了新的高级订阅服务Copilot Pro,该服务每月收费20美元,支持Windows PC、Web、App使用,并即将登...
-
【AIGC入门一】Transformers 模型结构详解及代码解析
Transformers 开启了NLP一个新时代,注意力模块目前各类大模型的重要结构。作为刚入门LLM的新手,怎么能不感受一下这个“变形金刚的魅力”呢? 目录 Transformers ——Attention is all You Need 背景...
-
NCSC称人工智能将在未来两年“助长”勒索软件的威力
英国国家网络安全中心(NCSC)警告称,人工智能工具可能会助长勒索软件威胁的升级,将对网络安全产生一定的不利影响。 该机构称,网络犯罪分子现在已经利用人工智能进行一些恶意攻击行为,这种现象极可能在未来两年内进一步恶化,这增加了网络攻击的数量和严重程度。...
-
人工智能时代网络安全的六大趋势
2023年生成式AI技术的异军突起,给动荡的全球网络安全威胁态势增加了不确定性、不对称性和复杂性。在2024年,随着生成式AI攻防对抗、网络犯罪规模化、全球大选与地缘政治动荡和新型网络威胁的快速增长,网络安全也将迎来一次重大变革和洗牌。 以下是人工智能...
-
2024年人工智能与数字孪生趋势
人工智能(AI)和数字孪生是两个备受关注的技术领域,它们在多个行业中都有着重要的应用。以下是人工智能和数字孪生的一些趋势: 1.在城市中实施生成式人工智能 到2024年,人工智能(AI 在塑造城市技术格局方面将发挥巨大作用。城市在人工智能的使用方面取得...
-
全世界机器人共用一个大脑,谷歌DeepMind已经完成了第一步
过去一年,生成式人工智能发展的核心关键词,就是「大」。 人们逐渐接受了强化学习先驱 Rich Sutton 充分利用算力「大力出奇迹」的思潮,庞大的数据量是 AI 模型展现出惊人智慧的核心原因。数据规模越大、质量越高、标注越细,模型就能了解到更全面的世界...
-
5.28 深圳活动|Jina AI 生态助力云原生场景下的 AIGC 应用开发
亚马逊云科技 Community Day 将于 5 月 28 日 在深圳南山区海德酒店 11 楼举办,Jina AI 软件工程师付杰将带来 《Jina AI 生态助力云原生场景下的 AIGC 应用开发》 的主题演讲。 Community Day 是亚马逊云...
-
MIT新研究:打工人不用担心被AI淘汰!成本巨贵,视觉工作只有23%可替代
人工智能会抢走我们的工作吗?如果你每天都看硅谷高管谈论着当今尖端的AI技术,可能会觉得答案是肯定的,并且会很快发生。 不过,刚刚MIT计算机科学与人工智能实验室(CSAIL)最近的一项研究,可以让我们可以松一口气了:至少视觉AI还无法替代太多人类。 论...
-
群聊冷场怎么破?茴香豆用AI帮你解决问题
群聊冷场怎么破?这项有趣而实用的AI技术可以帮你解决问题,化解尴尬。茴香豆(HuixiangDou)是一个基于大语言模型的群聊知识助手,能够自动识别并回答群聊中的技术相关问题,同时避免被非技术内容干扰。其可集成到即时聊天工具中,如微信和飞书,主要服务于技术...
-
RAG实战 7 - 使用llama_index实现多模态RAG
LLM之RAG实战(七)| 使用llama_index实现多模态RAG 文章目录 LLM之RAG实战(七)| 使用llama_index实现多模态RAG 一、多模态RAG 二、多模态LLM 三、多模态嵌入 四、多模态索引与检索 五、多...
-
「think step by step」还不够,让模型「think more steps」更有用
如今,大型语言模型(LLM)及其高级提示策略的出现,标志着对语言模型的研究取得了重大进展,尤其是在经典的 NLP 任务中。这其中一个关键的创新是思维链(CoT)提示技术,该技术因其在多步骤问题解决中的能力而闻名。这项技术遵循了人类的顺序推理,在各种挑战中...
-
AI4Science还是伪命题吗?两年后workshop组织者重新审视AI4Science
2021年,一群热血青年提出了要把AI4Science(AI for Science)带入机器学习顶会NeurIPS。 什么?AI4Science是一门学科吗?是不是靠着AI蹭热点?各种质疑声接踵而来。 这些质疑和不解也反映在了第一届AI4Science...
-
马作的卢飞快!上海AI Lab发布首个模仿人类学习范式的自动驾驶决策框架DiLu
本文经自动驾驶之心公众号授权转载,转载请联系出处。 DiLu(的卢)是首个基于AI Agent范式的知识驱动自动驾驶框架,其结合了常识知识和大语言模型,通过记忆模块以实现闭环自动驾驶决策制定并拥有持续进化的能力。通过不断对环境的交互积累经验,自我反思纠...