-
十分钟读完「降低 LLaMA 模型微调内存占用的QLoRA」论文
QLoRA 提出内存高效的微调方法!降低 LLaMA 模型微调内存占用,仅需数小时追赶 ChatGPT 引言:大模型微调的新时代 随着人工智能技术的飞速发展,大型语言模型(Large Language Models,LLMs)已成为自然语言处理领域的重...
-
学习AIGC大模型必知的强化学习RL的核心代码示例,速进!!!
Look!👀我们的大模型商业化落地产品 📖更多AI资讯请👉🏾关注 Free三天集训营助教在线为您火热答疑👩🏼🏫 在人工智能的发展历程中,强化学习(RL)已成为推动技术突破的关键动力,尤其在自动化内容生成(AIGC)和大型语言模型(LLM)的领域中...
-
【网安AIGC专题10.19】论文6(顶会ISSTA 2023):提出新Java漏洞自动修复数据集:数据集 VJBench+大语言模型、APR技术+代码转换方法+LLM和DL-APR模型的挑战与机会
How Effective Are Neural Networks for Fixing Security Vulnerabilities 写在最前面 摘要 贡献 发现 介绍 背景:漏洞修复需求和Java漏洞修复方向 动机 方法 贡献...
-
谷歌的Bard在聊天机器人排名中击败了GPT-4
谷歌的Bard最近通过其Gemini Pro版本在LMSYS聊天机器人榜上超越了OpenAI的GPT-4,标志着聊天机器人领域的一次显著变革。这款更新使得Bard成为LMSYS榜上第二高分的聊天机器人,逐渐摆脱了OpenAI在聊天机器人领域的主导地位。...
-
OpenAI预警系统探索 GPT-4 在制造生物武器方面的优势
OpenAI最近着手研发GPT-4的早期预警系统,以探讨大型语言模型是否能够提高获取关于生物威胁信息的效率,相较于互联网。该系统旨在作为一种“触发器”,提示潜在存在生物武器的可能性,需要进一步调查,同时纳入OpenAI的预防框架。 研究采用了100名参与...
-
人工智能教程(七):Scikit-learn 和训练第一个模型
在本系列的 上一篇文章 中,我们用 TensorFlow 构建了第一个神经网络,然后还通过 Keras 接触了第一个数据集。我们还将介绍另一个强大的机器学习 Python 库 scikit-learn。不过在进入正题之前,我要介绍两个轰动性的人工...
-
技术融合下的虚拟角色创建与实践
作者 | 崔皓 审校 | 重楼 摘要 文章详细介绍了百川大模型在创建个性化虚拟角色方面的创新技术和应用。这项技术结合了LangChain和Qianfan微调的Llama2-Chinese大模型,提供了高度个性化的角色定制功能。 作者通过实际体验和技术模...
-
AI实时对话系统WhisperFusion:集成大模型,与AI无缝语音对话
WhisperFusion是一个基于WhisperLive和WhisperSpeech技术的AI对话系统,通过在实时语音转文本流程中集成Mistral大型语言模型(LLM),实现了与AI的无缝对话。 LLM和Whisper均经过TensorRT引擎优化,以...
-
Kore.ai获得1.5亿美元用于开发对话式AI平台 英伟达也参投
Kore.ai 获得了 1.5 亿美元的投资,用于开发其对话/生成型人工智能平台技术。这轮融资于周二(1 月 30 日)宣布,由 FTV Capital 领投,芯片制造商英伟达也参与了投资。 这家总部位于佛罗里达州奥兰多的公司表示,它将利用这笔资金扩大其...
-
多模态LLM多到看不过来?先看这26个SOTA模型吧
当前 AI 领域的关注重心正从大型语言模型(LLM)向多模态转移,于是乎,让 LLM 具备多模态能力的多模态大型语言模型(MM-LLM)就成了一个备受关注的研究主题。 近日,腾讯 AI Lab、京都大学和穆罕默德・本・扎耶德人工智能大学的一个研究团队发布...
-
OpenAI“复制粘贴”背后:剽窃者想要免费获得一切
如今,人们发表的文章或作品被剽窃,而剽窃者免费使用或为此获利的事例屡见不鲜。从互联网到AI,莫不如此。 比如,如今火热的OpenAI,其AI模型就很少为其使用的内容付费,该公司在2023年创造了13亿美元的收入。 OpenAI的狡辩 在《纽约时报》针对...
-
纯文本模型训出「视觉」表征!MIT最新研究:语言模型用代码就能作画
只会「看书」的大语言模型,有现实世界的视觉感知力吗?通过对字符串之间的关系进行建模,关于视觉世界,语言模型到底能学会什么? 最近,麻省理工学院计算机科学与人工智能实验室(MIT CSAIL)的研究人员对语言模型的视觉能力进行了系统的评估,从简单形状、物体...
-
美国点评网站Yelp将加强AI功能 部分功能已在iOS版上线
美国点评网站Yelp推出AI摘要、预算工具等新功能,以帮助商家 Yelp是领先的商家评论平台,它刚刚推出了冬季产品更新,增加了20多个新功能,提升了其人工智能能力。这些功能帮助商家吸引更多的客户,优化他们的支出,建立在Yelp之前以用户和商家需求为重点的人...
-
AIGC的隐私安全问题及隐私保护技术
作者:京东科技 杨博 ChatGPT 才出现两个月,就已经引起了学术界的关注。微软成为ChatGPT母公司OpenAI的合作伙伴,并确认投资百亿美元。同时,微软正计划将 OpenAI 的技术整合到其产品中,包括Bing搜索引擎和其他软件,以增强它们的能力...
-
ChatGPT和Midjourney王炸组合,开启AI新时代
目录 序言 一:使用ChatGPT进行对话 二:调用newbies robot 三:举例说明 四:付费和使用限制 序言 随着人工智能技术的不断发展,越来越多的人开始使用人工智能工具来创作图画。在这里,我将分享如何结合ChatGPT和...
-
准确率不足20%,GPT-4V/Gemini竟看不懂漫画!首个图像序列基准测试开源
OpenAI的GPT-4V和谷歌最新的Gemini多模态大语言模型一经推出就得到业界和学界的热切关注: 一系列工作都从多角度展示了这些多模态大语言模型对视频的理解能力。人们似乎相信我们离通用人工智能artificial general intellige...
-
Essential AI与Google Cloud达成全新多年合作伙伴关系,加速全栈生成式AI产品发展
Essential AI与Google Cloud宣布建立全新的多年合作伙伴关系,旨在简化和扩展全栈生成人工智能产品的开发,助力企业用户做出数据驱动的决策。该合作使Essential AI成为首批充分利用Google Cloud全新TPU v5p的公司之一...
-
Semron筹集790万美元,用于移动设备的3D封装AI芯片、效率提升20倍
德国公司Semron最近成功融资了790万美元(730万欧元),旨在通过先进的3D封装技术推动移动设备上的AI芯片效率提升。总部位于德累斯顿的Semron表示,他们的目标是在移动设备上设立新的AI芯片标准,以满足行业不断发展的需求。 图源备注:图片由AI...
-
大模型也能切片,微软SliceGPT让LLAMA-2计算效率大增
大型语言模型(LLM)通常拥有数十亿的参数,用了数万亿 token 的数据进行训练,这样的模型训练、部署成本都非常高。因此,人们经常用各种模型压缩技术来减少它们的计算需求。 一般来讲,这些模型压缩技术可以分为四类:蒸馏、张量分解(包括低秩因式分解)、剪枝...
-
把图像视为外语,快手、北大多模态大模型媲美DALLE-3
当前的大型语言模型如 GPT、LLaMA 等在自然语言处理领域取得了显著进展,能够理解和生成复杂的文本内容。但你是否想过,如果能够将大语言模型这强大的理解和生成能力迁移到多模态数据上,就可以轻松理解海量的图像与视频,并辅助创作图文并茂的内容。近期,来自快...
-
Essential AI选择谷歌云作为其人工智能的支持
Essential AI选择了谷歌云。Essential AI是一家由两位著名的前谷歌员工创立的企业初创公司,它选择了谷歌云作为其人工智能服务的支撑。 图源备注:图片由AI生成,图片授权服务商Midjourney 谷歌、微软和亚马逊都在试图说服初创公司在...
-
OpenAI启动一个帮助青少年安全地使用人工智能的项目
OpenAI在周一宣布,它将与Common Sense Media合作,启动一个旨在帮助青少年安全地使用人工智能的项目。 “我们想要找出如何让这个工具安全、负责、广泛地提供给青少年和那些将要把它作为教育经历的一部分的人,”OpenAI的首席执行官Sam...
-
每日一看大模型新闻(2023.11.14)谷歌提出新型生成式AI模型IGN;谷歌天气预报模型GraphCast登刊Science;贾扬清吐槽国产大模型套壳Llama 假装自研,零一万物回应
1.产品发布 1.1面壁智能:发布AI Agents首个SaaS级产品ChatDev 发布日期:2023-11-15 面壁智能打造首个“大模型+Agent” SaaS级产品ChatDev 主要内容:面壁智能已经推出了基于群体智能和其新一代千...
-
过去六个月,国内超40款AI大模型产品获得备案审批
:据最新统计,国内在过去的六个月内批准了超过40个人工智能(AI)模型供公众使用,旨在迎头赶上美国在AI领域的发展。 上周,中国监管机构共批准了14个大型语言模型(LLM)供公众使用,其中包括小米公司、第四范式和零一万物等企业。这标志着中国政府批准的第四批...
-
第三十二章:ChatGPT与AIGC在物联网领域的应用
1.背景介绍 物联网(Internet of Things,IoT 是指通过互联网将物体和设备连接起来,实现数据的传输和共享。物联网技术已经广泛应用于各个领域,如智能家居、智能城市、智能制造、智能农业等。随着数据量的增加和计算能力的提高,人工智能...
-
2024年1月17日Arxiv最热论文推荐:清华提出多模态知识检索新框架、MIT新方法大幅提升LLMs的连贯性、浙大新模型助力视频任务新突破、Meta 革新搜索技术、Google革新AI写作
本文整理了今日发表在ArXiv上的AI论文中最热门的TOP5。 论文解读、论文热度排序、论文标签、中文标题、推荐理由和论文摘要均由赛博马良平台(saibomaliang.com)上的智能体 「AI论文解读达人」 提供。 如需查看其他热门论文,欢迎移步 ...
-
微软开发新型大模型压缩方法SliceGPT
SliceGPT是微软开发的一种新型的大语言模型压缩方法。通过SLICE GPT,可以在保持99%,99%,和90%零样本任务性能的同时,将LLAMA2-70B、OPT66B和Phi-2模型分别去除高达25%的模型参数(包括嵌入)。 这意味着使用SLICE...
-
谷歌与Singular Computing达成AI专利纠纷和解
谷歌刚刚和一家人工智能技术专利诉讼的对手达成了数十亿美元的和解。这家硬件和软件开发公司Singular Computing从谷歌那里获得了一笔未公开的和解金,这结束了Singular的创始人Joseph Bates博士对谷歌提起的长达五年的联邦法院专利侵权...
-
无需人工标注!LLM加持文本嵌入学习:轻松支持100种语言,适配数十万下游任务
文本嵌入(word embedding)是自然语言处理(NLP)领域发展的基础,可以将文本映射到语义空间中,并转换为稠密的矢量,已经被广泛应用于各种自然语言处理(NLP)任务中,如信息检索(IR)、问答、文本相似度计算、推荐系统等等, 比如在IR领域,第...
-
百川智能发布大模型Baichuan3 称中文评测超越GPT-4
百川智能于 1 月 29 日推出了拥有超过千亿参数的大型语言模型Baichuan 3。该模型在多个公认的通用能力评估,如CMMLU、GAOKAO和AGI-Eval等,都展示了卓越的表现,特别是在中文任务上更是超过了GPT- 4 的水平。同时,该模型在数学和...
-
谷歌AI研究提出 SpatialVLM:一种数据合成和预训练机制,以增强视觉语言模型 VLM 空间推理能力
谷歌AI研究团队最近提出了SpatialVLM,这是一种旨在增强视觉语言模型(VLMs)空间推理能力的创新系统。 尽管先进的模型如GPT-4V在人工智能驱动任务中取得了显著进展,但它们在空间推理方面仍存在显著局限。空间推理涉及理解物体在三维空间中的位置以及...
-
谷歌AI芯片TPU v5p在训练LLM方面比其前一代快2.8倍
谷歌正迅速成为其最好的朋友英伟达的强大对手——其超级计算机所使用的TPU v5p人工智能芯片比以往任何时候都更快、更大、更宽,甚至超过了强大的H100。谷歌在最近推出其Gemini人工智能模型的同时,也发布了其最新版本的旗舰张量处理单元(TPU),用于人工...
-
从20亿数据中学习物理世界,基于Transformer的通用世界模型成功挑战视频生成
建立会做视频的世界模型,也能通过Transformer来实现了! 来自清华和极佳科技的研究人员联手,推出了全新的视频生成通用世界模型——WorldDreamer。 它可以完成自然场景和自动驾驶场景多种视频生成任务,例如文生视频、图生视频、视频编辑、动作序...
-
Llama-2 推理和微调的硬件要求总结:RTX 3080 就可以微调最小模型
大语言模型微调是指对已经预训练的大型语言模型(例如Llama-2,Falcon等)进行额外的训练,以使其适应特定任务或领域的需求。微调通常需要大量的计算资源,但是通过量化和Lora等方法,我们也可以在消费级的GPU上来微调测试,但是消费级GPU也无法承载比...
-
电商:如何使用ChatGPT和AIGC提高电商体验
1.背景介绍 1. 背景介绍 随着互联网的普及和人们对在线购物的需求不断增长,电商已经成为了一个非常热门的行业。为了提高电商体验,提高客户满意度,降低客户流失率,企业需要不断创新和优化自己的在线购物体验。在这里,人工智能(AI 和机器学习(M...
-
让知识图谱成为大模型的伴侣
大型语言模型(LLM 能够在短时间内生成非常流畅和连贯的文本,为人工智能的对话、创造性写作和其他广泛的应用开辟了新的可能性,然而,LLM也有着一些关键的局限性。它们的知识仅限于从训练数据中识别出的模式,这意味着缺乏对世界的真正理解。同时,推理能力也是有限...
-
Siri正在使用OpenAI的ChatGPT测试新功能
根据最新的 iOS 17.4 Beta 1 更新,苹果公司正在继续开发基于大型语言模型技术的新版 Siri,并借助 OpenAI 的 ChatGPT API 进行内部测试。具体来说,iOS 17.4 中包含了一个名为 SiriSummarization 的...
-
【网安AIGC专题10.19】论文3代码生成:ChatGPT+自协作代码生成+角色扮演(分析员、程序员、测试员)+消融实验、用于MBPP+HumanEval数据集
Self-collaboration Code Generation via ChatGPT 写在最前面 朋友分享的收获与启发 课堂讨论 代码生成如何协作,是一种方法吗 思路相同 交互实用性 代码生成与自协作框架 摘要 相关工作 PP...
-
高效底座模型LLaMA
论文标题:LLaMA: Open and Efficient Foundation Language Models 论文链接:https://arxiv.org/abs/2302.13971 论文来源:Meta AI 一、概述 大型语...
-
怎么快速转行并学习提示工程师的方法
chatgpt的出现毫无疑问打破了原有的商业格局, 各个公司都已逐渐使用chatgpt来取代人工,反正老板总是提出各种逆天的要求,但chatgpt可不一定听得懂,雇一个翻译那可真是一个好主意 -------------提示工程师 以往要费几天功夫的...
-
18LLM4SE革命性技术揭秘:大型语言模型LLM在软件工程SE领域的全景解析与未来展望 - 探索LLM的多维应用、优化策略与软件管理新视角【网安AIGC专题11.15】作者汇报 综述
Large Language Models for Software Engineering: A Systematic Literature Review 写在最前面 论文名片 课堂讨论 RQ1部分:LLMs的选择和优化 RQ2部分:LLM...
-
聚观早报 |苹果官网大促销;微软开放AI助手Copilot
聚观早报每日整理最值得关注的行业重点事件,帮助大家及时了解最新行业动态,每日读报,就读聚观365资讯简报。 整理丨Cutie 1月17日消息 苹果官网大促销 微软开放AI助手Copilot vivo X100 Ultra影像规格曝光 智谱A...
-
随着公司努力平衡成本,在AI领域疯狂招聘,在其他部门大力裁员
行业专家表示,随着科技公司优先投资于AI并大举招聘,其他细分市场的裁员可能会持续到2024年。 根据追踪机构blayoffs.fyi的数据,到目前为止,2024年已经有超过2万名科技员工失去了工作。 “谷歌和其他大型科技公司在AI上下了很大赌注,同时削...
-
工作场所中的人工智能、元宇宙和DEI
随着人工智能和元宇宙重塑工作,领导者应该考虑新兴技术影响DEI的三个关注领域和机会。 2023年夏天,当代表好莱坞演员和作家的工会举行罢工时,一个关键的症结是使用人工智能来完成人类作家和演员的工作。一家领先的商业银行宣布,其正在利用元宇宙和人工智能的结...
-
NeurIPS 2023精选回顾:大模型最火,清华ToT思维树上榜
近日,作为美国前十的科技博客,Latent Space对于刚刚过去的NeurIPS 2023大会进行了精选回顾总结。 在NeurIPS会议总共接受的3586篇论文之中,除去6篇获奖论文,其他论文也同样优秀和具有潜力,甚至有可能预示着下一个AI领域的新突破...
-
思科调查:超25%公司在内部实施了生成式AI禁令
根据思科(Cisco 日前进行的一项调查,尽管很多员工了解生成式AI在数据隐私方面的缺陷,但许多人仍在向ChatGPT等类似的AI应用程序输入敏感的公司数据。 思科针对全球12个国家的2600名隐私和安全专业人士进行的年度数据隐私基准调查表明,超过四分...
-
Oracle推出云生成式AI服务 帮助企业部署和微调语言模型
数据库巨头Oracle近日推出了Oracle Cloud Infrastructure Generative AI服务,发布的同时推出了各种创新技术,使大型企业能够利用生成式AI技术的最新成果。 这次推出的OCI Generative AI服务是一项全...
-
Jasper ai: 智能AI写作文章内容生成助手工具
Jasper.ai是一款使用了人工智能技术的AI文章写作助手工具,可以帮助你快速生成各种类型的文案和内容。无论你是想要写营销广告、博客文章、电子邮件、社交媒体帖子,还是想要创作诗歌、故事、歌词等,都可以为你提供灵感和支持。 限时优惠:点此访问并注册Jas...
-
AIGC:大语言模型开放平台OpenLLM简介(提供简易的模型部署体验)
文章目录 @[toc] 简介 一、安装 二、启动LLM服务器 项目链接 简介 该项目旨在为各种大语言模型(LLM)在生产环境中的部署和可观测性提供一个标准的解决方案,用最简单直接的方式把大语言模型(LLM)部署到云端或本...
-
2024 年,3 项技术将为生成式人工智能提供帮助
随着 ChatGPT 惊艳的首年即将落幕,生成式人工智能(genAI)与大型语言模型(LLM)无疑已成为引人瞩目的技术焦点。然而,在企业的黄金时期,它们是否已具备投入使用的能力呢?ChatGPT 所遭遇的挑战众所周知,其在回答问题时的准确性尚待提高。尽...