-
论文笔记:Code Llama: Open Foundation Models for Code
导语 Code Llama是开源模型Llama 2在代码领域的一个专有模型,作者通过在代码数据集上进行进一步训练得到了了适用于该领域的专有模型,并在测试基准中超过了同等参数规模的其他公开模型。 链接:https://arxiv.org/abs/23...
-
Apollo开源轻量级多语言医疗 LLM:助力将医疗 AI 民主化推广至60亿人口
医疗人工智能(AI)技术正在迅速发展,旨在利用大型语言模型(LLMs 的巨大潜力彻底改变医疗保健交付方式。这些技术进步承诺提高诊断准确性,个性化治疗方案,并解锁全面医学知识的获取,从根本上改变患者护理。将 AI 整合到医疗保健中旨在提高医疗服务的效率和精确...
-
Sora是『神笔马良』还是AI怪物?首篇综述一探乾坤!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 Sora是一种文本到视频生成的人工智能模型,由OpenAI于2024年2月发布。该模型经过训练,能够从文本指令中生成逼真或想象的场景视频,并显示出在模拟物理世界方面的潜...
-
DenseMamba:大模型的DenseNet时刻,Mamba和RetNet精度显著提升
随着 ChatGPT 的突破性进展,大型语言模型(LLMs)迎来了一个崭新的里程碑。这些模型在语言理解、对话交互和逻辑推理方面展现了卓越的性能。过去一年,人们目睹了 LLaMA、ChatGLM 等模型的诞生,它们基于 Transformer 架构,采用多...
-
清华NLP组发布InfLLM:无需额外训练,「1024K超长上下文」100%召回!
大模型只能够记忆与理解有限的上下文已经成为大模型在真实应用中的能力瓶颈,例如对话式AI系统往往无法记忆你前一天对话的内容,利用大模型构建智能体会产生前后不一致的行为与记忆。 为了让大模型能够记忆并处理更长的上下文,来自清华大学、麻省理工学院和人民大学的研...
-
Hume.AI官网体验入口 人工智能情感理解工具使用地址
Hume.AI是一家专注于开发能够理解人类情感和表情的技术的公司。他们提供表情测量API和自定义模型API,以帮助预测和改善人类福祉。无论是研究人员、开发者还是企业,都可以从Hume.AI的技术中受益。 点击前往Hume.AI官网体验入口 Hume.A...
-
Inflection-2.5官网体验入口 人工智能个人AI对话聊天模型免费使用地址
Inflection-2.5是Inflection公司推出的升级版个人AI模型,它结合了强大的原始能力和独特的情感微调。该模型在训练时仅使用了GPT- 4 的40%计算资源,但在性能上接近GPT-4。Inflection-2. 5 在编程和数学等智力领域取...
-
联合国教科文组织:由OpenAI和Meta支持的AI工具存在性别歧视内容
联合国教科文组织发布的研究报告指出,由OpenAI和Meta算法推动的全球最广泛使用的人工智能(AI)工具存在性别歧视现象。该研究中,专家评估了两种算法以及OpenAI的GPT-2和GPT-3.5,这两者分别是人们熟知的聊天机器人ChatGPT的免费版本的...
-
花旗高管表示:生成式AI在银行业具有变革性,但在客户支持方面存在风险
在花旗银行,生成式人工智能(Gen AI)已经在推动数据驱动决策方面取得了积极而深远的影响。花旗银行的首席分析技术与创新负责人Promiti Dutta表示,Gen AI的出现引起了银行内部的一场大变革,将数据和分析置于所有事务的前沿。 Dutta在VB的...
-
Meta AI提出MobileLLM:为在移动设备上部署LLM提供新思路
Meta AI 研究团队推出的 MobileLLM 标志着大语言模型(LLMs)朝着模拟人类理解和生成自然语言迈出了革命性的一步。LLMs 在处理和分析大量数据集方面的能力已经显著影响了自动化客户服务、语言翻译和内容创作等多个领域。然而,由于传统 LLMs...
-
北大具身智能成果入选CVPR'24:只需一张图一个指令,就能让大模型玩转机械臂
只靠一张物体图片,大语言模型就能控制机械臂完成各种日常物体操作吗? 北大最新具身大模型研究成果ManipLLM将这一愿景变成了现实: 在提示词的引导下,大语言模型在物体图像上直接预测机械臂的操作点和方向。 进而,得以操控机械臂直接玩转各项具体的任务: 例...
-
十分钟读完 Meta提出Llama 2模型的经典论文:Llama 2: Open Foundation and Fine-Tuned Chat Models
超越GPT-3:Meta AI发布新一代开源人工智能对话大模型Llama 2 引言:介绍 Llama 2 的发布背景和其在对话用例中的优化。 随着人工智能技术的飞速发展,大型语言模型(LLMs)已经成为了人类智能助手的代表,它们在需要专业知识的复杂推理...
-
能力与可信度可以兼得?GPT-4、Gemini等多模态大模型评测报告来了
2023 年我们正见证着多模态大模型的跨越式发展,多模态大语言模型(MLLM)已经在文本、代码、图像、视频等多模态内容处理方面表现出了空前的能力,成为技术新浪潮。以 Llama 2,Mixtral 为代表的大语言模型(LLM),以 GPT-4、Gemi...
-
英伟达、Hugging Face和ServiceNow发布用于代码生成的新StarCoder2 LLM
这些模型目前有三种不同的大小,已经在600多种编程语言(包括低资源语言 上进行了培训,以帮助企业在其开发工作流中加速各种与代码相关的任务,它们是在开放的BigCode项目下开发的,该项目是ServiceNow和Huging Face联合发起的,以确保...
-
随着AI控制你的智能手机,Appt时代的结束可能已经指日可待
在2024年世界移动通信大会上,不可能不提及AI,其中有一件事已经变得明确:AI肯定会占据我们的智能手机。 在巴塞罗那举行的科技活动上,几家公司和芯片制造商来演示了GenAI工具可以进入我们口袋的方式。 当然,你的手机已经可以访问ChatGPT或谷歌的...
-
知名AI研究者深挖谷歌Gemma:参数不止70亿,设计原则很独特
就在几天前,开源大模型领域迎来了重磅新玩家:谷歌推出了全新的开源模型系列「Gemma」。相比 Gemini,Gemma 更加轻量,同时保持免费可用,模型权重也一并开源了,且允许商用。 谷歌发布了包含两种权重规模的模型:Gemma 2B 和 Gemma...
-
MATRIX:社会模拟推动大模型价值自对齐,比GPT4更「体贴」
模型如 ChatGPT 依赖于基于人类反馈的强化学习(RLHF),这一方法通过鼓励标注者偏好的回答并惩罚不受欢迎的反馈,提出了一种解决方案。然而,RLHF 面临着成本高昂、难以优化等问题,以及在超人类水平模型面前显得力不从心。为了减少乃至消除对人类监督的...
-
数据治理必须如何发展才能应对GenAI的挑战
最近我想到了数据治理,所以我决定通过输入提示来查询ChatGPT:“什么是数据治理?”,人工智能回应道:“数据治理是一套流程、政策、标准和指导方针,可确保在企业内适当地管理、保护和利用数据”,这是一个很好的开始,此时此刻,关于数据治理及其意义还有很多要...
-
基于AI开发畅销书的自助出版平台Inkitt融资3700万美元
自助出版平台Inkitt近日成功融资3,700万美元,由Khosla Ventures领投,总估值达4亿美元。该平台旨在通过人工智能(AI)将用户创作的故事转化为畅销书,并以此为基础构建21世纪的“迪士尼”。 Inkitt的应用允许用户自主出版故事,然后...
-
VSP-LLM官网体验入口 视觉语音处理AI模型免费使用下载地址
VSP-LLM是一个结合视觉语音处理与大型语言模型的框架,旨在通过LLMs的强大能力最大化上下文建模能力。VSP-LLM设计用于执行视觉语音识别和翻译的多任务,通过自监督视觉语音模型将输入视频映射到LLM的输入潜在空间。该框架通过提出一种新颖的去重方法和低...
-
掌握商业人工智能:使用 RAG 和 CRAG 构建企业级人工智能平台
通过我们的指南了解如何为您的企业释放人工智能的力量。了解 RAG 和 CRAG 集成、矢量嵌入、LLM 和提示工程。非常适合负责任地拥抱人工智能的企业。 为企业打造AI-Ready平台 企业在引入生成式人工智能时,会遇到许多需要战略管理的业务风险。这...
-
借助知识图谱和Llama-Index实现基于大模型的RAG
幻觉是在处理大型语言模型(LLMs)时常见的问题。LLMs生成流畅连贯的文本,但经常产生不准确或不一致的信息。防止LLMs中出现幻觉的一种方法是使用外部知识源,如提供事实信息的数据库或知识图谱。 矢量数据库和知识图谱使用不同的方法来存储和表示数据。矢量数...
-
爆火Sora背后的技术,一文综述扩散模型的最新发展方向
为了使机器具有人类的想象力,深度生成模型取得了重大进展。这些模型能创造逼真的样本,尤其是扩散模型,在多个领域表现出色。扩散模型解决了其他模型的限制,如 VAEs 的后验分布对齐问题、GANs 的不稳定性、EBMs 的计算量大和 NFs 的网络约束问题。因...
-
大模型幻觉的起因、评估及落地场景下基于知识图谱的缓解策略探索
针对大模型落地应用的问题,当前行业内普遍的做法是利用大模型进行问答,但在实际应用中,这种方法往往效果不佳,很多问题的答案并不具有实际参考价值。作为算法人员,我们需要深入了解问题的来源,对于大模型产生的幻觉问题,我们需要明确其定义,是主观的还是客观的,并探...
-
Nomic AI 发布首个完全开源的长文本嵌入模型,超越 OpenAI Ada-002在各项基准测试中的表现
在自然语言处理(NLP)领域不断发展的背景下,理解和处理广泛的文本内容至关重要。最近的一些进展显著提升了语言模型的能力,特别是通过文本嵌入的发展。这些嵌入成为许多应用的基础,包括大型语言模型(LLMs 的检索增强生成和语义搜索。它们将句子或文档转换为低维向...
-
LLM是世界模型的新证据?ChatGPT能理解WiFi等物理信号,并猜出你的位置
大语言模型是否是世界模型? 大语言模型除了在数字世界完成如写作或翻译等任务,它们能否理解并处理物理世界中的信息并进而完成更广泛的任务呢? 最近来自香港科技大学(HKUST)、南洋理工大学(NTU 与加利福尼亚大学洛杉矶分校(UCLA 的研究者们提供了新的思...
-
将AI融入CG特效工作流;对谈Dify创始人张路宇;关于Llama 2的一切资源;普林斯顿LLM高阶课程;LLM当前的10大挑战 | ShowMeAI日报
?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦! ? 将AI融入CG特效工作流,体验极致的效率提升 BV1pP411r7HY 这是 B站UP主 @特效小哥studio 和 @拓星研究所 联...
-
上海人工智能实验室发布LLaMA-Adapter | 如何1小时训练你的多模态大模型用于下游任务
本文首发于微信公众号 CVHub,未经授权不得以任何形式售卖或私自转载到其它平台,违者必究! Title: LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-...
-
AIGC|LangChain新手入门指南,5分钟速读版!
如果你用大语言模型来构建AI应用,那你一定不可能绕过LangChain,LangChain是现在最热门的AI应用框架之一,去年年底才刚刚发布,它在github上已经有了4.6万颗星的点赞了,在github社区上,每天都有众多大佬,用它创造一些很新很酷的应用...
-
羊驼2:开放的基础和微调聊天模型--Llama 2论文阅读
论文地址:https://arxiv.org/pdf/2307.09288.pdfd 代码地址:GitHub - facebookresearch/llama-recipes: Examples and recipes for Llama 2 model...
-
AIGC(MLLM、VLM、LLM、SD)系列——论文解读目录
涉及面广:多模态生成模型——MLLM ( 目前集中在视觉语言模型——VLM)、大语言模型——LLM、生成模型(SD系列)、对比学习的经典模型(CLIP系列)。 持续更新:对于已经完成解读的会附上链接(有的会在一些场景做尝试,也会附上链接供大家快速参考结果...
-
AI新工具(20240203) 文心一言APP数字分身;HuggingChat Assistants等
文心一言APP数字分身-一键生成专属数字分身 文心一言数字分身是一项新功能,用户只需一张照片和录制三句语音,就能创建一个专属的数字分身。这个数字分身还支持个性化定义名称、声音、MBTI性格等,用户可以选择是否公开自己的数字分身。这个功能的上线大大缩短...
-
中文LLaMa和Alpaca大语言模型开源方案 | 扩充中文词表 & 针对中文语料进行高效编码
欢迎关注『CVHub』官方微信公众号! Title: Efficient and Effective Text Encoding for Chinese Llama and AlpacaPDF: https://arxiv.org/pdf/23...
-
llama/llama2论文解读
llama 摘要 llama在约1.4T的token上,训练出参数量7B到65B的模型,其模型规模如下 在仅使用开源数据集的情况下,llama-13B在多数benchmarks上与GPT-3效果相当;llama-65B也与最好的模型(Chin...
-
苹果展示 AI 新模型 MGIE,可一句话精修图片
2 月 8 日消息,相比较微软的风生水起,苹果公司在 AI 领域的布局显得低调很多,但这并不意味着苹果在该领域就没有丝毫建树。苹果公司近日发布了名为“MGIE”的新型开源人工智能模型,它可以根据自然语言指令编辑图像。 图源:VentureBeat 与...
-
【AIGC】prompt工程从入门到精通
注:本文示例默认“文心大模型3.5”演示,表示为>或w>(wenxin ,有时为了对比也用百川2.0展示b>(baichuan 有时候为了模拟错误输出,会用到m>(mock 表示(因为用的大模型都会给出正确答案) 有时候直接贴网络...
-
无需RLHF显著提升GPT-4/Llama2性能,北大团队提出Aligner对齐新范式
背景 大语言模型(LLMs)虽展现出了强大的能力,但也可能产生不可预测和有害的输出,例如冒犯性回应、虚假信息和泄露隐私数据,给用户和社会造成伤害。确保这些模型的行为与人类意图和价值观相对齐,是一个紧迫的挑战。 尽管基于人类反馈的强化学习(RLHF)提供了...
-
生成式AI公司Galileo推出检索增强生成工具
生成式AI公司Galileo最近推出了一项新的工具,旨在帮助企业开发可信赖的人工智能(AI)解决方案。这项名为检索增强生成(RAG 和代理分析的解决方案旨在应对RAG系统的复杂性,该系统已成为大型语言模型(LLMs 开发者越来越受欢迎的工具。 RAG系统通...
-
大语言模型之LlaMA系列- LlaMA 2及LLaMA2_chat(上)
LlaMA 2是一个经过预训练与微调的基于自回归的transformer的LLMs,参数从7B至70B。同期推出的Llama 2-Chat是Llama 2专门为对话领域微调的模型。 在许多开放的基准测试中Llama 2-Chat优于其他开源的聊天模型,此外...
-
iPhone AI图像编辑P图app工具免费在线使用地址 苹果MGIE开源模型官网体验入口
MGIE是一项由苹果开源的技术,利用多模态大型语言模型(MLLMs)生成图像编辑指令,通过端到端训练,捕捉视觉想象力并执行图像处理操作,使图像编辑更加智能、直观。 点击前往MGIE官网体验入口 MGIE旨在满足以下需求人群: "用户可以通过自然语言直观地...
-
MGIE官网体验入口 苹果多模态大语言模型AI图像编辑工具在线使用地址
MGIE是一项由苹果开源的技术,利用多模态大型语言模型(MLLMs)生成图像编辑指令,通过端到端训练,捕捉视觉想象力并执行图像处理操作,使图像编辑更加智能、直观。 点击前往MGIE官网体验入口 需求人群: "用户可以通过自然语言直观地描述图像编辑需求,如...
-
飞浆AI studio人工智能课程学习(1)-大模型时代&优质Prompt
文章目录 大模型时代&优质Prompt Al生成技术价值概览 开始构建你的优质prompt 近十年深度学习模型主要更迭 为什么大模型能够有如此强大的表现力 大模型与Prompt 例1: 画一幅画,呆萌的小猫躺在大泡泡中 例2:请生成...
-
苹果研究团队揭示WRAP技术:用合成数据进行预训练大模型 成本低准确性高
近几个月来,大型语言模型(LLMs)在人工智能社区中引起了极大的关注和流行。这些模型在文本摘要、问答、代码完成、内容生成等任务中展示出了强大的能力。 然而,LLMs通常在不充分的网络抓取数据上进行训练。这些数据通常杂乱、无结构,表达不清晰。按照现有的扩展原...
-
NLP国内外大模型汇总列表[文心一言、智谱、百川、星火、通义千问、盘古等等]
国内外大模型汇总列表 中国大模型列表大全,全面收集有明确来源的大模型情况,包括机构、来源信息和分类等,随时更新。 Awesome family related to LLMS includes: https://github.com/wgwang...
-
生成式AI监管:“深度伪造技术”是否表明大语言模型的自由意志?
当我们给生成式AI特定风格的提示词时,也意味着我们希望它能够发挥想象力。要求人工智能进行想象是承认它有这样做的意愿,而不仅仅是有这样做的能力(或拥有这样做的内容)。这种意愿并不能设定在一本有图示的书中,因此我们不能告诉它打开某一页,让它自己照着步骤做。汽...
-
AIGC:如何开启人工智能驱动的数据分析新时代大门?
随着人工智能技术的不断突破,我们已经迈入了数据分析的新纪元。在这个时代,AIGC( 具备生成能力的人工智能)的应用正成为引领潮流的先锋。本文将带你一探究竟,深入剖 析GPTs应用商店的魔力所在、Python技术栈的无限可能、生成代码与开发提效的秘诀、数...
-
图领域首个通用框架来了!入选ICLR'24 Spotlight,任意数据集、分类问题都可搞定
能不能有一种通用的图模型—— 它既能够根据分子结构预测毒性,又能够给出社交网络的朋友推荐? 或者既能预测不同作者的论文引用,还可以发现基因网络中的人类衰老机制? 你还真别说,被ICLR 2024接收为Spotlight的“One for All(OFA)...
-
BiTA:创新AI方法加速大型语言模型生成
近年来,基于transformer架构的大型语言模型(LLMs)已经崭露头角。Chat-GPT和LLaMA-2等模型展示了LLMs参数的迅速增加,从几十亿到数万亿。尽管LLMs是非常强大的生成器,但由于所有参数的计算负载,它们在推理延迟方面存在问题。因此,...
-
2023-12-30 AIGC-LangChain指南-打造LLM的垂域AI框架
摘要: 2023-12-30 AIGC-LangChain指南-打造LLM的垂域AI框架 LangChain指南-打造LLM的垂域AI框架 CHATGPT以来,Langchain 可能是目前在 AI 领域中最热门的事物之一,仅次于向量数据库。...
-
十分钟读完「降低 LLaMA 模型微调内存占用的QLoRA」论文
QLoRA 提出内存高效的微调方法!降低 LLaMA 模型微调内存占用,仅需数小时追赶 ChatGPT 引言:大模型微调的新时代 随着人工智能技术的飞速发展,大型语言模型(Large Language Models,LLMs)已成为自然语言处理领域的重...