-
华科大发布多模态大模型新基准 覆盖五大任务
近期,华中科技大学等机构发布了一项关于多模态大模型(LMMs)的全面评估新基准,旨在解决多模态大模型性能评估的问题。这项研究涉及了14个主流多模态大模型,包括谷歌Gemini、OpenAI GPT-4V等,覆盖了五大任务、27个数据集。然而,由于多模态大模...
-
UCLA华人提出全新自我对弈机制!LLM自己训自己,效果碾压GPT-4专家指导
合成数据已经成为了大语言模型进化之路上最重要的一块基石了。 在去年底,有网友扒出前OpenAI首席科学家Ilya曾经在很多场合表示过,LLM的发展不存在数据瓶颈,合成数据可以解决大部分的问题。 图片 英伟达高级科学家Jim Fan在看了最近的一批论文后也...
-
匿名论文提出奇招!增强大模型长文本能力居然还能这么做
一提到提高大模型长文本能力,就想到长度外推或者上下文窗口扩展? 不行,这些都太费硬件资源了。 来看一个奇妙新解: 和长度外推等方法使用KV缓存的本质不同,它用模型的参数来存储大量上下文信息。 具体办法就是建一个临时Lora模块,让它仅在长文本生成过程中“...
-
AI2发布开放语言模型OLMo 号称多项性能媲美Llama2
AI2最新发布的开放语言模型(OLMo)框架旨在推动大规模语言模型的研究和实验。通过在Hugging Face和GitHub上提供训练代码、模型和评估代码,AI2致力于让学术界和研究人员能够共同研究语言模型的科学,探索新的预训练数据子集对下游性能的影响,以...
-
数据为王!如何通过数据一步步构建高效的自动驾驶算法?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 下一代自动驾驶技术期望依赖于智能感知、预测、规划和低级别控制之间的专门集成和交互。自动驾驶算法性能的上限一直存在巨大的瓶颈,学术界和业界一致认为,克服瓶颈的关键在于以...
-
DALL-E 系列:AI绘画背后的惊人真相!!【1个离奇内幕、3个意想不到、5大秘密揭示】
DALL-E 系列:AI绘图原理,根据用户给出的描述,生成与描述相匹配的图像 DALL-E 1 dVAE Transformer DALL-E 2 CLIP 先验 prior decoder(image) DALL-E 3...
-
当物联网遇上人工智能:技术的未来展望
人工智能(AI 已经取得了惊人的进步,并作为一种普遍适用的技术对社会产生了影响。 但早期的人工智能研究,始于20世纪50年代。如今,人工智能仍在不断发展。当数据过多时,人工智能会很有帮助。物联网(IoT 预计将显著增加生成的数据量,目前估计每天约为2.5...
-
深度学习(生成式模型)—— stable diffusion:High-Resolution Image Synthesis with Latent Diffusion Models
文章目录 前言 motivation Conditioning Mechanisms 实验结果 如何训练autoencoder LDM性能与autoencoder深度的联系 LDM带来的图像生成速率提升 LDM在图像生成任务上与sota方法比...
-
关于推荐系统,有六大让人震惊的“秘密”
推荐系统自1992 年代诞生以来, 到2024 年的今天已经有32 年的发展历程。在这几十年的发展历程中,各个互联网和科技公司上线过数以百万计的推荐系统模型。尽管推荐系统经历过 2012 到 2014 年的发展低潮,但很快就被后起之秀快手和字节跳动一改颓...
-
Warning!远距离LiDAR感知
本文经自动驾驶之心公众号授权转载,转载请联系出处。 一、引言 去年开了图森ai day之后,一直想以文字形式总结一下这几年在远距离感知方面所做的工作,正好最近有时间了,就想写一篇文章记录一下这几年的研究历程。本文所提到的内容都在图森ai day视频[0]...
-
【扩散模型】万字长文全面理解与应用Stable Diffusion
万字长文全面理解与应用Stable Diffusion 1. Stable Diffusion简介 1.1 基本概念 1.2 主体结构 1.3 训练细节 1.4 模型评测 1.5 模型应用 1.6 模型版本 1.7 其他类型的条件生成模型 1...
-
十分钟读完「降低 LLaMA 模型微调内存占用的QLoRA」论文
QLoRA 提出内存高效的微调方法!降低 LLaMA 模型微调内存占用,仅需数小时追赶 ChatGPT 引言:大模型微调的新时代 随着人工智能技术的飞速发展,大型语言模型(Large Language Models,LLMs)已成为自然语言处理领域的重...
-
大模型技术实践(三)|用LangChain和Llama 2打造心灵疗愈机器人
上期文章我们实现了Llama 2-chat-7B模型的云端部署和推理,本期文章我们将用“LangChain+Llama 2”的架构打造一个定制化的心灵疗愈机器人。有相关知识背景的读者可以直接阅读「实战」部分。 01 背景...
-
Informatica调查:全球企业优先考虑生成式 AI
企业云数据管理领导者Informatica发布了其年度调查结果,题为《CDO Insights2024:制定AI准备路线》。调查聚焦全球数据领袖,包括首席数据官在内,有600名受访者提供了他们对生成式人工智能准备的见解,并突显了在实施该方法时的关键技术和组...
-
【思路合集】talking head generation+stable diffusion
1 以DiffusionVideoEditing为baseline: 改进方向 针对于自回归训练方式可能导致的漂移问题: 训练时,在前一帧上引入小量的面部扭曲,模拟在生成过程中自然发生的扭曲。促使模型查看身份帧以进行修正。 在像VoxCeleb或L...
-
赶超Gemini Pro,提升推理、OCR能力的LLaVA-1.6太强了
去年 4 月,威斯康星大学麦迪逊分校、微软研究院和哥伦比亚大学研究者共同发布了 LLaVA(Large Language and Vision Assistant)。尽管 LLaVA 是用一个小的多模态指令数据集训练的,却在一些样本上展示了与 GPT-4...
-
【网安AIGC专题10.19】论文6(顶会ISSTA 2023):提出新Java漏洞自动修复数据集:数据集 VJBench+大语言模型、APR技术+代码转换方法+LLM和DL-APR模型的挑战与机会
How Effective Are Neural Networks for Fixing Security Vulnerabilities 写在最前面 摘要 贡献 发现 介绍 背景:漏洞修复需求和Java漏洞修复方向 动机 方法 贡献...
-
人工智能教程(七):Scikit-learn 和训练第一个模型
在本系列的 上一篇文章 中,我们用 TensorFlow 构建了第一个神经网络,然后还通过 Keras 接触了第一个数据集。我们还将介绍另一个强大的机器学习 Python 库 scikit-learn。不过在进入正题之前,我要介绍两个轰动性的人工...
-
Depth Anything:释放大规模无标注数据的深度估计
本文经自动驾驶之心公众号授权转载,转载请联系出处。 24年1月论文“Depth Anything: Unleashing the Power of Large-Scale Unlabeled Data“,来自香港大学、字节、浙江实验室和浙江大学。 这项...
-
Python进行数据分析||AIGC生成的Python-Pandas库的一些主要函数及其使用实例来进行数据分析
在Python的Pandas库中,有许多函数可以用来进行数据分析。以下是一些主要函数及其使用实例: read_csv( :这个函数用于从CSV文件中读取数据。例如,如果你有一个名为"my_data.csv"的文件,你可以使用以下代码来读取它: im...
-
揭秘NVIDIA大模型推理框架:TensorRT-LLM
一、TensorRT-LLM 的产品定位 TensorRT-LLM 是 NVIDIA 用于做 LLM(Large Language Model)的可扩展推理方案。该方案是基于 TensorRT 深度学习编译框架来构建、编译并执行计算图,并借鉴了许多 Fa...
-
【深度学习】AIGC ,ControlNet 论文,原理,训练,部署,实战,教程(一)
论文:https://arxiv.53yu.com/pdf/2302.05543 代码:https://github.com/lllyasviel/ControlNet 得分几个博客完成这个事情的记录了,此篇是第一篇,摘录了一些论文内容。ControlN...
-
AIGC内容分享(四十):生成式人工智能(AIGC)应用进展浅析
目录 0 引言 1 以ChatGPT为代表的AIGC发展现状 1.1 国外AIGC应用发展现状 1.2 国内AIGC应用发展现状 2 AIGC的技术架构 (1)数据层 (2)算力基础设施层 (3)算法及大模型层 (4)AI...
-
AI视野:OpenAI推新模型GPT-4-0125-preview;阿里Qwen-VL升级更新;苹果播客新增转录功能;AI写真项目InstantID在GitHub爆火
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 🤖📱💼AI应用 OpenAI不服...
-
ChatGPT is not all you need,一文看尽SOTA生成式AI模型:6大公司9大类别21个模型全回顾(三)
文章目录 ChatGPT is not all you need,一文看尽SOTA生成式AI模型:6大公司9大类别21个模型全回顾(三) Text-to-Text 模型 ChatGPT LaMDA PEER Meta AI Speech f...
-
Mistral-Medium意外泄露?冲上榜单的这个神秘模型让AI社区讨论爆了
「我现在 100% 确信 Miqu 与 Perplexity Labs 上的 Mistral-Medium 是同一个模型。」 近日,一则关于「Mistral-Medium 模型泄露」的消息引起了大家的关注。 泄露传闻与一个名为「Miqu」的新模型有关,在...
-
WhisperKit官网体验入口 AI自动语音识别模型压缩与优化工具在线使用地址
WhisperKit是一个专为自动语音识别模型压缩与优化而设计的强大工具。它不仅支持对模型进行压缩和优化,还提供详细的性能评估数据。WhisperKit还为不同数据集和模型格式提供质量保证认证,并支持本地复现测试结果。 点击前往WhisperKit官网体...
-
决定AI在你的数字化转型战略中的位置的五个问题
新冠疫情加速了企业在客户和员工体验数字化方面的投资,这与我25年的数字化转型职业生涯中看到的任何事情都不同。根据我们最新的研究结果,仅在2023年,大公司就平均承担了20项计划,成本至少为100万美元,决策者预计在未来几年内将承担更多此类项目。 当然,...
-
深入浅出完整解析Stable Diffusion(SD)核心基础知识
2022年,Stable Diffusion模型横空出世,其成为AI行业从传统深度学习时代走向AIGC时代的标志性模型之一,并为工业界,投资界,学术界以及竞赛界都注入了新的AI想象空间,让AI再次性感。 Stable Diffusion是计算机视觉领域的...
-
伯克利开源高质量大型机器人操控基准,面对复杂自主操控任务不再犯难
随着人工智能和机器人技术的迅速发展,功能操控(Functional Manipulation)在机器人学中的重要性愈加突出。传统的基准测试已无法满足目前机器人对复杂操控任务的需求,呼吁新的操控基准(Functional Manipulation Ben...
-
多模态LLM多到看不过来?先看这26个SOTA模型吧
当前 AI 领域的关注重心正从大型语言模型(LLM)向多模态转移,于是乎,让 LLM 具备多模态能力的多模态大型语言模型(MM-LLM)就成了一个备受关注的研究主题。 近日,腾讯 AI Lab、京都大学和穆罕默德・本・扎耶德人工智能大学的一个研究团队发布...
-
南大周志华团队8年力作!「学件」系统解决机器学习复用难题,「模型融合」涌现科研新范式
HuggingFace是目前最火热的机器学习开源社区,汇集30万个不同的机器学习模型,有超过10万个应用可供用户访问和使用。 如果HuggingFace上这30万个模型,可以自由组合,共同完成新的学习任务,那会是一种什么样的画面? 其实在HuggingF...
-
Code Llama 70B霸榜3连发,练习5个月击败GPT-4!小扎LeCun亲自官宣上新
今天,Meta正式发布了Code Llama 70B,作为Code Llama系列中规模最大,性能最强的版本,一举击败了GPT-4! 目前,模型共有三个版本,均可免费用于研究和商业目的: CodeLlama - 70B:基础代码模型; CodeLlama...
-
OpenAI“复制粘贴”背后:剽窃者想要免费获得一切
如今,人们发表的文章或作品被剽窃,而剽窃者免费使用或为此获利的事例屡见不鲜。从互联网到AI,莫不如此。 比如,如今火热的OpenAI,其AI模型就很少为其使用的内容付费,该公司在2023年创造了13亿美元的收入。 OpenAI的狡辩 在《纽约时报》针对...
-
AIGC实战——自编码器(Autoencoder)
AIGC实战——自编码器 0. 前言 1. 自编码器原理 2. 数据集与模型分析 2.1 Fashion-MNIST 数据集 2.2 自编码器架构 3. 去噪自编...
-
阿里Animate Anyone体验入口 AI生成动画视频怎么使用指南教程方法
Animate Anyone是一款专为角色动画而设计的先进扩散模型。通过驱动信号从静态图像生成角色视频,Animate Anyone引入了一系列创新性的技术,包括ReferenceNet、高效的姿势指导器以及有效的时间建模方法。这些设计保证了生成的视频在外...
-
近200+自动驾驶数据集全面调研!一览如何数据闭环全流程
写在前面&个人理解 自动驾驶技术在硬件和深度学习方法的最新进展中迅速发展,并展现出令人期待的性能。高质量的数据集对于开发可靠的自动驾驶算法至关重要。先前的数据集调研试图回顾这些数据集,但要么集中在有限数量的数据集上,要么缺乏对数据集特征的详细调查...
-
纯文本模型训出「视觉」表征!MIT最新研究:语言模型用代码就能作画
只会「看书」的大语言模型,有现实世界的视觉感知力吗?通过对字符串之间的关系进行建模,关于视觉世界,语言模型到底能学会什么? 最近,麻省理工学院计算机科学与人工智能实验室(MIT CSAIL)的研究人员对语言模型的视觉能力进行了系统的评估,从简单形状、物体...
-
人工智能范式从模型为中心转向数据为中心
面向数据的人工智能可以有助于减少生成式AI系统中的幻觉和偏见,从而提高其输出质量。 译自The Paradigm Shift from Model-Centric to Data-Centric AI,作者 Rahul Pradhan 拥有16年以上的经...
-
AIGC的隐私安全问题及隐私保护技术
作者:京东科技 杨博 ChatGPT 才出现两个月,就已经引起了学术界的关注。微软成为ChatGPT母公司OpenAI的合作伙伴,并确认投资百亿美元。同时,微软正计划将 OpenAI 的技术整合到其产品中,包括Bing搜索引擎和其他软件,以增强它们的能力...
-
百川智能发布千亿参数大模型,中文能力超越GPT-4!
“追上ChatGPT水平,我觉得今年内可能就能够实现,但对于GPT-4或者GPT-5,我认为可能需要3年左右的时间,应该不会低于两年。”去年4月,百川智能创始人王小川当初曾这样判断自己入局大模型赛道后的进度。就在昨天,千亿参数规模的百川大模型终于来了!...
-
GPT-4不服被Bard反超:最新模型已入场
“大模型排位赛”权威榜单Chatbot Arena刷新: 谷歌Bard超越GPT-4,排名位居第二,仅次于GPT-4 Turbo。 然鹅,众多网友对此却表示“不服”、“不公平”。 原来,谷歌AI掌门人Jeff Dean透露,Bard性能大幅提升,是因为...
-
德克萨斯州大学将建立学术界最大之一的生成式AI中心
德克萨斯州奥斯汀 - 德克萨斯大学奥斯汀分校(UT)正在建立一个学术界最强大的人工智能中心,以引领研究并为广泛的合作伙伴提供世界一流的人工智能基础设施。 图源备注:图片由AI生成,图片授权服务商Midjourney UT正在启动生成式人工智能中心,该中心...
-
stable-diffusion 安装和使用
安装: 在电脑上安装环境依赖 继续安装 把下面这两个文件复制到stable-diffusion-webui 下面 点击A...
-
Taiyi-Diffusion-XL体验入口 中英文双语文生图AI模型开源工具在线使用地址
Taiyi-Diffusion-XL是一款开源的基于 Stable Diffusion 训练的双语文生图生成模型。该模型支持英文和中文的文本到图像生成,相比之前的中文文生图模型有了显著提升。Taiyi-Diffusion-XL 能够根据文本描述生成照片般逼...
-
AIGC实战——使用变分自编码器生成面部图像
AIGC实战——使用变分自编码 - 器生成面部图像 0. 前言 1. 数据集分析 2. 训练变分自编码器 2.1 变分自编码器架构 2.2 变分自编码器分析 3....
-
大模型也能切片,微软SliceGPT让LLAMA-2计算效率大增
大型语言模型(LLM)通常拥有数十亿的参数,用了数万亿 token 的数据进行训练,这样的模型训练、部署成本都非常高。因此,人们经常用各种模型压缩技术来减少它们的计算需求。 一般来讲,这些模型压缩技术可以分为四类:蒸馏、张量分解(包括低秩因式分解)、剪枝...
-
PAI-ChatLearn :灵活易用、大规模 RLHF 高效训练框架(阿里云最新实践)
PAI-ChatLearn 是阿里云机器学习平台 PAI 团队自主研发的,灵活易用、大规模模型 RLHF 高效训练框架,支持大模型进行 SFT(有监督指令微调)、RM(奖励模型)、RLHF(基于人类反馈的强化学习)完整训练流程。PAI-ChatLear...
-
Copilot in Power BI详细使用说明
1、获取账号 请先参考: Copilot in Power BI等了好久终于等到今天 官网订阅接近4万元/月,在这里100元/月 2、获取账号后,用初始密码登录powerbi首页 https://app.powerbi.com/ 强制修改密码,...
-
[AIGC大数据基础] Spark 入门
大数据处理已成为当代数据领域的重要课题之一。为了高效地处理和分析大规模数据集,许多大数据处理引擎应运而生。其中,Spark作为一个快速、通用的大数据处理引擎备受关注。 本文将从“是什么、怎么用、为什么用”三个角度来介绍Spark。首先,我们会详细探讨...