数据集第37页 - AIGC资讯

基于LLaMA Factory，单卡3小时训练专属大模型 Agent

大家好，今天给大家带来一篇 Agent 微调实战文章 Agent（智能体）是当今 LLM（大模型）应用的热门话题 [1]，通过任务分解（task planning）、工具调用（tool using）和多智能体协作（multi-agent cooperat...

大数据 2024-02-03 人工智能

1513阅读

【CV】稳定扩散模型（Stable Diffusion）

?大家好，我是Sonhhxg_柒，希望你看完之后，能对你有所帮助，不足请指正！共同学习交流? ?个人主页－Sonhhxg_柒的博客_CSDN博客 ? ?欢迎各位→点赞? + 收藏⭐️ + 留言? ?系列专栏 - 机器学习【ML】自...

人工智能 2024-02-03 人工智能

1022阅读

张晴晴：对话数据推动AIGC——大模型底层数据探索

“Training data is technology” . 数据即科技，OpenAI的联合创始人IlyaSutskever在与知名科技媒体The Verge访谈中提到。ChatGPT自发布以来热度席卷全球，一周前惊艳亮相的GPT-4更是...

人工智能 2024-02-03 人工智能

984阅读

LLaMA、Baichuan、ChatGLM、Qwen、天工等大模型对比

12.10更新：Qwen技术报告核心解读 Baichuan Baichuan 2: Open Large-scale Language Models 数据处理：数据频率和质量，使用聚类和去重方法，基于LSH和dense embedding方...

大数据 2024-02-03 人工智能

1987阅读

AIGC智能编程：编程革新还是就业陷阱？

AIGC智能编程：程序员的失业陷阱？引言随着人工智能的迅猛发展，智能编程技术也越来越受到关注。AIGC智能编程是一种利用人工智能技术自动生成代码的方法，它能够极大地提高编程效率和质量。然而，这种技术的兴起也引发了人们对程序员就业前景的忧虑。本文...

生成式AI 2024-02-03 人工智能

934阅读

LLaMA模型指令微调字节跳动多模态视频大模型 Valley 论文详解

Valley: Video Assistant with Large Language model Enhanced abilitY 大家好，我是卷了又没卷，薛定谔的卷的AI算法工程师「陈城南」~ 担任某大厂的算法工程师，带来最新的前沿AI知识和工具...

大数据 2024-02-03 人工智能

1080阅读

快速入门ChatGPT和AIGC：底层原理、热门工具、行业现状【我们能做什么】

最近大家热议的ChatGPT和AI绘画工具的底层技术原理是什么？是如何发展到现在的？有哪些应用场景、热门工具？AIGC产业上下游有哪些公司？作为普通用户，我们还能接触哪些应用AI技术打造的商业解决方案？…… 我们查阅了AIGC相关相关的调研报告和各类资料...

AIGC 2024-02-03 人工智能

1374阅读

大模型也有小偷？为保护你的参数，上交大给大模型制作「人类可读指纹」

大模型的预训练需要耗费巨量的计算资源和数据，因而预训练模型的参数也正成为各大机构重点保护的核心竞争力和资产。然而，不同于传统的软件知识产权保护可以通过比对源代码来确认是否存在代码盗用，对预训练模型参数盗用的判断存在以下两方面的新问题： 1）预训练模型的...

生成式AI 2024-02-03 人工智能

922阅读

基于医疗领域数据微调LLaMA——ChatDoctor模型

文章目录 ChatDoctor简介数据构建和训练过程建立外部知识库 ChatDoctor相比ChatGPT有什么优势？ ChatDoctor的效果代码解读 train_lora.py文件解读微调实战下载仓库并进入目录创建con...

人工智能 2024-02-03 人工智能

1130阅读

年龄两岁，教龄一年半：婴儿AI训练师登上Science

在公开采访中，图灵奖得主 Yann LeCun 多次提到，现在的 AI 模型和人类婴儿相比，学习效率实在是太低了。那么，如果让一个 AI 模型去学习婴儿头戴摄像头拍到的东西，它能学到什么？最近，Science 杂志上的一篇论文进行了初步尝试。研究发现，...

大数据 2024-02-02 人工智能

825阅读

GPT-4V只能排第二！华科大等发布多模态大模型新基准：五大任务14个模型全面测评

近期，多模态大模型（LMMs）在视觉语言任务方面展示了令人印象深刻的能力。然而，由于多模态大模型的回答具有开放性，如何准确评估多模态大模型各个方面的性能成为一个迫切需要解决的问题。目前，一些方法采用GPT对答案进行评分，但存在着不准确和主观性的问题。另...

大数据 2024-02-02 人工智能

988阅读

如何用Stable Diffusion生成高质量的图全网最全介绍！（附资料）

Stable Diffusion无疑是最近最火的AI绘画工具之一，所以本期给大家带来了全新Stable Diffusion 提示词资料包（文末可获取） Stable Diffusion Stable Diffusion是一个开源的图像生成AI系统,...

生成式AI 2024-02-02 人工智能

2062阅读

英国部长们敦促保护创意人员作品被AI公司使用

上议院一个委员会表示，部长们必须捍卫内容创作者的利益，他们的作品在未经科技公司许可的情况下被用来构建人工智能产品，例如产生“巨额经济回报”的聊天机器人。英国上议院通信和数字委员会表示，随着人工智能发展的兴起，英国的法律框架未能执行版权的基本原则。该委员会...

人工智能 2024-02-02 人工智能

818阅读

华科大发布多模态大模型新基准覆盖五大任务

近期，华中科技大学等机构发布了一项关于多模态大模型（LMMs）的全面评估新基准，旨在解决多模态大模型性能评估的问题。这项研究涉及了14个主流多模态大模型，包括谷歌Gemini、OpenAI GPT-4V等，覆盖了五大任务、27个数据集。然而，由于多模态大模...

生成式AI 2024-02-02 人工智能

1002阅读

UCLA华人提出全新自我对弈机制！LLM自己训自己，效果碾压GPT-4专家指导

合成数据已经成为了大语言模型进化之路上最重要的一块基石了。在去年底，有网友扒出前OpenAI首席科学家Ilya曾经在很多场合表示过，LLM的发展不存在数据瓶颈，合成数据可以解决大部分的问题。图片英伟达高级科学家Jim Fan在看了最近的一批论文后也...

大数据 2024-02-02 人工智能

952阅读

匿名论文提出奇招！增强大模型长文本能力居然还能这么做

一提到提高大模型长文本能力，就想到长度外推或者上下文窗口扩展？不行，这些都太费硬件资源了。来看一个奇妙新解：和长度外推等方法使用KV缓存的本质不同，它用模型的参数来存储大量上下文信息。具体办法就是建一个临时Lora模块，让它仅在长文本生成过程中“...

大数据 2024-02-02 人工智能

869阅读

AI2发布开放语言模型OLMo 号称多项性能媲美Llama2

AI2最新发布的开放语言模型（OLMo）框架旨在推动大规模语言模型的研究和实验。通过在Hugging Face和GitHub上提供训练代码、模型和评估代码，AI2致力于让学术界和研究人员能够共同研究语言模型的科学，探索新的预训练数据子集对下游性能的影响，以...

大数据 2024-02-02 人工智能

812阅读

数据为王！如何通过数据一步步构建高效的自动驾驶算法？

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解下一代自动驾驶技术期望依赖于智能感知、预测、规划和低级别控制之间的专门集成和交互。自动驾驶算法性能的上限一直存在巨大的瓶颈，学术界和业界一致认为，克服瓶颈的关键在于以...

生成式AI 2024-02-02 人工智能

1079阅读

DALL-E 系列：AI绘画背后的惊人真相！！【1个离奇内幕、3个意想不到、5大秘密揭示】

DALL-E 系列：AI绘图原理，根据用户给出的描述，生成与描述相匹配的图像 DALL-E 1 dVAE Transformer DALL-E 2 CLIP 先验 prior decoder（image） DALL-E 3...

AIGC 2024-02-02 人工智能

1152阅读

当物联网遇上人工智能：技术的未来展望

人工智能(AI 已经取得了惊人的进步，并作为一种普遍适用的技术对社会产生了影响。但早期的人工智能研究，始于20世纪50年代。如今，人工智能仍在不断发展。当数据过多时，人工智能会很有帮助。物联网(IoT 预计将显著增加生成的数据量，目前估计每天约为2.5...

大数据 2024-02-02 人工智能

872阅读

深度学习（生成式模型）—— stable diffusion：High-Resolution Image Synthesis with Latent Diffusion Models

文章目录前言 motivation Conditioning Mechanisms 实验结果如何训练autoencoder LDM性能与autoencoder深度的联系 LDM带来的图像生成速率提升 LDM在图像生成任务上与sota方法比...

大数据 2024-02-02 人工智能

1019阅读

关于推荐系统，有六大让人震惊的“秘密”

推荐系统自1992 年代诞生以来, 到2024 年的今天已经有32 年的发展历程。在这几十年的发展历程中，各个互联网和科技公司上线过数以百万计的推荐系统模型。尽管推荐系统经历过 2012 到 2014 年的发展低潮，但很快就被后起之秀快手和字节跳动一改颓...

人工智能 2024-02-02 人工智能

1109阅读

Warning！远距离LiDAR感知

本文经自动驾驶之心公众号授权转载，转载请联系出处。一、引言去年开了图森ai day之后，一直想以文字形式总结一下这几年在远距离感知方面所做的工作，正好最近有时间了，就想写一篇文章记录一下这几年的研究历程。本文所提到的内容都在图森ai day视频[0]...

人工智能 2024-02-02 人工智能

948阅读

【扩散模型】万字长文全面理解与应用Stable Diffusion

万字长文全面理解与应用Stable Diffusion 1. Stable Diffusion简介 1.1 基本概念 1.2 主体结构 1.3 训练细节 1.4 模型评测 1.5 模型应用 1.6 模型版本 1.7 其他类型的条件生成模型 1...

AIGC 2024-02-02 人工智能

4045阅读

十分钟读完「降低 LLaMA 模型微调内存占用的QLoRA」论文

QLoRA 提出内存高效的微调方法！降低 LLaMA 模型微调内存占用，仅需数小时追赶 ChatGPT 引言：大模型微调的新时代随着人工智能技术的飞速发展，大型语言模型（Large Language Models，LLMs）已成为自然语言处理领域的重...

大数据 2024-02-02 人工智能

1543阅读

大模型技术实践（三）｜用LangChain和Llama 2打造心灵疗愈机器人

上期文章我们实现了Llama 2-chat-7B模型的云端部署和推理，本期文章我们将用“LangChain+Llama 2”的架构打造一个定制化的心灵疗愈机器人。有相关知识背景的读者可以直接阅读「实战」部分。 01 背景...

AIGC 2024-02-01 人工智能

1507阅读

Informatica调查:全球企业优先考虑生成式 AI

企业云数据管理领导者Informatica发布了其年度调查结果，题为《CDO Insights2024:制定AI准备路线》。调查聚焦全球数据领袖，包括首席数据官在内，有600名受访者提供了他们对生成式人工智能准备的见解，并突显了在实施该方法时的关键技术和组...

大数据 2024-02-01 人工智能

837阅读

【思路合集】talking head generation+stable diffusion

1 以DiffusionVideoEditing为baseline：改进方向针对于自回归训练方式可能导致的漂移问题：训练时，在前一帧上引入小量的面部扭曲，模拟在生成过程中自然发生的扭曲。促使模型查看身份帧以进行修正。在像VoxCeleb或L...

人工智能 2024-02-01 人工智能

1046阅读

赶超Gemini Pro，提升推理、OCR能力的LLaVA-1.6太强了

去年 4 月，威斯康星大学麦迪逊分校、微软研究院和哥伦比亚大学研究者共同发布了 LLaVA（Large Language and Vision Assistant）。尽管 LLaVA 是用一个小的多模态指令数据集训练的，却在一些样本上展示了与 GPT-4...

大数据 2024-02-01 人工智能

895阅读

【网安AIGC专题10.19】论文6（顶会ISSTA 2023）：提出新Java漏洞自动修复数据集：数据集 VJBench+大语言模型、APR技术+代码转换方法+LLM和DL-APR模型的挑战与机会

How Effective Are Neural Networks for Fixing Security Vulnerabilities 写在最前面摘要贡献发现介绍背景：漏洞修复需求和Java漏洞修复方向动机方法贡献...

AIGC 2024-02-01 人工智能

1269阅读

人工智能教程（七）：Scikit-learn 和训练第一个模型

在本系列的上一篇文章中，我们用 TensorFlow 构建了第一个神经网络，然后还通过 Keras 接触了第一个数据集。我们还将介绍另一个强大的机器学习 Python 库 scikit-learn。不过在进入正题之前，我要介绍两个轰动性的人工...

人工智能 2024-02-01 人工智能

1033阅读

Depth Anything：释放大规模无标注数据的深度估计

本文经自动驾驶之心公众号授权转载，转载请联系出处。 24年1月论文“Depth Anything: Unleashing the Power of Large-Scale Unlabeled Data“，来自香港大学、字节、浙江实验室和浙江大学。这项...

AIGC 2024-02-01 人工智能

931阅读

Python进行数据分析||AIGC生成的Python-Pandas库的一些主要函数及其使用实例来进行数据分析

在Python的Pandas库中，有许多函数可以用来进行数据分析。以下是一些主要函数及其使用实例： read_csv( ：这个函数用于从CSV文件中读取数据。例如，如果你有一个名为"my_data.csv"的文件，你可以使用以下代码来读取它： im...

人工智能 2024-02-01 人工智能

912阅读

揭秘NVIDIA大模型推理框架：TensorRT-LLM

一、TensorRT-LLM 的产品定位 TensorRT-LLM 是 NVIDIA 用于做 LLM（Large Language Model）的可扩展推理方案。该方案是基于 TensorRT 深度学习编译框架来构建、编译并执行计算图，并借鉴了许多 Fa...

大数据 2024-02-01 人工智能

1501阅读

【深度学习】AIGC ，ControlNet 论文，原理，训练，部署，实战，教程（一）

论文：https://arxiv.53yu.com/pdf/2302.05543 代码：https://github.com/lllyasviel/ControlNet 得分几个博客完成这个事情的记录了，此篇是第一篇，摘录了一些论文内容。ControlN...

人工智能 2024-02-01 人工智能

1274阅读

AIGC内容分享(四十)：生成式人工智能（AIGC）应用进展浅析

目录 0 引言 1 以ChatGPT为代表的AIGC发展现状 1.1 国外AIGC应用发展现状 1.2 国内AIGC应用发展现状 2 AIGC的技术架构（1）数据层（2）算力基础设施层（3）算法及大模型层（4）AI...

人工智能 2024-02-01 人工智能

1560阅读

AI视野：OpenAI推新模型GPT-4-0125-preview；阿里Qwen-VL升级更新；苹果播客新增转录功能；AI写真项目InstantID在GitHub爆火

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ ???AI应用 OpenAI不服...

人工智能 2024-01-31 人工智能

893阅读

ChatGPT is not all you need，一文看尽SOTA生成式AI模型：6大公司9大类别21个模型全回顾（三）

文章目录 ChatGPT is not all you need，一文看尽SOTA生成式AI模型：6大公司9大类别21个模型全回顾（三） Text-to-Text 模型 ChatGPT LaMDA PEER Meta AI Speech f...

生成式AI 2024-01-31 人工智能

975阅读

Mistral-Medium意外泄露？冲上榜单的这个神秘模型让AI社区讨论爆了

「我现在 100% 确信 Miqu 与 Perplexity Labs 上的 Mistral-Medium 是同一个模型。」近日，一则关于「Mistral-Medium 模型泄露」的消息引起了大家的关注。泄露传闻与一个名为「Miqu」的新模型有关，在...

生成式AI 2024-01-31 人工智能

786阅读

WhisperKit官网体验入口 AI自动语音识别模型压缩与优化工具在线使用地址

WhisperKit是一个专为自动语音识别模型压缩与优化而设计的强大工具。它不仅支持对模型进行压缩和优化，还提供详细的性能评估数据。WhisperKit还为不同数据集和模型格式提供质量保证认证，并支持本地复现测试结果。点击前往WhisperKit官网体...

人工智能 2024-01-31 人工智能

876阅读

决定AI在你的数字化转型战略中的位置的五个问题

新冠疫情加速了企业在客户和员工体验数字化方面的投资，这与我25年的数字化转型职业生涯中看到的任何事情都不同。根据我们最新的研究结果，仅在2023年，大公司就平均承担了20项计划，成本至少为100万美元，决策者预计在未来几年内将承担更多此类项目。当然，...

AIGC 2024-01-31 人工智能

873阅读

深入浅出完整解析Stable Diffusion（SD）核心基础知识

2022年，Stable Diffusion模型横空出世，其成为AI行业从传统深度学习时代走向AIGC时代的标志性模型之一，并为工业界，投资界，学术界以及竞赛界都注入了新的AI想象空间，让AI再次性感。 Stable Diffusion是计算机视觉领域的...

人工智能 2024-01-31 人工智能

2943阅读

伯克利开源高质量大型机器人操控基准，面对复杂自主操控任务不再犯难

随着人工智能和机器人技术的迅速发展，功能操控（Functional Manipulation）在机器人学中的重要性愈加突出。传统的基准测试已无法满足目前机器人对复杂操控任务的需求，呼吁新的操控基准（Functional Manipulation Ben...

人工智能 2024-01-31 人工智能

835阅读

多模态LLM多到看不过来？先看这26个SOTA模型吧

当前 AI 领域的关注重心正从大型语言模型（LLM）向多模态转移，于是乎，让 LLM 具备多模态能力的多模态大型语言模型（MM-LLM）就成了一个备受关注的研究主题。近日，腾讯 AI Lab、京都大学和穆罕默德・本・扎耶德人工智能大学的一个研究团队发布...

生成式AI 2024-01-31 人工智能

840阅读

南大周志华团队8年力作！「学件」系统解决机器学习复用难题，「模型融合」涌现科研新范式

HuggingFace是目前最火热的机器学习开源社区，汇集30万个不同的机器学习模型，有超过10万个应用可供用户访问和使用。如果HuggingFace上这30万个模型，可以自由组合，共同完成新的学习任务，那会是一种什么样的画面？其实在HuggingF...

大数据 2024-01-31 人工智能

1029阅读

Code Llama 70B霸榜3连发，练习5个月击败GPT-4！小扎LeCun亲自官宣上新

今天，Meta正式发布了Code Llama 70B，作为Code Llama系列中规模最大，性能最强的版本，一举击败了GPT-4！目前，模型共有三个版本，均可免费用于研究和商业目的： CodeLlama - 70B：基础代码模型； CodeLlama...

AIGC 2024-01-31 人工智能

877阅读

OpenAI“复制粘贴”背后：剽窃者想要免费获得一切

如今，人们发表的文章或作品被剽窃，而剽窃者免费使用或为此获利的事例屡见不鲜。从互联网到AI，莫不如此。比如，如今火热的OpenAI，其AI模型就很少为其使用的内容付费，该公司在2023年创造了13亿美元的收入。 OpenAI的狡辩在《纽约时报》针对...

大数据 2024-01-31 人工智能

853阅读

AIGC实战——自编码器(Autoencoder)

AIGC实战——自编码器 0. 前言 1. 自编码器原理 2. 数据集与模型分析 2.1 Fashion-MNIST 数据集 2.2 自编码器架构 3. 去噪自编...

人工智能 2024-01-31 人工智能

739阅读

阿里Animate Anyone体验入口 AI生成动画视频怎么使用指南教程方法

Animate Anyone是一款专为角色动画而设计的先进扩散模型。通过驱动信号从静态图像生成角色视频，Animate Anyone引入了一系列创新性的技术，包括ReferenceNet、高效的姿势指导器以及有效的时间建模方法。这些设计保证了生成的视频在外...

生成式AI 2024-01-31 人工智能

1031阅读

近200+自动驾驶数据集全面调研！一览如何数据闭环全流程

写在前面&个人理解自动驾驶技术在硬件和深度学习方法的最新进展中迅速发展，并展现出令人期待的性能。高质量的数据集对于开发可靠的自动驾驶算法至关重要。先前的数据集调研试图回顾这些数据集，但要么集中在有限数量的数据集上，要么缺乏对数据集特征的详细调查...

生成式AI 2024-01-31 人工智能

1346阅读