数据集第19页 - AIGC资讯

RAG 架构如何克服 LLM 的局限性

检索增强生成促进了 LLM 和实时 AI 环境的彻底改造，以产生更好、更准确的搜索结果。译自How RAG Architecture Overcomes LLM Limitations，作者 Naren Narendran。在本系列的第一部分中，我重...

生成式AI 2024-06-05 人工智能

925阅读

AIGC论文阅读——[Visual Speech-Aware Perceptual 3D Facial Expression Reconstruction from Videos]

AIGC论文阅读——[Visual Speech-Aware Perceptual 3D Facial Expression Reconstruction from Videos] 论文地址：https://arxiv.org/abs/2207.110...

大数据 2024-06-05 人工智能

1118阅读

大模型到底有没有智能？一篇文章给你讲明明白白

生成式人工智能 (GenAI[1] 和大语言模型 (LLM[2] ，这两个词汇想必已在大家的耳边萦绕多时。它们如惊涛骇浪般席卷了整个科技界，登上了各大新闻头条。ChatGPT，这个神奇的对话助手，也许已成为你形影不离的良师益友。然而，在这场方兴未艾的...

人工智能 2024-06-05 人工智能

1021阅读

微调LLama模型：具体步骤与代码实现

微调LLama模型是一个涉及多个步骤的过程，包括数据准备、模型加载、设置优化器和损失函数、训练循环以及模型评估。下面，我们将详细介绍这些步骤，并给出相应的代码实现。步骤一：数据准备首先，我们需要准备用于微调的数据集。这通常包括一个输入文本序列和对...

生成式AI 2024-06-05 人工智能

852阅读

True Fit利用生成式AI帮助在线购物者找到合身的衣服

True Fit 是一家 AI 驱动的尺码和合身度个性化工具，已经为成千上万家零售商提供尺码建议解决方案近20年。现在，该公司正进军生成式 AI 领域，推出了名为 “Fit Hub” 的新工具，旨在改善在线购物者找到适合其身材的服装的方式。产品入口：...

大数据 2024-06-05 人工智能

923阅读

机器学习中不得不知的数学基础

随着各类语言库和框架的不断增加，机器学习变得越来越受欢迎。人们在各个领域更容易找到人工智能和机器学习的应用。然而，依赖库和框架来使用人工智能可能不会使人们成为该领域的专家。虽然编码框架的支持增加了可用性，但要在人工智能行业取得成功，我们必须深入理解代码背...

大数据 2024-06-05 人工智能

910阅读

改进的检测算法：用于高分辨率光学遥感图像目标检测

本文经计算机视觉研究院公众号授权转载，转载请联系出处。 01 前景概要目前，难以在检测效率和检测效果之间获得适当的平衡。我们就研究出了一种用于高分辨率光学遥感图像中目标检测的增强YOLOv5算法，利用多层特征金字塔、多检测头策略和混合注意力模块来提高...

人工智能 2024-06-05 人工智能

864阅读

YoloCS：有效降低特征图空间复杂度

本文经计算机视觉研究院公众号授权转载，转载请联系出处。论文地址：YOLOCS: Object Detection based on Dense Channel Compression for Feature Spatial Solidificatio...

AIGC 2024-06-05 人工智能

777阅读

LLM | 偏好学习算法并不学习偏好排序

图片一、结论写在前面偏好学习算法（Preference learning algorithms，如RLHF和DPO）常用于引导大型语言模型（LLMs）生成更符合人类偏好的内容，但论文对其内部机制的理解仍有限。论文探讨了传统观点，即偏好学习训练模型通过...

人工智能 2024-06-05 人工智能

966阅读

Llama改进之——均方根层归一化RMSNorm

引言在学习完GPT2之后，从本文开始进入Llama模型系列。本文介绍Llama模型的改进之RMSNorm(均方根层归一化。它是由Root Mean Square Layer Normalization论文提出来的，可以参阅其论文笔记1。 L...

AIGC 2024-06-05 人工智能

1477阅读

多语言模型微调统一框架 LlAMAFACTORY: 统一高效微调100多种语言模型

文章目录摘要 1 引言 2 高效微调技术 2.1 高效优化 2.2 高效计算 3 LlAMAFACtORY框架 3.1 模型加载器 3.2 数据处理工作者 3.3 训练器 3.4 实用工具 3.5 LLAMABOARD：LLAMAFAC...

人工智能 2024-06-05 人工智能

1084阅读

CVPR 2024 | 前沿而相对小众！几个AIGC扩散模型diffusion应用一览

1、机器人规划/智能决策 SkillDiffuser: Interpretable Hierarchical Planning via Skill Abstractions in Diffusion-Based Task Execution 扩散...

生成式AI 2024-06-05 人工智能

1138阅读

AI预测极端天气提速5000倍！微软发布Aurora，借AI之眼预测全球风暴

自人类有历史以来，就一直执着于预测天气，以各种方式破解「天空之语」，我们慢慢发现，草木、云层似乎都与天气有关，这不仅仅是因为人类从事生产的需要，也是人类想要对着大风歌唱、在月光下吟诗的需要。《冰与火之歌》中的风雨歌师，就是通过歌声和吟唱来预测天气和风暴...

人工智能 2024-06-04 人工智能

867阅读

LlamaFactory源码解析 PPO

class CustomPPOTrainer(PPOTrainer, Trainer : r""" Inherits PPOTrainer. """ def __init__( self,...

生成式AI 2024-06-04 人工智能

1815阅读

AI训练数据的版权保护：公地的悲剧还是合作的繁荣?

GPT-4o内置声音模仿「寡姐」一案闹的沸沸扬扬，虽然以OpenAI发布声明暂停使用疑似寡姐声音的「SKY」的语音、否认曾侵权声音为阶段性结束。但是，一时间「即便是AI，也得保护人类版权」这一话题甚嚣尘上，更刺激起了人们本来就对AI是否可控这一现代迷思的...

大数据 2024-06-04 人工智能

964阅读

Mamba-2新架构出世一统江湖！普林斯顿CMU华人再出神作，性能狂飙8倍

年前，Mamba被顶会ICLR拒稿的消息曾引起轩然大波。甚至有研究人员表示：如果这种工作都被拒了，那我们这些「小丑」要怎么办？这次，新一代的Mamba-2卷土重来、再战顶会，顺利拿下了ICML 2024！仍是前作的两位大佬（换了个顺序），仍是熟...

AIGC 2024-06-04 人工智能

1309阅读

whisper 的安装pycharm使用以及出现的BUG（已经解决）！

whisper（语音识别）+ffmpeg介绍 Whisper是OpenAI于2022年9月份开源的通用的语音识别模型。它是在各种音频的大型数据集上训练的模型，也是一个可以执行多语言语音识别、语音翻译和语言识别的多任务模型。Whisper 是一它在不同音频...

人工智能 2024-06-04 人工智能

1388阅读

Karpathy点赞，这份报告教你如何用 LLaMa 3创建高质量网络数据集

众所周知，对于 Llama3、GPT-4 或 Mixtral 等高性能大语言模型来说，构建高质量的网络规模数据集是非常重要的。然而，即使是最先进的开源 LLM 的预训练数据集也不公开，人们对其创建过程知之甚少。最近，AI 大牛 Andrej Karpa...

AIGC 2024-06-04 人工智能

834阅读

什么是LLM大模型训练，详解Transformer结构模型

本文分享自华为云社区《LLM 大模型学习必知必会系列(四：LLM训练理论篇以及Transformer结构模型详解》，作者：汀丶。 1.模型/训练/推理知识介绍深度学习领域所谓的“模型”，是一个复杂的数学公式构成的计算步骤。为了便于理解，我们以一...

生成式AI 2024-06-04 人工智能

1157阅读

研究人员使用机器学习优化高功率激光实验

高强度和高重复的激光器能快速连续每秒发射多次强大的光。商业聚变能源工厂和先进的紧凑型辐射源都依赖这种激光系统。然而，人类的反应时间不足以管理这种速射系统，应用面临挑战。为了应对这一挑战，科学家们正在寻找不同的方法来利用自动化和人工智能的力量，这些技术...

人工智能 2024-06-04 人工智能

908阅读

3B模型新SOTA！开源AI让日常调用不同大模型更简单

大模型，大，能力强，好用！但单一大模型在算力、数据和能耗方面面临巨大的限制，且消耗大量资源。而且目前最强大的模型大多为闭源，对AI开发的速度、安全性和公平性有所限制。 AI大模型的未来发展趋势，需要怎么在单一大模型和多个专门化小模型之间做平衡和选择？...

AIGC 2024-06-04 人工智能

831阅读

训练Stable Diffusion(XL) Lora的图片是否需要caption？

intro 目前很多风格lora模型的训练都会对图片进行caption，训练风格lora时使用image caption步骤是否能带来正向的效果? 在sdxl的代码实现中，lora插入的位置为unet中cross attention的QKV的线性投影部...

生成式AI 2024-06-04 人工智能

932阅读

大规模语言模型--LLaMA 家族

LLaMA 模型集合由 Meta AI 于 2023 年 2 月推出，包括四种尺寸(7B 、13B 、30B 和 65B 。由于 LLaMA 的开放性和有效性，自从 LLaMA 一经发布，就受到了研究界和工业界的广泛关注。LLaMA 模型在开放基准...

大数据 2024-06-04 人工智能

1474阅读

港科大最新！Vista：一种具有高保真度和多功能可控的世界模型

本文经自动驾驶之心公众号授权转载，转载请联系出处。原标题：Vista: A Generalizable Driving World Model with High Fidelity and Versatile Controllability 论文链接...

人工智能 2024-06-04 人工智能

1071阅读

[AIGC] redis 持久化相关的几道面试题

文章目录 1. 什么是Redis持久化？ 2. Redis 的持久化机制是什么？各自的优缺点？ 2.1 RDB（Redis DataBase），快照 2.2 AOF（Append Only File），日志 3. 优缺点是什么？ 4. 如何...

生成式AI 2024-06-04 人工智能

873阅读

深度解析：人工智能作画算法的原理与技术

引言在数字艺术的探索中，人工智能（AI）作画算法以其独特的创造性和艺术性引起了广泛的兴趣。这些算法不仅仅是简单的图像处理工具，它们背后蕴藏着复杂的神经网络和深度学习模型。本文将深入探讨AI作画算法的原理与技术，揭示其背后的复杂性和魅力。 1. 数据...

AIGC 2024-06-04 人工智能

1468阅读

Stable-DiffusionLoRA模型训练教程(新手篇)｜LoRA训练个人经验总结与复盘

上周初次尝试了训练LoRA模型，周末两天的时间一直在遇到问题摸索解决问题，修改完善模型，测试模型当中度过，好在问题都一一解决，也在LiblibAI上首发了我的处女作。??? 本篇文章仅整理归纳我的LoRA训练思路及步骤，以及自己遇到的问题和解决方案的复盘...

人工智能 2024-06-04 人工智能

1672阅读

【AIGC调研系列】MiniCPM-Llama3-V2.5模型与GPT-4V对比

MiniCPM-Llama3-V2.5模型与GPT-4V的对比可以从多个方面进行分析，包括性能、应用场景和技术特点。从性能角度来看，MiniCPM-Llama3-V2.5在OCR识别、模型幻觉能力和空间理解能力方面表现出色，实现了开源模型的性能SOTA...

大数据 2024-06-04 人工智能

1385阅读

微软ML Copilot框架释放机器学习能力

摘要：大模型席卷而来，通过大量算法模型训练推理，能根据人类输入指令产生图文，其背后是大量深度神经网络模型在做运算，这一过程称之为机器学习，本文从微软语言大模型出发，详解利用大型语言模型（Large Language Models, LLMs）解决实际机器学...

人工智能 2024-06-04 人工智能

845阅读

工业知识图谱进阶实战

一、背景简介首先来介绍一下云问科技的发展历程。云问科技公司由 Chatbot 起家，在 2013 年到 2019 年间一直投身于 Chatbot 领域，主要关注人机对话方向，推出了很多客服类产品。后转型去做知识相关领域的原因是，在 Bert 发布之...

生成式AI 2024-06-04 人工智能

993阅读

ChatGPT真能记住你的话吗？DeepMind与开源大佬揭示LLM记忆之谜

Django框架的创始人之一、著名开发者Simon Willison最近发表了一篇博客文章，核心观点是——虽然很多LLM看起来有记忆，但本质上是无状态函数。文章地址：https://simonwillison.net/2024/May/29/trai...

人工智能 2024-06-04 人工智能

880阅读

快速学会一个算法，xLSTM

今天给大家分享一个超强的算法模型，xLSTM。 xLSTM（Extended Long Short-Term Memory）是对传统 LSTM（Long Short-Term Memory）模型的扩展和改进，旨在提升其在处理时间序列数据和序列预测任务中的...

AIGC 2024-06-03 人工智能

932阅读

开源模型进展盘点：最新Mixtral、Llama 3、Phi-3、OpenELM到底有多好？

深度学习领域知名研究者、Lightning AI 的首席人工智能教育者 Sebastian Raschka 对 AI 大模型有着深刻的洞察，也会经常把一些观察的结果写成博客。在一篇 5 月中发布的博客中，他盘点分析了 4 月份发布的四个主要新模型：Mix...

生成式AI 2024-06-03 人工智能

813阅读

首个智慧城市大模型UrbanGPT，全面开源开放｜港大&百度

时空预测技术，迎来ChatGPT时刻。时空预测致力于捕捉城市生活的动态变化，并预测其未来走向，它不仅关注交通和人流的流动，还涵盖了犯罪趋势等多个维度。目前，深度时空预测技术在生成精确的时空模型方面，依赖于大量训练数据的支撑，这在城市数据不足的情况下显得...

大数据 2024-06-03 人工智能

839阅读

Llama-Factory 简介二，脚本详解 LLaMA-Factory/src/train_bash.py LLaMA-Factory/src/llmtuner/train/pt/workfl

examples/ ├── lora_single_gpu/ │ ├── pretrain.sh: 基于 LoRA 进行增量预训练 │ ├── sft.sh: 基于 LoRA 进行指令监督微调 │ ├── reward.sh: 基于 LoRA...

生成式AI 2024-06-03 人工智能

1722阅读

不同数据集有不同的Scaling law？而你可用一个压缩算法来预测它

一般而言，训练神经网络耗费的计算量越大，其性能就越好。在扩大计算规模时，必须要做个决定：是增多模型参数量还是提升数据集大小 —— 必须在固定的计算预算下权衡此两项因素。 Scaling law 告诉我们：只要能适当地分配参数和数据，就能在固定计算预算下实...

大数据 2024-06-03 人工智能

872阅读

Stable Diffusion扩散模型【详解】小白也能看懂！！

文章目录 1、Diffusion的整体过程 2、加噪过程 2.1 加噪的具体细节 2.2 加噪过程的公式推导 3、去噪过程 3.1 图像概率分布 4、损失函数 5、伪代码过程此文涉及公式推导，需要参考这篇文章： Stable...

AIGC 2024-06-03 人工智能

997阅读

大型科技公司拥才有承担 AI 训练数据成本的能力

AI 的发展离不开数据，而这种数据的成本越来越高，这使得除了最富有的科技公司外，其他公司难以承担这一成本。根据去年 OpenAI 的研究人员 James Betker 的文章，AI 模型的训练数据是决定模型能力的关键因素。传统的 AI 系统主要是基于统计机...

人工智能 2024-06-03 人工智能

908阅读

多模态大模型不够灵活，谷歌DeepMind创新架构Zipper：分开训练再「压缩」

最近的一系列研究表明，纯解码器生成模型可以通过训练利用下一个 token 预测生成有用的表征，从而成功地生成多种模态（如音频、图像或状态 - 动作序列）的新序列，从文本、蛋白质、音频到图像，甚至是状态序列。能够同时生成多种模态输出的多模态模型一般是通过某...

生成式AI 2024-06-03 人工智能

851阅读

【AIGC调研系列】LLaVA++整合Phi-3和Llama-3能够实现什么

LLaVA++能够为Phi-3和Llama-3带来的主要好处包括：视觉处理能力的增强：通过整合Phi-3和Llama-3模型，创建了具备视觉处理能力的Phi-3-V和Llama-3-V版本，这意味着这些模型现在能够理解和生成与图像相关的内容[1]。...

生成式AI 2024-06-03 人工智能

1133阅读

【AIGC调研系列】XTuner、Unsloth方案对比

XTuner和Unsloth都是用于大型语言模型（LLM）训练和微调的工具，但它们在设计理念、技术实现和性能表现上存在一些差异。技术架构与支持的模型规模： XTuner支持千亿级参数的模型，并能够处理超过百万个tokens的序列。它通过序列...

人工智能 2024-06-03 人工智能

1913阅读

使用LLaMA Factory来训练智谱ChatGLM3-6B模型

使用LLaMA Factory来训练智谱ChatGLM3-6B模型时，以下是一个训练过程： 1. 环境搭建 a. 安装Python和Anaconda 下载并安装适合你操作系统的Python版本（推荐Python 3.10或更高版本）。安装Anac...

AIGC 2024-06-03 人工智能

1272阅读

Stable Diffusion 使用技巧与具体操作（详细）

Stable Diffusion 是一种基于扩散模型的图像生成技术，能够生成高质量的图像。以下是一些详细的使用技巧与具体操作，帮助你更好地利用这一技术进行创作。 1. 基本概念 Stable Diffusion 利用扩散过程生成图像，通过逐步添加噪声并...

AIGC 2024-06-03 人工智能

1540阅读

【独家】万字长文带你梳理Llama开源家族：从Llama-1到Llama-3

Datawhale干货作者：张帆，陈安东，Datawhale成员引言在AI领域，大模型的发展正以前所未有的速度推进技术的边界。北京时间4月19日凌晨，Meta在官网上官宣了Llama-3，作为继Llama-1、Llama-...

AIGC 2024-06-02 人工智能

1054阅读

在autodl平台使用llama-factory微调Qwen1.5-7B

1 部署环境 step 1. 使用24GB显存以上的显卡创建环境 step 2. 创建好环境之后，关闭环境，使用无卡模式开机（有钱可忽略） step 3. 安装LLaMA-Factory git clone https://github.com/...

生成式AI 2024-06-02 人工智能

1375阅读

时间序列模型：lag-Llama

项目地址：GitHub - time-series-foundation-models/lag-llama: Lag-Llama: Towards Foundation Models for Probabilistic Time Series Foreca...

大数据 2024-06-02 人工智能

1243阅读

快速评测已有的中文llama-3开源模型（4月25日更新）

Llama-3刚出来不到一周，就有一些中文微调模型了。我快速的对这些模型进行了基准测试，时间仓促，没有办法面面俱到，仅供参考。中文评测数据集选择的是C-Eval（valid），英文选择的是MMLU（valid），评测指标是准确率，越高越好。中...

生成式AI 2024-06-02 人工智能

1019阅读

Llama 3 Web Demo 部署 && XTuner 小助手认知微调 && LMDeploy 部署 Llama 3 模型 && 五一作业 && 机智流

Llama 3 Web Demo 部署 && XTuner 小助手认知微调 && LMDeploy 部署 Llama 3 模型 && 五一作业 && 机智流 1、 Llama 3...

生成式AI 2024-06-02 人工智能

942阅读

llama-factory学习个人记录

框架、模型、数据集准备 1.llama-factory部署 # 克隆仓库 git clone https://github.com/hiyouga/LLaMA-Factory.git # 创建虚拟环境 conda create --name llama...

人工智能 2024-06-02 人工智能

2331阅读

【AIGC调研系列】Dify平台是什么

Dify平台是一个专为大型语言模型（LLM）开发和运营设计的LLMOps（Large Language Model Operations）平台。它旨在简化AI应用的创建、部署和管理过程，使开发者能够更快速、更轻松地构建和运营基于GPT等模型的AI应用。...

生成式AI 2024-06-02 人工智能

2996阅读