数据集第14页 - AIGC资讯

百度大模型文心一言api 请求错误码一览表

错误码说明千帆大模型平台API包含两类，分别为大模型能力API和大模型平台管控API，具体细分如下：大模型能力API 对话Chat 续写Completions 向量Embeddings 图像Images 大模型平台管控API...

大数据 2024-07-21 人工智能

1732阅读

AFAC2024-基于保险条款的问答比赛日记 llamafactory qwen npu 910B1

AFAC2024: 基于保险条款的问答挑战——我的实战日记概述在最近的AFAC2024竞赛中，我参与了基于保险条款的问答赛道。这是一次深度学习与自然语言处理的实战演练，旨在提升模型在复杂保险文本理解与问答生成方面的能力。本文将分享我的参赛过程，...

大数据 2024-07-21 人工智能

917阅读

「数据墙」迫近？苹果OpenAI等巨头走投无路，被迫「偷师」YouTube视频！

【新智元导读】近日，《连线》杂志联合ProofNews联合发表一篇调查文章，指责苹果、Anthropic等科技巨头未经许可使用YouTube视频训练AI模型。但训练数据的使用边界究竟在哪里?创作者、大公司和开发者正在陷入知识产权的罗生门…… AI科技巨头的...

人工智能 2024-07-21 人工智能

666阅读

LLaMA-Factory/scripts/length_cdf.py 源码解析

这段代码定义了一个函数 length_cdf，用来计算和打印数据集样本长度的累积分布函数（CDF），并在脚本直接运行时通过 fire 库将该函数暴露为命令行接口。我们逐行解释这段代码： python 复制 from llmtuner.data imp...

大数据 2024-07-21 人工智能

1047阅读

给｢大模型初学者｣的 LLaMA 3 核心技术剖析

编者按：本文旨在带领读者深入了解 LLaMA 3 的核心技术 —— 使用 RMSNorm 进行预归一化、SwiGLU 激活函数、旋转编码（RoPE）和字节对编码（BPE）算法。RMSNorm 技术让模型能够识别文本中的重点，SwiGLU 激活函数则如同“...

生成式AI 2024-07-21 人工智能

1092阅读

openai 开源模型Whisper语音转文本模型下载使用

Whisper Whisper 是一种通用语音识别模型。它是在大量不同音频数据集上进行训练的，也是一个多任务模型，可以执行多语言语音识别、语音翻译和语言识别。官方地址 https://github.com/openai/whisper 方法...

AIGC 2024-07-21 人工智能

1047阅读

AI绘画：多种XP一次满足（Stable Diffusion进阶篇：模型训练）

前言今天，是一个比较特殊的日子。从我开始学习AI绘画开始到现在AI工具相关的笔记我已经写了50篇了，其中估摸着得近40篇都是关于Stable Diffusion的。在这一天天的学习中我感受到了对知识的疲倦，是时候给自己来点奖励了！所以...

大数据 2024-07-20 人工智能

784阅读

【AIGC调研系列】VILA-1.5版本的视频理解功能如何

VILA-1.5版本的视频理解功能表现出色，具有显著的突破。这一版本不仅增强了视频理解能力，还提供了四种不同规模的模型供用户选择，以适应不同的应用需求和计算资源限制[1][2][3]。此外，VILA-1.5支持在笔记本等边缘设备上部署，这得益于其高效的模型...

AIGC 2024-07-20 人工智能

1434阅读

深入了解 Whisper 的架构、用法以及在语音识别领域的应用和性能特征

Whisper: 通用语音识别模型详解概述 Whisper 是一个基于 Transformer 序列到序列模型的通用语音识别系统，经过训练可以执行多语种语音识别、语音翻译和语言识别任务。本文将深入介绍 Whisper 的工作原理、设置方法、可用模...

AIGC 2024-07-20 人工智能

2268阅读

Stable Diffusion模型训练 — Embeddings（附Demo）

文本反演提到文本反演你可能会比较陌生，但它产出的模型类型Embeddings（词嵌入）一定是你出图过程里经常会使用到的，它是一种轻量、小巧的微调模型格式，文件名后缀一般为.pt（或.safetensor），每个Embeddings文件的大小在几KB到几...

大数据 2024-07-20 人工智能

1097阅读

提示词用上“过去式“，秒破GPT4o等六大模型安全限制！中文语境也好使

只要在提示词中把时间设定成过去，就能轻松突破大模型的安全防线。而且对GPT-4o尤其有效，原本只有1%的攻击成功率直接飙到88%，几乎是“有求必应”。有网友看了后直言，这简直是有史以来最简单的大模型越狱方式。来自洛桑联邦理工学院的一篇最新论文，揭开...

大数据 2024-07-20 人工智能

764阅读

LLaMA-Factory：开源的低代码大模型训练框架

LLaMA-Factory 是一个由零隙智能（SeamLessAI）开源的低代码大模型训练框架，它集成了业界最广泛使用的微调方法和优化技术，并支持众多开源模型的微调和二次训练。一、功能特点支持多种开源模型：LLaMA-Factory支持包括...

大数据 2024-07-20 人工智能

2184阅读

每日AIGC最新进展(45)：字节跳动开源大规模text-to-video数据集OpenVid-1M、浙江大学提出锚定条件控制视频生成GVDIFF、Meta AI研究院提出文生3D大模型3DGen

Diffusion Models专栏文章汇总：入门与实战 OpenVid-1M: A Large-Scale High-Quality Dataset for Text-to-video Generation https://nju-pcalab....

人工智能 2024-07-19 人工智能

859阅读

（5-5-01）金融市场情绪分析：使用Llama 2 大模型实现财经信息的情感分析微调（1）

5.5 使用Llama 2 大模型实现财经信息的情感分析微调情感分析在金融和经济领域具有重要意义，可以帮助企业从市场洞察、风险管理和投资决策等方面获得有价值的信息。然而，在金融和经济文本方面的标注数据相对稀缺，因此需要使用自然语言处理技术和预训练模型...

人工智能 2024-07-19 人工智能

1342阅读

Llama - 微调

本文翻译整理自：https://llama.meta.com/docs/how-to-guides/fine-tuning 文章目录微调实验跟踪 Recipes PEFT LoRA torchtune Hugging Face PE...

AIGC 2024-07-19 人工智能

773阅读

每日AIGC最新进展(30)：阿卜杜拉国王大学提出旋转视角视频生成Vivid-ZOO、浙江大学提出4D场景编辑Instruct 4D-to-4D、西安交大提出3D重建大规模数据集OpenMateria

Diffusion Models专栏文章汇总：入门与实战 Vivid-ZOO: Multi-View Video Generation with Diffusion Model 本文提出了一种名为Vivid-ZOO的新型扩散模型，用于从文本...

AIGC 2024-07-18 人工智能

786阅读

提升AI绘画生成质量：探索与突破

本文由 ChatMoney团队出品随着人工智能技术的蓬勃发展，AI绘画生成技术已成为艺术领域的一颗璀璨新星。然而，尽管AI绘画技术在模仿人类绘画风格、创作独特艺术作品等方面取得了显著进展，但其生成的图像质量仍有待提升。本文旨在深入探讨如何提升AI绘...

AIGC 2024-07-18 人工智能

912阅读

大模型学习笔记3【大模型】LLaMA学习笔记

文章目录学习内容 LLaMA LLaMA模型结构 LLaMA下载和使用好用的开源项目[Chinese-Alpaca](https://github.com/ymcui/Chinese-LLaMA-Alpaca Chinese-Alpaca...

人工智能 2024-07-18 人工智能

849阅读

Stable Diffusion背后的技术原理与实现细节

Stable Diffusion背后的技术原理与实现细节 I. 引言 A. Stable Diffusion的定义 B. 技术重要性概述 C. 本文目标与结构 II. 深度学习与图像生成 A. 深度学习简介 B. 图像生成任务 C. 生成...

人工智能 2024-07-18 人工智能

986阅读

[AIGC] ClickHouse分布式表与本地表的区别及如何查询所有本地表记录

在大规模数据处理和分析场景中，ClickHouse是一种高性能的列式数据库管理系统。ClickHouse支持分布式表和本地表两种表类型，本文将介绍这两种表类型的区别，并探讨如何建表以查询所有本地表的记录。文章目录一、ClickH...

人工智能 2024-07-17 人工智能

1144阅读

七月论文审稿GPT第5版：拿我司七月的早期paper-7方面review数据集微调LLama 3

前言 llama 3出来后，为了通过paper-review的数据集微调3，有以下各种方式不用任何框架工具技术，直接微调原生的llama 3，毕竟也有8k长度了效果不期望有多高，纯作为baseline 通过PI，把llama 3的8K长度扩展...

大数据 2024-07-17 人工智能

778阅读

LLaMA原理与代码实例讲解

LLaMA原理与代码实例讲解作者：禅与计算机程序设计艺术 / Zen and the Art of Computer Programming 关键词：大模型、LLaMA、Transformer、预训练、微调 1. 背景介绍 1.1 问题的由来...

AIGC 2024-07-17 人工智能

960阅读

解密中国首个“音乐版Sora” | 中国AIGC产业峰会

编辑部发自 AIGC峰会量子位 | 公众号 QbitAI 文生图、文生音频、文生视频、AI搜索引擎……大模型在多模态的进程可谓是愈演愈烈。而聚焦在国内，有这么一家公司在AIGC大热潮的前后，单是“首个”就占了四席：发布中国首个开源...

生成式AI 2024-07-17 人工智能

723阅读

山东大学项目实训（十六）:基于LLaMA-Factory的微调模型评估和测试

在LLaMA-Factory的Evaluate & Predict界面进行评测原始模型评测微调后模型评测可以看到，微调之后的模型在各个指标上有了显著提升在完成大型语言模型（如 ChatGLM）的微调后，对模型进行全面评估...

生成式AI 2024-07-16 人工智能

1590阅读

探索国产AI作图新境界：快手可图（Kolors）的崛起

在AI作图领域，Midjourney和SDXL等国际知名模型以其卓越表现而备受瞩目。然而，高昂的费用和硬件配置要求，无疑增加了国内用户使用这些工具的门槛。在这样的背景下，国产AI作图工具“快手可图（Kolors）”以其免费、易用和出色的效果，成为业界的一股...

人工智能 2024-07-16 人工智能

951阅读

大模型集体失智！9.11和9.9哪个大，几乎全翻车了

没眼看……“9.11和9.9哪个大”这样简单的问题，居然把主流大模型都难倒了?? 强如GPT-4o，都坚定地认为9.11更大。谷歌Gemini Advanced付费版，同样的口径。新王Claude3.5Sonnet，还一本正经的给出离谱的计算方法。...

大数据 2024-07-16 人工智能

865阅读

基于MindSpore实现BERT对话情绪识别

本文分享自华为云社区《【昇思25天学习打卡营打卡指南-第二十四天】基于 MindSpore 实现 BERT 对话情绪识别》，作者：JeffDing。模型简介 BERT全称是来自变换器的双向编码器表征量（Bidirectional Encoder...

AIGC 2024-07-16 人工智能

734阅读

Stable Diffusion：解锁AIGC的图像生成新纪元

Stable Diffusion：解锁AIGC的图像生成新纪元 I. 引言 A. Stable Diffusion的概念与重要性 B. AIGC图像生成的历史背景 C. Stable Diffusion技术的兴起 II. Stable Di...

生成式AI 2024-07-16 人工智能

888阅读

Diffusion【1】：SDSeg——基于Stable Diffusion的单步扩散分割！

文章目录前言 Abstract Introduction Methods Latent Estimation Concatenate Latent Fusion Trainable Vision Encoder Experiment D...

大数据 2024-07-16 人工智能

969阅读

Qwen2——阿里巴巴最新的多语言模型挑战 Llama 3 等 SOTA

引言经过几个月的期待，阿里巴巴 Qwen 团队终于发布了 Qwen2 – 他们强大的语言模型系列的下一代发展。 Qwen2 代表了一次重大飞跃，拥有尖端的进步，有可能将其定位为 Meta 著名的最佳替代品骆驼3 模型。在本次技术深入探讨中，我...

AIGC 2024-07-16 人工智能

1296阅读

AI作画算法详解：原理、应用与未来发展

随着人工智能技术的不断发展，AI作画逐渐成为了一个热门话题。AI作画，即利用人工智能算法生成绘画作品，不仅仅是技术的展示，更是艺术与科技结合的创新体现。本文将深入探讨AI作画的核心算法原理，并通过实例帮助读者更好地理解和掌握这一技术。文章最后，给大家推...

AIGC 2024-07-15 人工智能

898阅读

揭秘！FFmpeg+Whisper双剑合璧：解锁视频到文本的二阶段奇迹

解锁视频到文本的二阶段奇迹一、引言二、视频音频提取与处理视频音频提取与处理 2.1 环境搭建 2.2 视频音频提取 2.3 音频预处理示例代码：三、语音识别与翻译 3.1 加载Whisper模型 3.2 语音识别 3.3 语言检...

人工智能 2024-07-15 人工智能

957阅读

探索AI写作的深度奥秘：从困惑度到爆发度的挑战与机遇

大家好，今天来聊聊探索AI写作的深度奥秘：从困惑度到爆发度的挑战与机遇，希望能给大家提供一点参考。以下是针对论文重复率高的情况，提供一些修改建议和技巧，可以借助此类工具：探索AI写作的深度奥秘：从困惑度到爆发度的挑战与机遇在AI技术飞速发展...

大数据 2024-07-15 人工智能

721阅读

LLama Factory微调模型全流程，与peft库调用训练的adapter

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录 LLama Factory微调流程一、准备微调的数据集和模型二、读取模型和数据进行训练 1.使用web ui 2.修改官方脚本（推荐）第三，加载与推...

人工智能 2024-07-15 人工智能

1184阅读

6700万参数比肩万亿巨兽GPT-4！微软MIT等联手破解Transformer推理密码

「因果推理」绝对是当前GenAI热潮下的小众领域，但是它有一个大佬级的坚定支持者——Yann LeCun。他在推特上的日常操作之一，就是炮轰Sora等生成模型，并为自己坚信的因果推理领域摇旗呐喊。甚至，早在2019年VentureBeat的采访中，他...

人工智能 2024-07-15 人工智能

753阅读

Stable Diffusion 3架构解析

在台湾举办的台北国际电脑展上，Stability AI CTO 兼联合 CEO Christian Laforte 与 AMD CEO 苏姿丰一起宣布文本到图像生成模型 Stable Diffusion 3 将于 6 月 12 日开源。一、扩散模型的...

人工智能 2024-07-14 人工智能

1143阅读

大模型剧本杀开源：6个Claude里藏一个凶手！刚上线服务器就被挤爆，免费免下载免注册

AI原生互动侦探游戏，刚上线就爆火，服务器一度挤爆。免费、免下载、免注册、中文友好、浏览器运行… … 这么多buff叠在一起，是不是勾起了你的好奇心? 今天的主角AI Alibis，由两位外国游戏爱好者共同开发，并且作为参赛作品提交给了Anthropi...

大数据 2024-07-14 人工智能

742阅读

近屿OJAC带你解读：AIGC核心知识点LLM

近年来，人工智能（AI）领域经历了令人瞩目的增长，尤其是自然语言处理（NLP）。你知道是什么推动了NLP领域的这种飞速发展吗？没错，那就是大型语言模型LLM。这些模型可能会彻底改变我们与科技的互动方式！这些模型是如何工作的呢？它们为何如此流行？在本文中...

生成式AI 2024-07-14 人工智能

727阅读

Stable Diffusion【3D模型】：场景精细与逼真，人物表情丰富的3D大模型AWPoly3D（附模型包）

今天和大家分享一个基于SD1.5的3D大模型：AWPoly3D。该模型是AWP系列的3D大模型，此模型的人物是基于阿里巴巴旗下的“堆友”开源Avatar作为数据集训练的，生成的人物具有非常明显的辨识度。也可以用来制作3D icon，3D场景，也非常推荐使用...

AIGC 2024-07-14 人工智能

878阅读

AI绘画最强SD（Stable Diffusion）玩法实操教学案例及商业变现项目分享

AI绘画现在越来越火爆了，很多人无论大人小孩都在玩，还有的很多电商老板也在使用辅助生成产品主图和详情页，可以说是非常的实用。而其中最让人追捧和好评的就是SD（Stable Diffusion）这款AI绘图软件了，Stable Diffusion是一款基于深...

生成式AI 2024-07-14 人工智能

1154阅读

百度智能云升级：接入33个大模型，Llama 2引领创新，103个Prompt模板上线

大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业...

生成式AI 2024-07-14 人工智能

761阅读

突破AI性能瓶颈揭秘LLaMA-MoE模型的高效分配策略

获取本文论文原文PDF，请在公众号【AI论文解读】留言：论文解读本文介绍了一种名为“LLaMA-MoE”的方法，通过将现有的大型语言模型（LLMs）转化为混合专家网络（MoE），从而解决了训练MoE时遇到的数据饥饿和不稳定性问题。该方法基于著名的LLa...

AIGC 2024-07-13 人工智能

799阅读

anytext_pytorch AIGC 可以用于生成多语言文字图像算法模型

AnyText 论文 AnyText: Multilingual Visual Text Generation And Editing https://arxiv.org/abs/2311.03054 模型结构模型由4部分构成，分别是Auxili...

人工智能 2024-07-13 人工智能

736阅读

规格拉满！Llama和Sora作者都来刷脸的中国AI春晚，还开源了一大堆大模型成果...

鱼羊明敏发自凹非寺量子位 | 公众号 QbitAI 本周国内最受关注的AI盛事，今日启幕。活动规格之高，没有哪个关心AI技术发展的人能不为之吸引—— Sora团队负责人Aditya Ramesh与DiT作者谢赛宁同台交流，李开复与...

AIGC 2024-07-13 人工智能

738阅读

llama-factory学习使用笔记

想要对开源的llama大模型，针对自己的数据进行微调，这里推荐llama-factory项目，LLama Factory，这个工具能够高效且低成本地支持对 100 多个模型进行微调。LLama Factory 简化了模型微调的过程，并且易于访问...

生成式AI 2024-07-13 人工智能

1873阅读

如何“正确“使用Stable Diffusion？文本到图像扩散模型中记忆化实用分析（浙大）

论文链接：https://arxiv.org/pdf/2405.05846 它能被生成吗？文本到图像扩散模型中记忆化的实用分析过去几年见证了由扩散模型驱动的文本引导图像生成领域的重大进展。然而，已经显示出文本到图像扩散模型容易受到训练图像记忆的影响，引发...

人工智能 2024-07-13 人工智能

941阅读

搭建本地whisper语音识别

目录代码仓库编辑选择模型环境配置语音识别测试 Whisper是一个通用的语音识别模型。它是在不同音频的大型数据集上训练的，也是一个多任务模型，可以执行多语言语音识别、语音翻译和语言识别。代码仓库 GitHub - ope...

AIGC 2024-07-13 人工智能

1494阅读

深入了解语音识别：Distil-Whisper

Distil-Whisper模型概述 1.1 Distil-Whisper的背景与意义随着语音识别技术的不断发展，模型的大小和计算复杂度成为了制约其广泛应用的重要因素。特别是在边缘设备和实时应用场景中，对模型的效率和性能提出了更高的要求。Dist...

生成式AI 2024-07-12 人工智能

1896阅读

探索大模型：袋鼠云在 Text To SQL 上的实践与优化

Text To SQL 指的是将自然语言转化为能够在关系型数据库中执行的结构化查询语言（简称 SQL）。近年来，伴随人工智能大模型技术的不断进步，Text To SQL 任务的成功率显著提升，这得益于大模型的推理、理解以及指令遵循等能力。对于大数据平台...

AIGC 2024-07-12 人工智能

780阅读

AIGC从入门到实战：登录 DID

AIGC从入门到实战：登录 D-ID 1. 背景介绍 1.1 问题的由来随着人工智能技术的迅速发展，身份验证领域也在不断创新。在现代社会中，安全、便捷的身份验证成为了必不可少的功能。然而，传统的人脸识别系统存在隐私泄露的风险，尤其是在大规模数据库中...

大数据 2024-07-12 人工智能

857阅读