数据集第15页 - AIGC资讯

Llama-factory源码详细解读

微调采用逐行调试的方法，细节来看SFT代码 AutoModelForCausalLM...

AIGC 2024-07-11 人工智能

1611阅读

【AIGC半月报】AIGC大模型启元：2024.06（下）

AIGC大模型启元：2024.06（下） (1 Gen-3 (2 Open-Sora 1.2（Open-Sora再升级） (3 Claude 3.5 Sonnet（Claude升级） (4 ChatTTS v3（ChatTTS升级） (...

AIGC 2024-07-11 人工智能

874阅读

大模型真的在吞噬人类的一切数据吗？

在弗兰克·赫伯特的《沙丘》中，沙漠星球厄拉科斯的沙丘下隐藏着一种无价之宝:香料。这种神秘物质使太空旅行成为可能，能延长寿命，并具有扩展意识的效果，是宇宙中最宝贵的财富。“谁控制了香料，谁就控制了宇宙”。正如香料在《沙丘》宇宙中占据着至关重要的地位一样，在...

AIGC 2024-07-11 人工智能

824阅读

使用LlamaFactory进行模型微调：参数详解

在深度学习和自然语言处理领域，模型微调是提升预训练模型性能的重要手段。本文将介绍如何使用LlamaFactory进行模型微调，并详细解析一些关键参数，包括 --cutoff_len 1024、--flash_attn auto、--lora_rank 8、...

AIGC 2024-07-11 人工智能

3967阅读

Llama 3 模型微调的步骤

环境准备操作系统：Ubuntu 22.04.5 LTS Anaconda3：Miniconda3-latest-Linux-x86_64 GPU： NVIDIA GeForce RTX 4090 24G Step 1. 准备conda环境创...

人工智能 2024-07-11 人工智能

955阅读

教你基于MindSpore用DCGAN生成漫画头像

本文分享自华为云社区《【昇思25天学习打卡营打卡指南-第二十天】DCGAN生成漫画头像》，作者：JeffDing。 DCGAN生成漫画头像在下面的教程中，我们将通过示例代码说明DCGAN网络如何设置网络、优化器、如何计算损失函数以及如何初始化模型...

生成式AI 2024-07-10 人工智能

755阅读

RAG微调Llama 3竟超越GPT-4！英伟达GaTech华人学者提出RankRAG框架

【新智元导读】来自佐治亚理工学院和英伟达的两名华人学者带队提出了名为RankRAG的微调框架，简化了原本需要多个模型的复杂的RAG流水线，用微调的方法交给同一个LLM完成，结果同时实现了模型在RAG任务上的性能提升。在需要大量事实知识的文本生成任务中，R...

AIGC 2024-07-09 人工智能

957阅读

LLama-Factory大模型训练框架，基于自己数据集微调qwen7B模型实战

一，项目简介 LLama-Factory，大模型训练框架，支持多种模型，多种训练方式，项目github地址：link 项目特色多种模型：LLaMA、LLaVA、Mistral、Mixtral-MoE、Qwen、Yi、Gemma、Baic...

生成式AI 2024-07-09 人工智能

1079阅读

【大语言模型LLM】- Meta开源推出的新一代大语言模型 Llama 3

?博客主页：西瓜WiFi ?系列专栏：《大语言模型》很多非常有趣的模型，值得收藏，满足大家的收集癖！如果觉得有用，请三连?⭐❤️，谢谢！长期不定时更新，欢迎watch和fork！❤️❤️❤️ ❤️感谢大家点赞? 收藏⭐ 评论⭐ ?大语言模...

大数据 2024-07-08 人工智能

789阅读

小白上手AIGC-基于PAI-DSW部署Stable Diffusion文生图Lora模型

小白上手AIGC-基于PAI-DSW部署Stable Diffusion文生图Lora模型前言资源准备开启体验服务创建工作空间部署服务创建DSW实例安装Diffusers 启动WebUI 写在最后前言在上...

大数据 2024-07-08 人工智能

832阅读

如何快速接入llama 3 ？送上最便捷教程

一、Meta llama 3介绍当地时间4月18日，Meta 发布两款开源Llama 3 8B与Llama 3 70B模型。按照Meta的说法，Llama 3 8B和Llama 3 70B是目前同体量下，性能最好的开源模型。在Llama...

大数据 2024-07-08 人工智能

911阅读

ChatGPT无法取代人类程序员！ IEEE 35页论文测出困难编码正确率仅为0.66%

【新智元导读】6月，IEEE刊登了一篇对ChatGPT代码生成任务进行系统评估的论文，数据集就是程序员们最爱的LeetCode题库。研究揭示了LLM在代码任务中出现的潜在问题和能力局限，让我们能够对模型做出进一步改进，并逐渐了解使用ChatGPT写代码的最...

人工智能 2024-07-08 人工智能

785阅读

理财AI勇闯「无人区」：理解专家、成为专家

用十年时间成为全球在线服务数亿用户的财富管理平台后，摆在蚂蚁财富面前的是一段少有人走过的路: 这5亿活跃用户第一次动动手就能接触到各类普惠的理财产品，但真正理财行为成熟的仅占两成。而放眼中国7.2亿基金投资者里，每3600人才能分到1位传统理财顾问来服务。...

AIGC 2024-07-08 人工智能

851阅读

大语言模型的底层原理，ChatGPT，文心一言等人工智能体是如何产生的？本文将详细讲解

文章目录基础介绍一、预训练 1.数据准备质量过滤敏感内容过滤数据去重数据预处理实践质量过滤去重隐私过滤 2.词元化 BPE 分词 WordPiece 分词 Unigram 分词 3.数据调度总结参考文献...

AIGC 2024-07-08 人工智能

1261阅读

AI+视频 | Nvidia 投资的AI公司，通过视频理解开创感知推理，获顶级风投5000万美元融资

在每天刷视频的时代，我们如何快速创作360度全方位理解的视频内容? Twelve Labs，一家旧金山初创公司，是由一支年轻的工程师团队Jae Lee 和 Aiden L 创立，该产品可在视频中提取特定视频瞬间，包括视觉、音频、文本和上下文信息，以实现语义...

生成式AI 2024-07-08 人工智能

1155阅读

[arxiv论文解读]LlamaFactory：100+语言模型统一高效微调

该文档是一篇关于LLAMAFACTORY的学术论文，这是一个用于高效微调大型语言模型（LLMs）的统一框架。这篇论文详细介绍了LLAMAFACTORY的设计、实现和评估，以及它在语言建模和文本生成任务中的应用。下面是对文档内容的详细解释：摘要（Abst...

AIGC 2024-07-08 人工智能

1688阅读

llama factory 增量预训练代码解析 & .yaml文件传参和sh的不同 examples/train_lora/llama3_lora_pretrain.yaml

新版本(2024年后的llama factory，改用了.yaml文件传参的方式，请问和原始的.sh传参方式有什么不同？新版本的 llama factory 框架使用 .yaml 文件来传递参数，相较于原始的 .sh 脚本传参方式，有一些显著的不...

生成式AI 2024-07-07 人工智能

1392阅读

破解ChatGPT惊人耗电！DeepMind新算法训练提效13倍，能耗暴降10倍

【新智元导读】ChatGPT能耗惊人，该怎么解?谷歌DeepMind新算法JEST问世，让LLM训练的迭代次数降低13倍，计算量减少10倍，或将重塑AI未来。 ChatGPT早已成为世界耗能大户:一天用掉超50万度电，相当于1.7万个美国家庭的用电量! 然...

AIGC 2024-07-07 人工智能

878阅读

在昇腾服务器上使用llama-factory对baichuan2-13b模型进行lora微调

什么是lora微调 LoRA 提出在预训练模型的参数矩阵上添加低秩分解矩阵来近似每层的参数更新，从而减少适配下游任务所需要训练的参数。环境准备这次使用到的微调框架是llama-factory。这个框架集成了对多种模型进行各种训练的代码，少...

人工智能 2024-07-07 人工智能

900阅读

传知代码-Llama 2：开放基础和微调聊天模型以及法律判决数据集分类实战(论文复现)

代码以及视频讲解本文所涉及所有资源均在传知代码平台可获取本文概述本文首先会介绍一下Llama2大模型，然后会使用一个公开的中文法律判决数据集（部分）进行Llama2提示学习的分类实战。论文主要内容这篇文章介绍了Llama 2，这是...

生成式AI 2024-07-07 人工智能

751阅读

[AI里程碑]StableDiffusion3今日开源 | 首个开源超越Midjourney

⚡[AI里程碑]StableDiffusion3今日开源 | 首个开源超越Midjourney 2024年6月12日，Stable Diffusion 3 Medium的开源代表了生成式 AI 发展的一个重要里程碑。 StableDiffu...

生成式AI 2024-07-07 人工智能

919阅读

全方位了解 Meta Llama 3

本文将为您提供 Llama 3 的全面概览，从其架构、性能到未来的发展方向，让您一文了解这一革命性大语言模型的所有要点。 Meta Llama 发展历程 Llama 1 Llama 是由 Meta(FaceBook AI 发布的一个开源项目...

AIGC 2024-07-06 人工智能

1153阅读

LLaMA 2-原理&模型&训练-你懂了吗?

LLaMA 2的原理 LLaMA 2是Meta AI开发的大型语言模型，它基于Transformer架构，采用了自注意力机制来处理输入序列中的长期依赖关系。LLaMA 2的核心原理包括自注意力机制、多头注意力、层归一化和残差连接等，这些技术共同使得模型...

大数据 2024-07-06 人工智能

1017阅读

大模型的实践应用24-LLaMA-Factory微调通义千问qwen1.5-1.8B模型的实例

大家好，我是微学AI，今天给大家介绍一下大模型的实践应用24-LLaMA-Factory微调通义千问qwen1.5-1.8B模型的实例, LLaMA-Factory是一个专门用于大语言模型微调的框架，它支持多种微调方法，如LoRA、QLoRA等，并提供了丰...

大数据 2024-07-05 人工智能

1432阅读

蚂蚁集团WAIC发布大模型密算平台，助力大模型破解数据供给挑战

大模型向下扎根深入行业，必须要破解高质量数据供给的挑战。7月5日，2024年世界人工智能大会进入第二天，作为数据要素领域的主要技术服务商，蚂蚁集团发布“隐语Cloud”大模型密算平台，通过软硬件结合的可信隐私计算技术，在大模型托管和大模型推理等环节实现数据...

大数据 2024-07-05 人工智能

731阅读

腾讯混元文生图开源模型推出小显存版本，仅需6G显存即可运行

7月4日，腾讯混元文生图大模型（混元DiT）宣布开源小显存版本，仅需6G显存即可运行，对使用个人电脑本地部署的开发者十分友好，该版本与LoRA、ControlNet等插件，都已适配至Diffusers库；并新增对Kohya图形化界面的支持，让开发者可以低门...

大数据 2024-07-05 人工智能

783阅读

AI绘画Stable Diffusion到底有几个版本？超全SD历史发布版本优缺点解析

大家好，我是设计师阿威 Stable Diffusion 在推出短短两年间已经发布了多个版本，最为人熟悉的就是 Stability AI 推出的 1.5 和 SDXL。那么除此之外，还有哪些版本呢？让我们从最初 Stable Diffusion 的起源开...

AIGC 2024-07-05 人工智能

5945阅读

国产动漫视频AI火了！二次元老婆随意捏，哥特、梦幻、机甲一键get

【新智元导读】视频生成赛道又起新秀，而且还是二次元定制版!稳定产出电影级画面，一键文/图生成视频，即使是「手残党」也能复刻自己喜欢的动漫作品了。现在，各位二次元萌新们，不用再等「太太」出图啦! 我们不仅可以自己产粮，而且还是会动的那种。如今，AI视频生...

人工智能 2024-07-05 人工智能

983阅读

一键部署LLaMA 3 Chinese Chat，含中文训练数据集；Food2K数据集下载，含2千类别，100万张图片...

前段时间 Llama 3 的重磅开源让 AI 圈的众人都兴奋了一把，但它对纯中文的支持不是很好，不能灵活地根据中文提问切换至相应语言进行回答。 hyper.ai 本周上线了 Llama 3 中文版——LlaMA 3 Chinese Chat 的部...

生成式AI 2024-07-05 人工智能

845阅读

全网最全讲解Stable Diffusion原理，小白也能看懂！速来！！！

手把手教你入门绘图超强的AI绘画程序Stable Diffusion，用户只需要输入一段图片的文字描述，即可生成精美的绘画。下面是Stable Diffusion注册和使用的方法。给大家带来了全新Stable Diffusion保姆级教程资料包（文末可获取...

人工智能 2024-07-04 人工智能

965阅读

视频多模态模型: VideoChat、Video-LLaMA、Video-ChatGPT、Video-LLaVA等

VideoChat VideoChat?: 基于视频指令数据微调的聊天机器人 https://arxiv.org/pdf/2305.06355.pdf https://github.com/OpenGVLab/Ask-Anything/tr...

人工智能 2024-07-04 人工智能

999阅读

文献研读｜AIGC溯源场景及研究进展

前言：本文介绍关于AIGC生成阶段针对不同溯源场景的几篇相关工作。相关文章：针对文生图模型的AIGC检测论文研读，参见此篇文章。如下图所示，在AIGC生成阶段，有4种溯源场景： 1）生成模型溯源训练数据 2）微调模型溯源预训练模型 3）AI...

生成式AI 2024-07-04 人工智能

1299阅读

一文为你深度解析LLaMA2模型架构

本文分享自华为云社区《【云驻共创】昇思MindSpore技术公开课大咖深度解析LLaMA2 模型架构》，作者： Freedom123。一、前言随着人工智能技术的不断发展，自然语言处理（NLP）领域也取得了巨大的进步。在这个领域中，LLaMA展...

人工智能 2024-07-04 人工智能

1135阅读

开源大模型 Llama 3

开源大模型Llama 3是一个在多个领域都展现出卓越性能的大模型。下面将为您介绍Llama 3的特性和一些简单的使用案例。一、Llama 3介绍 Llama 3在Meta自制的两个24K GPU集群上进行预训练，使用了超...

大数据 2024-07-04 人工智能

1065阅读

超简单！用AWS的Bedrock对Llama进行微调

哎，微调？听起来超难的！对吧。不过，用Amazon Bedrock的话，其实挺简单的。 Customize models in Amazon Bedrock with your own data using fine-tuning and conti...

生成式AI 2024-07-04 人工智能

1020阅读

【LLM教程-llama】如何Fine Tuning大语言模型？

今天给大家带来了一篇超级详细的教程,手把手教你如何对大语言模型进行微调(Fine Tuning ！（代码和详细解释放在后文）目录大语言模型进行微调(Fine Tuning 需要哪些步骤？大语言模型进行微调(Fine Tuning 训练过程及代码...

AIGC 2024-07-04 人工智能

1006阅读

央视点赞国产AI复活召唤术，兵马俑竟与宝石老舅对唱Rap？

沉睡了两千多年的兵马俑，苏醒了? 一句秦腔开场，将我们带到了黄土高原。如果不是亲眼所见，很多观众可能难以想象，有生之年还能看到兵马俑和宝石 Gem 同台对唱《从军行》。「青海长云暗雪山，孤城遥望玉门关。」古调虽存音乐变，声音依旧动人情: 这场表演背后的...

生成式AI 2024-07-04 人工智能

1049阅读

开源之光 Stable Diffusion 3 技术论文全解：公式占一半，实验很充分！

文章链接：https://arxiv.org/pdf/2403.03206 扩散模型通过反转数据到噪声的正向路径来从噪声中创建数据，并已成为处理高维感知数据（如图像和视频）的强大生成建模技术。Rectified flow是一种最近提出的生成模型形式，它将...

大数据 2024-07-04 人工智能

1543阅读

AIGC-CVPR2024best paper-Rich Human Feedback for Text-to-Image Generation-论文精读

Rich Human Feedback for Text-to-Image Generation斩获CVPR2024最佳论文！受大模型中的RLHF技术启发，团队用人类反馈来改进Stable Diffusion等文生图模型。这项研究来自UCSD、谷歌等。在...

生成式AI 2024-07-04 人工智能

928阅读

AIGC 011-SAM第一个图像分割大模型-分割一切！

AIGC 011-SAM第一个图像分割大模型-分割一切！文章目录 0 论文工作 1论文方法 2 效果 0 论文工作这篇论文介绍了 Segment Anything (SA 项目，这是一个全新的图像分割任务、模...

人工智能 2024-07-03 人工智能

795阅读

基于 Paimon 的袋鼠云实时湖仓入湖实战剖析

在当今数据驱动的时代，企业对数据的实施性能力提出了前所未有的高要求。为了应对这一挑战，构建高效、灵活且可扩展的实时湖仓成为数字化转型的关键。本文将深入探讨袋鼠云数栈如何通过三大核心实践------ChunJun 融合 Flink CDC、MySQL 一键入...

生成式AI 2024-07-03 人工智能

865阅读

深入探索Llama 2：下一代开源语言模型的革新与影响

Llama 2是Meta AI发布的一款先进的开源大模型，属于大型语言模型（LLM）类别。它是Transformer架构的一种变体，经过预先训练并在多种文本和代码数据集上进行微调，旨在提升功能和安全性。Llama 2的关键特点包括：庞大的训练数据集...

AIGC 2024-07-03 人工智能

985阅读

如何使用共享GPU平台搭建LLAMA3环境（LLaMA-Factory）

0. 简介最近受到优刻得的使用邀请，正好解决了我在大模型和自动驾驶行业对GPU的使用需求。UCloud云计算旗下的[Compshare](https://www.compshare.cn/? ytag=GPU_lovelyyoshino_Lcsdn_...

AIGC 2024-07-03 人工智能

883阅读

微软开源GraphRAG：极大增强大模型问答、摘要、推理

7月3日，微软在官网开源了基于图的RAG（检索增强生成）——GraphRAG。为了增强大模型的搜索、问答、摘要、推理等能力，RAG已经成为GPT-4、Qwen-2、文心一言、讯飞星火、Gemini等国内外知名大模型标配功能。传统的RAG系统在处理外部数...

生成式AI 2024-07-03 人工智能

1341阅读

AI绘画如何打造高质量数据集？

遇到难题不要怕！厚德提问大佬答！厚德提问大佬答11 你是否对AI绘画感兴趣却无从下手？是否有很多疑问却苦于没有大佬解答带你飞？从此刻开始这些问题都将迎刃而解！你感兴趣的话题，厚德云替你问，你解决不了的困难，大佬替你来解决！...

大数据 2024-07-03 人工智能

843阅读

每日AIGC最新进展(37)：达姆施塔特工业大学提出分布式协作扩散模型CollaFuse、卡耐基梅隆大学提出扩散模型简易一致性调优方法、俄罗斯Yandex提出可逆一致性蒸馏

Diffusion Models专栏文章汇总：入门与实战 CollaFuse: Collaborative Diffusion Models CollaFuse是一种创新的分布式协作扩散模型，旨在解决传统图像生成模型在数据可用性、计算需求和隐私方面...

人工智能 2024-07-02 人工智能

775阅读

LLaMA-Factory实战推理

LLaMA-Factory官网：https://github.com/hiyouga/LLaMA-Factory 安装环境 git clone https://github.com/hiyouga/LLaMA-Factory.git cd LLaM...

人工智能 2024-07-02 人工智能

946阅读

本地离线模型搭建指南-LLaMA-Factory训练框架及工具

搭建一个本地中文大语言模型（LLM）涉及多个关键步骤，从选择模型底座，到运行机器和框架，再到具体的架构实现和训练方式。以下是一个详细的指南，帮助你从零开始构建和运行一个中文大语言模型。本地离线模型搭建指南将按照以下四个部分展开中文大语言模型底座选...

大数据 2024-07-02 人工智能

1563阅读

AIGC入门（一）从零开始搭建Transformer！（上）

前言我记得曾经看过一篇综述，综述里曾这样讲过：多模态使用Transformer作为基石模型的一个原因之一，就是因为它能够很好地统一视觉（ViT、DiT）和文本，并且无限制地扩大其参数。这是一个在工程上很有作用也很有实际意义的事情。笔者...

AIGC 2024-07-02 人工智能

1052阅读

外滩大会举办全球deepfake攻防挑战赛，百万奖金悬赏“AI打假”专家

近日，外滩大会·全球Deepfake攻防挑战赛正式启动报名。该赛事提供百万级的数据集，针对“AI换脸”的欺诈风险进行攻防实战演练，并设立100万元人民币的奖金池，鼓励推动AI向善的技术人才。大赛由蚂蚁集团主办、蚂蚁数科承办，ATEC前沿科技探索社区、蚂...

大数据 2024-07-01 人工智能

780阅读