数据集第17页 - AIGC资讯

LLaMA 羊驼系大语言模型的前世今生

关于 LLaMA LLaMA是由Meta AI发布的大语言系列模型，完整的名字是Large Language Model Meta AI，直译：大语言模型元AI。Llama这个单词本身是指美洲大羊驼，所以社区也将这个系列的模型昵称为羊驼系模型。 Ll...

人工智能 2024-06-21 人工智能

1672阅读

在Windows上用Llama Factory微调Llama 3的基本操作

这篇博客参考了一些文章，例如：教程：利用LLaMA_Factory微调llama3:8b大模型_llama3模型微调保存-CSDN博客也可以参考Llama Factory的Readme：GitHub - hiyouga/LLaMA-Factory: U...

生成式AI 2024-06-21 人工智能

1136阅读

AIGC从入门到实战：AIGC 在工业领域的创新场景—合成数据集，助力机器人产品研发

1. 背景介绍随着人工智能技术的不断发展，越来越多的企业开始将其应用于工业领域，以提高生产效率和产品质量。在机器人产品研发中，数据集是非常重要的资源，但是获取真实的数据集往往需要耗费大量的时间和成本。因此，合成数据集成为了一种备受关注的解决方案。合...

生成式AI 2024-06-21 人工智能

1039阅读

CSDN首发！Stable Diffusion 3 Medium 开源，AI 生图格局迎来巨变

就在刚刚，Stable Diffusion 3 Medium 如约而至。几天前，Stability AI 在社交平台 X 上官宣，SD3 Medium 将在 6 月 12 日正式开源。这一次，没有跳票，它是真的来了。 20 亿参数大小，笔记本...

生成式AI 2024-06-20 人工智能

885阅读

Stable Diffusion 是否使用 GPU？

在线工具推荐： Three.js AI纹理开发包 - YOLO合成数据生成器 - GLTF/GLB在线编辑 - 3D模型格式在线转换 - 3D数字孪生场景编辑器 Stable Diffusion...

人工智能 2024-06-20 人工智能

996阅读

用 LLama-Factory 训练和微调 LLama3，打造你的专属 AI 模型！

用 LLama-Factory 训练和微调 LLama3，打造你的专属 AI 模型！文章目录用 LLama-Factory 训练和微调 LLama3，打造你的专属 AI 模型！什么是模型微调？为什么使用 LLama-Fact...

人工智能 2024-06-20 人工智能

1347阅读

基于Llama 3的最强开源医疗AI模型OpenBioLLM-Llama3，刷新榜单

项目概述 OpenBioLLM-70B是一款先进的开源生物医学大型语言模型，由Saama AI实验室基于Llama 3技术精心开发并微调。此模型专为生物医学领域设计，利用尖端技术，在多种生物医学任务中实现了最先进的性能表现。背景： Saam...

生成式AI 2024-06-20 人工智能

1586阅读

【大模型应用开发极简入门】微调（一）：1.微调基础原理介绍、2. 微调的步骤、3. 微调的应用（Copilot、邮件、法律文本分析等）

文章目录一. 开始微调 1. 选择合适的基础模型 2. 微调和少样本学习 2.1. 对比微调和少样本学习 2.2. 微调需要的数据量二. 使用OpenAI API进行微调 1. 数据生成 1.1. JSONL的数据格式 1.2....

大数据 2024-06-20 人工智能

1539阅读

开源医疗大模型Llama3-Aloe-8B-Alpha，性能超越 MedAlpaca 和 PMC-LLaMA

前言近年来，大型语言模型 (LLM 在医疗领域展现出巨大潜力，能够帮助医生和研究人员更快地获取信息、分析数据，并提高医疗服务效率。然而，目前市场上大多数医疗 LLM 都是闭源模型，限制了其在学术研究和应用领域的推广。为了打破这一现状，促进医疗 AI...

人工智能 2024-06-20 人工智能

905阅读

stable diffusion无限贴近真人的调教方法，助力AI变现（下）

对于人像，我的研究重点主要是如何让脸更贴近原图。这篇文章就通过一些专题的实践，讲讲我对还原人脸的一些出图思路、技巧和心得，会从出图思路、优化方向出发，逐步拆解，希望能给大家带来启发。本篇的重点内容有：如何根据一张图像还原人脸？如何使用 stab...

生成式AI 2024-06-19 人工智能

1843阅读

ChatGPT等模型疯狂训练，最快2026年消耗尽公开文本数据

AI发展科研机构Epochai在官网发布了一项，关于大模型消耗训练数据的研究报告。目前，人类公开的高质量文本训练数据集大约有300万亿tokens。但随着ChatGPT等模大型的参数、功能越来越强以及过度训练，对训练数据的需求呈指数级增长，预计将在202...

AIGC 2024-06-19 人工智能

1186阅读

AI绘画工具Stable Diffusion【模型篇】：Embedding模型

大家好，我是画画的小强。一. Embedding模型介绍 Embedding可以理解为一堆提示词的集合。它将很多的提示词汇总到一个文件里，我们需要的时候，只需要调用这个Embedding文件，就等同于输入了很多的提示词，对用户来说非常方便。 Emb...

生成式AI 2024-06-19 人工智能

1091阅读

大模型之路3：趟到了Llama-Factory，大神们请指点

各种AI工具和框架层出不穷，为开发者和研究者提供了前所未有的便利。当然了，也有困扰。尤其是对于动手能力越来越弱的中年油腻老程序员来说，更是难上加难。据说，嗯，据师弟说，说LlamaFactory凭借其独特的功能和优势，在AI领域（他所下载的代码和工具里），...

生成式AI 2024-06-19 人工智能

1056阅读

【持续更新中！图像-文本对数据集汇总】Stable Diffusion 3 重磅开源，超全图像生成必备训练数据集、教程汇总

Stability AI 已经正式开源 Stable Diffusion 3（简称 SD3）！SD3 是一个图像生成模型，只要给定一段描述性的文字，就能够创造出与之匹配的视觉作品。下图就是由 SD3 生成的图像。 * prompt 史诗...

AIGC 2024-06-19 人工智能

1435阅读

深入浅出完整解析Stable Diffusion XL（SDXL）核心基础知识

原文：深入浅出完整解析Stable Diffusion XL（SDXL）核心基础知识 Rocky的公众号：WeThinkIn Rocky的知乎：Rocky Ding 更多AI行业干货内容欢迎关注Rocky的CSDN、知乎、公众号～码字不易，希望大家...

大数据 2024-06-18 人工智能

4995阅读

【AI原理解析】— Meta Llama-3模型

目录一、模型架构 Transformer架构解码器（Decoder-only）设计 Group Query Attention (GQA 技术二、参数与训练参数规模训练数据集训练过程三、技术特点四、性能提升推理能力...

生成式AI 2024-06-18 人工智能

1283阅读

Whisper-AT：抗噪语音识别模型（Whisper）实现通用音频事件标记（Audio Tagger）

本文介绍一个统一音频标记（Audio Tagger）和语音识别（ASR）的模型：Whisper-AT，通过冻结Whisper的主干，并在其之上训练一个轻量级的音频标记模型。Whisper-AT在额外计算成本不到1%的情况下，可以在单次前向传递...

大数据 2024-06-18 人工智能

1427阅读

变分自编码器（VAE）在AIGC中的应用及其技术解析

本文收录于专栏：精通AI实战千例专栏合集 https://blog.csdn.net/weixin_52908342/category_11863492.html 从基础到实践，深入学习。无论你是初学者还是经验丰富的老手，对于本专栏案例和项目实践...

人工智能 2024-06-18 人工智能

1112阅读

Llama Factory 笔记

本地环境：cuda 11.7 torch2.1.0 项目文件结构： 1. 项目文件结构：如果利用Llama Factory 进行微调主要会用到 LLama-Factory/src 中的文件 2. src 下的目录结构本地推理的...

生成式AI 2024-06-18 人工智能

1683阅读

霉霉开口唱碧昂丝的歌，又是AI！口型不出戏，五官姿态也自然，复旦百度等出品｜GitHub揽星1k+

一张人像、一段音频参考，就能让霉霉在你面前唱碧昂丝的《Halo》。一种名为Hallo的研究火了，GitHub已揽星1k+。话不多说，来看更多效果: 不论是说话还是唱歌，都能和各种风格的人像相匹配。从口型到眉毛眼睛动作，各种五官细节都很自然。单独...

大数据 2024-06-18 人工智能

933阅读

【机器学习】机器的登神长阶——AIGC

目录什么是AIGC 普通用户接触AIGC网站推荐通义千问白马普通用户如何用好AIGC 关键提示词的作用 AIGC的影响就业市场：教育领域：创意产业：经济活动：社交媒体与信息传播： AIGC面临的挑战...

AIGC 2024-06-18 人工智能

979阅读

机器学习正在突破摩尔定律，Epoch 最新AI发展趋势预测

近日，Epoch AI更新了他们对机器学习远期趋势的研究报告，在计算、数据、硬件、算法、成本等多个维度对人工智能模型趋势进行了深入研究。 Epoch AI是一家研究机构，致力于研究影响人工智能发展轨迹和治理的关键趋势和问题，以造福社会。其报告中的研究结论联...

大数据 2024-06-18 人工智能

1023阅读

Gemini视频推理遥遥领先GPT-4o，Jeff Dean连续转发三次，首个视频多模态基准Video-MME来了

OpenAI和谷歌接连两场发布会，把AI视频推理卷到新高度。但业界还缺少可以全面评估大模型视频推理能力的基准。终于，多模态大模型视频分析综合评估基准Video-MME，全面评估多模态大模型的综合视频理解能力，填补了这一领域的空白。 Gemini1.5P...

AIGC 2024-06-18 人工智能

912阅读

stable diffusion基本原理

stable diffusion基本原理 ChatGPT Stable Diffusion是一种用于图像生成和编辑的深度学习模型，其基本原理基于扩散模型（diffusion models）。扩散模型是一种生成模型，通过模拟数据从噪声到目标分布的过程...

AIGC 2024-06-18 人工智能

1255阅读

AIGC |「多模态模型」系列之OneChart：端到端图表理解信息提取模型

论文标题: OneChart: Purify the Chart Structural Extraction via One Auxiliary Token 论文作者: Jinyue Chen, Lingyu Kong, Haoran Wei, Chen...

人工智能 2024-06-18 人工智能

1164阅读

一周SOTA：Meta 发布 Llama 3；Mistral AI 开源 Mixtral 8x22B；阿里开源代码模型CodeQwen1.5；面壁 MiniCPM 2.0 发布

文章目录一周SOTA：Meta 发布 Llama 3；Mistral AI 开源 Mixtral 8x22B；阿里开源代码模型CodeQwen1.5；面壁 MiniCPM 2.0 发布 1.Meta 震撼发布 Llama 3，8B、70B模...

大数据 2024-06-18 人工智能

1165阅读

LLaMA: Open and Efﬁcient Foundation Language Models

*背景已有的大模型越来越多的追求更大的参数量以实现更高的性能，但有研究表明更小的模型在更大的数据集上同样可以表现良好，因此本文旨在通过大量公开可用的数据集来训练一个语言模型同时取得SOTA的性能，模型大小从7B到65B，并且开源相关模型代码。(htt...

人工智能 2024-06-17 人工智能

1164阅读

硬核解读KubeEdge基于大模型边云协同的机器人语义分割算法

本文分享自华为云社区《KubeEdge：基于大模型边云协同的机器人语义分割算法》，作者：云容器大未来。近年来快速发展的视觉大模型(例如 SAM 在促进高精度的智能感知方面具有很大的潜力。然而，边缘环境中的资源限制往往会限制这种视觉大模型在本地部署，从...

AIGC 2024-06-17 人工智能

1054阅读

大模型论文解读|| 数学新巅峰，微软&清华联合研究发现：7B级LLaMA-2模型数学能力惊人，准确率高达97.7%

开篇：数学能力在常规语言模型中的崭露头角数学能力长期以来被认为是语言模型中难以攻克的领域，只有在模型规模极大或经过大量数学相关预训练的情况下才可能显现。然而，最新的研究表明，即使是规模较小的常规语言模型，如LLaMA-2 7B，也已经展现出了强大的数学...

AIGC 2024-06-17 人工智能

1002阅读

手把手教你微调Stable Diffusion

温馨提示关于本文：本文你可以学习到完整的不使用webui借助lora和dreambooth微调Stable Diffusion的全过程。手把手教你微调Stable Diffusion生成优弧，但是半失败版? 关于训练：单卡32GV...

生成式AI 2024-06-17 人工智能

1291阅读

新手教程之使用LLaMa-Factory微调LLaMa3

文章目录为什么要用LLaMa-Factory 什么是LLaMa-Factory LLaMa-Factory环境搭建微调LLaMA3 参考博文为什么要用LLaMa-Factory 如果你尝试过微调大模型，你就会知道，大模型的环...

AIGC 2024-06-17 人工智能

1852阅读

AI绘画数字人之声音克隆：无样本，1分钟样本完美克隆声音，开源！

最近在搞克隆人，发现一个很好的声音克隆项目，测试了一下，效果真不错，可以直接用，也可以微调后使用，好了废话不多说，直接上干活，哈哈~~ 首先这次直接说项目工具：GPT-SoVITS （安装包下载请看文末扫描获取）项目功能介绍：零样本文本到语音...

人工智能 2024-06-17 人工智能

1601阅读

轻松识别Midjourney等AI生成图片，开源GenImage

AIGC时代，人人都可以使用Midjourney、Stable Diffusion等AI产品生成高质量图片，其逼真程度肉眼难以区分真假。这种虚假照片有时会对社会产生不良影响，例如，生成公众人物不雅图片用于散播谣言；合成虚假图片用于金融欺诈，造成信任危机等。...

生成式AI 2024-06-16 人工智能

947阅读

AI绘画Stable Diffusion 3 正式开源，AI生图格局迎来巨变！（附模型下载）

大家好，我是向阳就在刚刚，Stable Diffusion 3 Medium 如约而至。几天前，Stability AI 在社交平台 X 上官宣，SD3 Medium 将在 6 月 12 日正式开源。这一次，没有跳票，它是真的来了。 20...

人工智能 2024-06-16 人工智能

1011阅读

大规模语言模型从理论到实践 LLaMA的模型结构

1.背景介绍随着人工智能技术的不断发展，大规模语言模型（Large Language Models, LLMs）已经成为自然语言处理领域的热点。这些模型通过在大规模数据集上进行训练，能够生成连贯、相关且有趣的文本输出。LLaMA 是 Meta AI 开...

AIGC 2024-06-16 人工智能

1003阅读

论文笔记：Pixel-Aware Stable Diffusion for Realistic Image Super-Resolution and Personalized Stylization

CVPR2024 论文代码：yangxy/PASD (github.com 论文地址：[2308.14469v3] Pixel-Aware Stable Diffusion for Realistic Image Super-resolution a...

大数据 2024-06-16 人工智能

1295阅读

英伟达开源3400亿巨兽，98%合成数据训出最强开源通用模型！性能对标GPT-4o

【新智元导读】刚刚，英伟达全新发布的开源模型Nemotron-4 340B，有可能彻底改变训练LLM的方式！从此，或许各行各业都不再需要昂贵的真实世界数据集了。而且，Nemotron-4 340B直接超越了Mixtral 8x22B、Claude sonn...

生成式AI 2024-06-16 人工智能

944阅读

在线教程｜零门槛部署 Llama 3，70B 版本只占 1.07G 存储空间，新用户免费体验 8B 版本

4 月 18 日，Meta 宣布开源 Llama 3，这个号称「迄今为止最好的开源大模型」一经发布，立刻引爆科技圈！发布当天恰逢斯坦福大学教授、AI 顶尖专家吴恩达的生日，作为 AI 开源倡导者，他激动地发文表示：这是我收到过最好的生日礼物，谢谢...

AIGC 2024-06-16 人工智能

835阅读

一文实现Llama 3 图片理解能力微调（XTuner+LLaVA 版）

本次实验基于 Llama3-8B-Instruct 和 XTuner 团队预训练好的 Image Projector 微调自己的多模态图文理解模型 LLaVA。实验平台为InternStudio，实验所用的显存为24G。 =============目录=...

人工智能 2024-06-16 人工智能

1875阅读

爬虫概念、基本使用及一个类型和六个方法（一）

目录一、爬虫简介 1.什么是爬虫 2.爬虫的核心 3.爬虫的用途 4.爬虫的分类 5.反爬手段二、Urllib基本使用 1.导入我们需要的包 2.定义一个url 3.模拟浏览器向服务器发送请求 4.获取响应中的页面的源码 5....

AIGC 2024-06-15 大数据

913阅读

用ControlNet+Inpaint实现stable diffusion模特换衣

用ControlNet+Inpaint实现stable diffusion模特换衣 ControlNet 训练与架构详解 ControlNet 的架构用于文本到图像扩散的 ControlNet 训练过程...

人工智能 2024-06-15 人工智能

1181阅读

Scaling Law触礁「数据墙」？Epoch AI发文预测LLM到2028年耗尽所有文本数据

【新智元导读】训练数据的数量和质量，对LLM性能的重要性已经是不言自明的事实。然而，Epoch AI近期的一篇论文却给正在疯狂扩展的AI模型们泼了冷水，他们预测，互联网上可用的人类文本数据将在四年后，即2028年耗尽。数据和算力，是AI大模型最重要的两把...

AIGC 2024-06-15 人工智能

911阅读

大模型理解复杂表格，字节&中科大出手了

只要一个大模型，就能解决打工人遇到的表格难题! 字节联手中科大推出了一款统一表格理解大模型，可以以用户友好的方式解决多种表格理解任务。同时提出的还有一套开源测试基准，可以更好地评估模型在表格理解任务上的表现。该模型名为TabPedia，利用多模态大模...

人工智能 2024-06-15 人工智能

952阅读

使用LLaMA-Factory来实现微调ChatGLM-3B

前提：本文是使用阿里云的人工智能PAI平台的交互式建模（DSW）来进行的如下操作安装LLaMA-Factory # 克隆项目 git clone https://github.com/hiyouga/LLaMA-Factory.git # 安装项目...

人工智能 2024-06-15 人工智能

1442阅读

天才程序员周弈帆 | Stable Diffusion 解读（一）：回顾早期工作

本文来源公众号“天才程序员周弈帆”，仅用于学术分享，侵权删，干货满满。原文链接：Stable Diffusion 解读（一）：回顾早期工作在2022年的这波AI绘画浪潮中，Stable Diffusion无疑是最受欢迎的图像生成模型。究其原因，第一...

AIGC 2024-06-14 人工智能

1151阅读

【全网瞩目】你想知道的Llama3都在这里

Meta发布了开放式生成人工智能模型 Llama 系列的最新产品： Llama 3。或者更准确地说，该公司首次发布了其新的 Llama 3 系列中的两个模型，其余模型将在未来某个不确定的日期发布。 Meta 称，与上一代 Llama 型号 Llama 2...

人工智能 2024-06-14 人工智能

957阅读

规格拉满！Llama和Sora作者都来刷脸的中国AI春晚，还开源了一大堆大模型成果

本周国内最受关注的AI盛事，今日启幕。活动规格之高，没有哪个关心AI技术发展的人能不为之吸引—— Sora团队负责人Aditya Ramesh与DiT作者谢赛宁同台交流，李开复与张亚勤炉边对话，Llama2/3作者Thomas Scialom，王小川、杨...

AIGC 2024-06-14 人工智能

902阅读

AIGC-风格迁移-style Injection in Diffusion-CVPR2024HighLight-论文精度

Style Injection in Diffusion: A Training-free Approach for Adapting Large-scale Diffusion Models for Style Transfer-CVPR2024High...

人工智能 2024-06-14 人工智能

1874阅读

生成式 AI：百度“文心一言”对标 ChatGPT？什么技术趋势促使 ChatGPT 火爆全网？_chatbi 基于文心一言的生成式数据分析技术探索

文章目录前言一、生成式 AI 的发展和现状 1.1、什么是生成式 AI？ 1.2、生成式 AI 的发展趋势 1.3、AI 生成内容的业务场景和分类二、生成式 AI 从分析领域到创作领域 2.1、降低内容创...

AIGC 2024-06-14 人工智能

893阅读

Llama 3 CPU推理优化指南

备受期待的 Meta 第三代 Llama 现已发布，我想确保你知道如何以最佳方式部署这种最先进的 (SoTA LLM。在本教程中，我们将重点介绍如何执行仅权重量化 (WOQ 来压缩 8B 参数模型并改善推理延迟，但首先，让我们讨论一下 Meta Lla...

生成式AI 2024-06-14 人工智能

1056阅读