cli 第4页 - AIGC资讯

DIFFUSION 系列笔记| Latent Diffusion Model、Stable Diffusion基础概念、数学原理、代码分析、案例展示

目录 Latent Diffusion Model LDM 主要思想 LDM使用示例 LDM Pipeline LDM 中的 UNET 准备时间步 time steps 预处理阶段 pre-process 下采样过程 down sampl...

AIGC 2024-09-04 人工智能

632阅读

【扩散模型（六）】Stable Diffusion 3 diffusers 源码详解1-推理代码-文本处理部分

系列文章目录【扩散模型（一）】中介绍了 Stable Diffusion 可以被理解为重建分支（reconstruction branch）和条件分支（condition branch）【扩散模型（二）】IP-Adapter 从条件分支的视角，快...

生成式AI 2024-09-04 人工智能

898阅读

基于大模型的原神对话系统尝试

一.简介该项目为一次大模型+游戏的尝试，成功实现了一个与原神内角色的对话系统。演示视频：https://www.bilibili.com/video/BV1b48CeuELL github地址：https://github.com/goodlu...

生成式AI 2024-09-04 人工智能

656阅读

Stable-Diffusion1.5

SD1.5权重：https://huggingface.co/runwayml/stable-diffusion-v1-5/tree/main SDXL权重：https://huggingface.co/stabilityai/stable-diffus...

人工智能 2024-09-02 人工智能

573阅读

Datawhale X 魔搭 AI夏令营第四期（AIGC学习笔记）

Datawhale X 魔搭 AI夏令营第四期（AIGC学习笔记） 00. Diffusion 扩散模型去噪扩散模型（Denoising diffusion probabilistic models，DDPM）正向扩散过程逆向去噪过程...

AIGC 2024-09-02 人工智能

436阅读

基于 Llama factory 微调 Llama3.1-70B-Chinese-Chat

本文旨在探讨基于Llama factory使用LoRA（Low-Rank Adaptation）技术对Llama3.1-70B-Chinese-Chat模型进行微调的过程，重点介绍在单机多卡和多机多卡两种分布式训练环境下的实现方法。 1.环境准备...

人工智能 2024-09-02 人工智能

612阅读

llama.cppllama.cpp 是一个C++库，用于简化LLM推理的设置。它使得在本地机器上运行Qwen成为可能。该库是一个纯C/C++实现，不依赖任何外部库，并且针对x86架构提供了AVX、

llama.cpp llama.cpp - Qwen llama.cpp 是一个C++库，用于简化LLM推理的设置。它使得在本地机器上运行Qwen成为可能。该库是一个纯C/C++实现，不依赖任何外部库，并且针对x86架构提供了AVX、AVX2和AVX5...

人工智能 2024-09-01 人工智能

1075阅读

K8sGPT 搭配 LLaMA 3.1:8B，AI 运维也能轻松搞定

文章目录 1. 前言 2. 安装工具 3. 运行 k8s 集群 4. 运行本地 llama 模型 5. k8sgpt 模型认证管理 5.1 添加 openAI 模型认证 5.2 添加本地 llama3.1:8b模型认证 5.3 删除模型认证...

生成式AI 2024-09-01 人工智能

462阅读

Datawhale X 魔搭 AI夏令营第四期AIGC方向笔记task3

part1：工具初探一ComfyUI应用场景探索初识ComfyUI 什么是ComfyUI GUI 是 "Graphical User Interface"（图形用户界面）的缩写。简单来说，GUI 就是你在电脑屏幕上看到的那种有图标、按钮和菜单的...

生成式AI 2024-09-01 人工智能

601阅读

《史上最简单的SpringAI+Llama3.x教程》-05-打破界限，Function Calling在业务场景中的应用

什么是Function Calling Function Calling 是一种技术，它允许大型语言模型（如GPT）在生成文本的过程中调用外部函数或服务。这种功能的核心在于，模型本身不直接执行函数，而是生成包含函数名称和执行函数所需参数的JSON，...

生成式AI 2024-09-01 人工智能

712阅读

使用 Ollama、Llama 3.1 和 Milvus 进行函数调用案例

偶然看到一篇很短代码就能实现llama function call的文章。秉着学习加分项的原则，进行了实验测试。这里给出案例和全部改写后的代码。将 LLM 与函数调用相结合，就如同赋予您的 AI 连接世界的能力。通过将您的 LLM 与外部工具（例如用...

AIGC 2024-08-31 人工智能

1027阅读

DataWhale多模态赛事Task1

赛事链接：https://tianchi.aliyun.com/competition/entrance/532251/introduction?spm=a2c22.12281925.0.0.2f307137p8qZmp 赛事描述：在当下大数据、大模型时...

生成式AI 2024-08-31 人工智能

464阅读

精通 Stable Diffusion 调优秘籍

一、Stable Diffusion 调优概览 Stable Diffusion 作为一款强大的 AI 绘画工具，其调优具有至关重要的意义。通过合理的调优，可以显著提升图像生成的质量、速度和准确性，满足用户更加多样化和精细化的需求。调优主要涵盖了...

AIGC 2024-08-31 人工智能

555阅读

Stable Diffusion的微调方法原理总结

目录 1、Textural Inversion（简易） 2、DreamBooth（完整） 3、LoRA（灵巧） 4、ControlNet（彻底） 5、其他 1、Textural Inversion（简易）不改变网络结构...

生成式AI 2024-08-31 人工智能

661阅读

从零开始快速使用comfyUI进行文生图或者图生视频制作

前言今天花时间试了试怎么用 ComfyUI，今天晚上就来介绍一下，怎么简单使用。上面是用 comfyUI 生成的视频。安装首先进行安装。在 github 上搜索 comfyUI，第一个就是，点进去然后点击左侧 Release...

生成式AI 2024-08-30 人工智能

2091阅读

Datawhale AI夏令营第四期AIGC-3进阶上分-实战优化

Task3学习链接 Datawhale (linklearner.com 1. ComfyUI的安装与使用 ComfyUI 是GUI"Graphical User Interface"（图形用户界面）的一种，是基于节点工作的用户界面，主要用于操作图...

人工智能 2024-08-30 人工智能

417阅读

Stable Diffusion 开源项目教程

Stable Diffusion 开源项目教程 stablediffusionHigh-Resolution Image Synthesis with Latent Diffusion Models项目地址:https://gitcode.com/gh...

大数据 2024-08-30 人工智能

581阅读

llama.cpp使用

llama.cpp的github库地址为ggerganov/llama.cpp: LLM inference in C/C++ (github.com ，具体使用以官方说明为准。简介 llama.cpp目标是在本地和云端的各种硬件上以最小的设置和最...

AIGC 2024-08-29 人工智能

1310阅读

Datawhale X 魔搭 AI夏令营第四期--AIGC文生图 task2笔记

先上图看连环画成果一直有个篮球总冠军，根据通义千问的文生图对话式生成8个连贯的文生图故事。通过生成的故事内容生成了下面的图片男主正在练习打篮球动漫风，连环画，一个黑色高个子帅气男生，穿着红色篮球服，正在篮球训练场上，练习投篮，专注地重复...

AIGC 2024-08-29 人工智能

432阅读

VAD-LLaMA：基于大语言模型的视频异常检测和解释（Video Anomaly Detection and Explanation via Large Language Models）

文章目录问题方法整体架构 VE and Feature Extraction Long-Term Context (LTC Module Feature Adaptor LLaMA 训练流程图第一阶段：训练VADor 第二阶段...

大数据 2024-08-29 人工智能

538阅读

使用gradio部署微调后的模型

文章目录概要整体架构流程技术细节小结概要使用gradio部署微调后的模型整体架构流程 gradio前期学习，以下是一些常见的输入输出组件，有些即可输入也可输出 gr.Audio(sources=['mi...

AIGC 2024-08-29 人工智能

962阅读

Datawhale X 魔搭 AI夏令营 - AIGC文生图方向Task2笔记

今天做的是AIGC文生图方向的 task 2 ，回顾一下 task 2 step 0 : Task 2 学习规划 step 1 : 认识通义千问（使用通义千问大语言模型学习如何借助AI智能助手帮我们阅读代码）链接：点击直达 1...

人工智能 2024-08-28 人工智能

565阅读

全网最全RAG评估指南：全面解析RAG评估指标并提供代码示例

一、RAG痛点介绍最近我一直在关注和优化RAG（Retrieval-Augmented Generation）相关的内容，总结了一下RAG的痛点和最佳实践，然后重点会介绍如何评估RAG。二、RAG痛点优化认识了RAG的痛点，就知道如...

AIGC 2024-08-28 人工智能

959阅读

ECCV2024 | 小成本微调CLIP大模型！CLAP开源来袭：零样本和少样本训练有救了！

论文链接：https://arxiv.org/pdf/2311.16445 代码链接：https://github.com/YichaoCai1/CLAP 亮点直击解耦潜在内容和风格因素：本文提出了一种通过对比学习和数据增强，从因果角度微...

人工智能 2024-08-27 人工智能

574阅读

Datawhale X 魔搭 AI夏令营-AIGC文生图方向Task2笔记

学习链接：https://datawhaler.feishu.cn/wiki/UM7awcAuQicI4ukd2qtccT51nug 因为不会专业性的术语所以在此依然是简单记录自己的运行和打卡。 1.文生图理论学习 Deepfake技术 Deepf...

生成式AI 2024-08-27 人工智能

472阅读

Datawhale X 魔搭 AI0夏令营魔搭-AIGC文生图方向 Tsak 2 震惊！！！AI小白竟然用AI生成这种图片......

本文为AI方向小白记录暑期参加魔搭夏令营-AIGC文生图方向的Task 01 报名赛事链接：可图Kolors-LoRA风格故事挑战赛_创新应用大赛_天池大赛-阿里云天池的赛制欢迎所有小白，大神前来交流学习。一.问题的提...

大数据 2024-08-27 人工智能

494阅读

LLaMA Factory微调Llama3模型

LLaMA Factory是一款开源低代码大模型微调框架，集成了业界最广泛使用的微调技术，支持通过Web UI界面零代码微调大模型，目前已经成为开源社区内最受欢迎的微调框架。 ?GPU推荐使用24GB显存的A10（ecs.gn7i-c8g1.2xlar...

人工智能 2024-08-27 人工智能

796阅读

Datawhale AI夏令营第四期 AIGC方向 task02学习笔记

探探前沿：了解一下 AI生图技术的能力&局限今天我们的任务是对baseline的代码有一个更加细致的理解，然后我们会学习如何借助AI来提升我们的自学习能力，从而帮助大家在后面的学习工作中如何从容迎接各种挑战。授人以鱼不如授人以渔，你可以...

生成式AI 2024-08-27 人工智能

437阅读

#Datawhale AI夏令营第4期#AIGC方向文生图 Task2

Task2任务：对baseline的代码有一个更加细致的理解，然后学习如何借助AI来提升我们的自学习能力. 前沿知识：了解一下 AI生图技术的能力&局限 AI生图技术，通常指的是使用人工智能（尤其是深度学习）来生成图像的技术。这类技术可以用于...

生成式AI 2024-08-26 人工智能

419阅读

Datawhale X 魔搭AI夏令营第四期-AIGC文生图lora方向 Task2笔记

继task01跑通baseline之后，有时候回想起实例中那些自己摸不着头脑的代码片段，确实有些好奇，task2正好用借助通用大语言模型工具精读了一下这些代码片段，并进行了实战演练一一基于话剧的连环画制作。（这里学习文档给出的大语言模型...

人工智能 2024-08-26 人工智能

414阅读

在亚马逊云科技上对Stable Diffusion模型提示词、输出图像内容进行安全审核

项目简介：小李哥将继续每天介绍一个基于亚马逊云科技AWS云计算平台的全球前沿AI技术解决方案，帮助大家快速了解国际上最热门的云计算平台亚马逊云科技AWS AI最佳实践，并应用到自己的日常工作里。本次介绍的是如何在亚马逊云科技机器学习托管服务Sage...

人工智能 2024-08-25 人工智能

602阅读

图像检索在ImageNet分类任务中的优势：超越扩散模型生成图像

?在之前AIGC助力ResNet分类任务：跃升10个百分点-CSDN博客文章中，提到使用Textual Inversion对COCO、PascalVOC、少样本数据集进行数据增强，再进行分类任务，精度上升。 ?而今天要聊到的这篇论文更全面地探究了扩散模型...

AIGC 2024-08-25 人工智能

662阅读

Llama 3.1深度解析：405B、70B及8B模型的多语言与长上下文处理能力

Llama 3.1 发布了！今天我们迎来了 Llama 家族的新成员 Llama 3.1 进入 Hugging Face 平台。我们很高兴与 Meta 合作，确保在 Hugging Face 生态系统中实现最佳集成。Hub 上现有八个开源权重模型 (3 个...

人工智能 2024-08-25 人工智能

743阅读

Datawhale AI夏令营第四期魔搭-AIGC方向 task02 精读代码，实战进阶

今天我们的任务是对baseline的代码有一个更加细致的理解，然后我们会学习如何借助AI来提升我们的自学习能力，从而帮助大家在后面的学习工作中如何从容迎接各种挑战。授人以鱼不如授人以渔，你可以从中学大模型的提问技巧来实现快速学习，学会如何制作一个话剧连环画...

生成式AI 2024-08-25 人工智能

437阅读

AIGC：clip-interrogator

文字生成图片是近年来多模态和大模型研究的热门方向，openai提出的CLIP提供了一个方法建立起了图片和文字的联系，但是只能做到给定一张图片选择给定文本语义最相近的那一个，实际项目开发中我们总是需要从一张图片获取描述，clip-interrogator应运...

生成式AI 2024-08-25 人工智能

570阅读

部署本地语音聊天机器人：在Seeed Studio reComputer Jetson上部署Riva和Llama2

本地语音聊天机器人：在Seeed Studio reComputer Jetson上部署Riva和Llama2 所有教程都免费开源，请动动小手点个小星星https://github.com/Seeed-Projects/jetson-examples...

生成式AI 2024-08-24 人工智能

576阅读

Datawhale X 魔搭 AI夏令营 AIGC Task2笔记

对于task2里的这几句话本人还是十分赞成的定期关注AI生图的最新能力情况都十分重要：对于普通人来说，可以避免被常见的AI生图场景欺骗，偶尔也可以通过相关工具绘图对于创作者来说，通过AI生图的工具可以提效，快速制作自己所需要的内容对...

人工智能 2024-08-24 人工智能

442阅读

快速体验LoRA微调Llama3-8B模型以及海光DCU推理加速（曙光超算互联网平台国产异构加速卡）

序言本文以 LLaMA-Factory 为例，在超算互联网平台SCNet上使用异构加速卡AI 显存64GB PCIE，对 Llama3-8B-Instruct 模型进行 LoRA 微调、合并和推理。一、参考资料 github仓库代码：LLaM...

AIGC 2024-08-24 人工智能

2794阅读

Datawhale AI夏令营第四期魔搭-AIGC方向 Task2：精读代码，实战进阶笔记

在夏令营第四期Task1时，我们已经跑通了baseline，本期目的是对baseline的代码有一个更加细致的理解，学习如何借助AI来提升我们的自学习能力，理解每行代码的意思，从大模型提问技巧来实现自主学习，并学习如何制作一个连环画。首先认识大语言模型...

大数据 2024-08-24 人工智能

406阅读

Datawhale X 魔搭 AI夏令营 - AIGC方向（task01笔记）

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、基础知识二、实现步骤 1.克隆存储库： 2. 安装环境，然后重启kernel 3. 调整prompt 总结前言赛题介绍...

AIGC 2024-08-24 人工智能

456阅读

Stable Diffusion | Gradio界面设计及webUI API调用

本文基于webUI API编写了类似于webUI的Gradio交互式界面，支持文生图/图生图（SD1.x，SD2.x，SDXL），Embedding，Lora，X/Y/Z Plot，ADetailer、ControlNet，超分放大（Extras），图片信...

AIGC 2024-08-23 人工智能

640阅读

Llama 3.1 - 405B、70B 和 8B 的多语言与长上下文能力解析

Llama 3.1 发布了！Llama 3.1 有三种规格: 8B 适合在消费者级 GPU 上进行高效部署和开发，70B 适合大规模 AI 原生应用，而 405B 则适用于合成数据、大语言模型 (LLM 作为评判者或蒸馏。这三个规格都提供基础版和指令调优...

生成式AI 2024-08-23 人工智能

1485阅读

Datawhale X 魔搭 AI夏令营-第四期 AIGC-Task 2

目录认识AI助手——通义千问操作指南主要功能模块精读baseline代码分析代码的主体架构逐行解释代码其他疑问-向AI追问进行实战——基于话剧的连环画制作提示词准备执行Task1的30分钟速通Baseline 修改...

生成式AI 2024-08-23 人工智能

449阅读

Datawhale X 魔搭 AI夏令营 AIGC方向 Task02

参考教程：Docshttps://datawhaler.feishu.cn/wiki/KxI2wIeAJiRQWhkRt9dcqlNVnFR?from=from_copylink 精读baseline 代码整理使用通义千问辅助理解baseline代...

AIGC 2024-08-23 人工智能

405阅读

AI绘画大模型-StableDiffusion最强模型sd3（本地安装方法）

前言/introduction Stable Diffusion 3（简称SD3）是Stability AI最新推出的文本到图像生成模型。相比前代模型，SD3在生成质量、细节表现以及运行效率上有了显著提升，尤其在细腻的图像渲染和复杂...

人工智能 2024-08-23 人工智能

1068阅读

Datawhale X 魔搭 AI夏令营第四期 AIGC方向 task02笔记

AI工具使用 1. baseline 代码 2. 使用通义千问理解代码 2.1 工作流程 2.2 逐行释意 3. 使用通义千问生成 Prompt 3.1 生成的 Prompt 3.1 根据 Prompt 生成的图片 1. b...

人工智能 2024-08-22 人工智能

391阅读

【Stable Diffusion】最强模型——Flux推荐和下载

前言 Flux是一个由黑森林实验室（Black Forest Lab）推出的模型，开发人员由Stable Diffusion前离职人员构成。做到了很多SD和MJ都做不到或者很难做到的事情。其特点主要如下：参数规模大****：官方号称模型有12B...

AIGC 2024-08-22 人工智能

2317阅读

Datawhale 魔搭 AI夏令营第四期 AIGC方向 Tesk2 可图Kolors-LoRA模型进阶学习

AI生图的能力与局限 AI生图的原理 AI利用深度学习技术来训练神经网络，训练过程中，神经网络会学习到真实图像中的纹理、结构、颜色等特征，并将这些特征应用于生成新的图像。从而生成具有高保真度的图像。训练后，通过输入关键提示词来让模型...

AIGC 2024-08-21 人工智能

430阅读

利用多Lora节省大模型部署成本｜得物技术

一、背景近期，我们在大模型集群的部署过程中遇到了一些挑战。公司有多个业务场景，每个场景都基于自身的数据进行微调，训练出相应的大模型并上线。然而，这些场景的调用量并不高，同时大模型的部署成本较为昂贵，这造成了资源的浪费。本文将介绍我们如何利用多Lor...

大数据 2024-08-21 人工智能

452阅读

MiraData: A Large-Scale Video Dataset with Long Durations and Structured Captions

Paper name MiraData: A Large-Scale Video Dataset with Long Durations and Structured Captions Paper Reading Note Paper URL: ht...

大数据 2024-08-21 人工智能

658阅读