-
AIGC文生图 Task01#Datawhale X 魔搭AI夏令营
从零入门AI生图原理&实践 是 Datawhale 2024 年 AI 夏令营第四期的学习活动(“AIGC”方向),基于魔搭社区“可图Kolors-LoRA风格故事挑战赛”开展的实践学习。以下是笔者对Task01教程的一些记录。 30min速通指...
-
【大模型理论篇】关于LLaMA 3.1 405B以及小模型的崛起
前不久,Meta开源了LLaMA 3.1 405B【1】,模型扩展了上下文长度至 128K,支持八种语言,效果非常惊艳,是首个在通用知识、可操控性、数学、工具使用和多语言翻译方面能够与最先进闭源 AI 模型媲美的公开可用模型,已经赶上截至目...
-
DataWhaleX魔搭夏令营第四期AIGC方向task01笔记
从零入门AI生图原理&实践是Datawhale AI 夏令营(第四期)“AIGC”方向的学习活动,基于魔搭社区“可图Kolors-LoRA风格故事挑战赛”开展的实践学习。 在task01中,我们主要在魔搭社区搭建PAI实例并体验一下baselin...
-
Midjourney 参数列表--cref & --sref
角色迁移参数:--cref ---cref,Character Reference,角色参考参数,让mj生成的角色模仿你提供的图片角色的脸、发型、衣服等。 使用方法见下图,源自官方文档: 如果是淘宝、百度、谷歌等其他渠道找的图片,要上传到mj上,...
-
一文搞懂大模型!基础知识、 LLM 应用、 RAG 、 Agent 与未来发展
LLM 探秘:想要深入了解人工智能界的“新宠”大型语言模型(LLM)吗?本文将带你走进 LLM 的世界,从入门知识到实际应用,全方位解读这个充满魔力的“大模型”。我们将一起揭开 LLM 的神秘面纱,领略其在各个领域的独特魅力。无论你是初学者还是有一定基础的...
-
抖音豆包大模型AI写作教程
简数采集器支持调用字节跳动抖音的豆包AI大模型API接口,用于对采集的数据进行研究分析,内容写作等。 抖音豆包大模型AI写作使用教程: 目录 1.启用豆包AI大模型API功能 2.设置豆包API处理规则 3.应用API规则处理数据 4.获取AI...
-
开源项目:Stable Diffusion Prompt Reader 教程
开源项目:Stable Diffusion Prompt Reader 教程 stable-diffusion-prompt-readerstable-diffusion-prompt-reader - 一个简单的独立查看器,用于在Web UI外部读取...
-
Datawhale AI夏令营第四期魔搭-AIGC文生图方向Task3笔记
①初识ComfyUI 1.GUI是“图形用户界面”(Graphical User Interface)的缩写。它是一种使用图形元素如图标、按钮和窗口等来帮助用户与软件或操作系统进行交互的用户界面类型。通过GUI,用户可...
-
【黄啊码】三分钟学会文心一言
(一)什么是文心一言 文心一言是百度研发的 人工智能大语言模型产品,能够通过上一句话,预测生成下一段话。 任何人都可以通过输入【指令】和文心一言进行对话互动、提出问题或要求,让文心一言高效地帮助人们获取信息、知识和灵感。 *指令(prompt)其实就...
-
超越传统续写模式:AI 编程距离智能研发终态还有多远?
在软件开发领域,大模型驱动的智能代码生成技术已成为研究热点,引起了广泛关注和探索。在7月27日,由开源中国主办的“AI编程革新研发效能”OSC源创会·杭州站·105期线下沙龙活动,来自百度工程效能部的前端研发经理杨经纬,从一款 AI 编程助手 —— 文心快...
-
AI作画提示词(Prompts)工程:技巧与最佳实践
文章目录 AI作画提示词(Prompts 工程:技巧与最佳实践 一、提示词工程概述 二、技巧与最佳实践 1. 明确和具体的描述 2. 使用上下文 3. 指定艺术风格 4. 使用关键词 5. 适当的限制和优先级 6. 实验和优化 示例提示词...
-
Datawhale X 魔搭 AI夏令营 第四期--AIGC文生图 task2笔记
先上图看连环画成果 一直有个篮球总冠军,根据通义千问的文生图对话式生成8个连贯的文生图故事。通过生成的故事内容生成了下面的图片 男主正在练习打篮球 动漫风,连环画,一个黑色高个子帅气男生,穿着红色篮球服,正在篮球训练场上,练习投篮,专注地重复...
-
初识LLM大模型:入门级工程知识探索与解析
前言 源自脉脉上面刷到的大模型业务工程落地可以做的方向。其实如果不是接触相关工作,有的人可能不会想了解这方面,自己实习做的方向与之相关,因此想调研总结一下行业热点方向与基础入门知识,还有一些的专业词汇的解释。包括但不限于Prompt工程、模型微调fin...
-
【AI绘画】Midjourney前置/imagine与单图指令详解
文章目录 💯Midjourney前置指令/imagine 什么是前置指令? /imagine+prompt Upscale(放大 Variations(变化) 🔄(重新生成一组图片) 💯单张图片指令 Upscale (细节优化 Var...
-
Datawhale AI夏令营第四期 魔搭-AIGC方向 task 01笔记
简介 从零入门AI生图原理&实践,是 Datawhale 2024 年 AI 夏令营第四期的学习活动(“AIGC”方向),基于魔搭社区“可图Kolors-LoRA风格故事挑战赛”开展的实践学习 适用人群: 想入门并实践 AIGC文生图、工...
-
VAD-LLaMA:基于大语言模型的视频异常检测和解释(Video Anomaly Detection and Explanation via Large Language Models)
文章目录 问题 方法 整体架构 VE and Feature Extraction Long-Term Context (LTC Module Feature Adaptor LLaMA 训练 流程图 第一阶段:训练VADor 第二阶段...
-
AIGC大模型实践总结(非常详细)零基础入门到精通,收藏这一篇就够了
大模型浪潮席卷全球,在各行各业中的重要性愈发凸显,呈现出一股不可逆转的发展趋势。这一年本人所在业产技也在这一过程中持续探索和尝试AIGC。本文一方面是对AIGC实践的总结回顾,同时也是本人学习实践AIGC过程中一些笔记、心得分享。因个人能力限制,文章中可能...
-
AI时代,程序员只会写代码已经不值钱了?
很多粉丝私信交流中,发现很多伙伴对AI的认识几乎为零,可以说只知道AI很牛,但是不知道能用AI干嘛! 另外很多伙伴,都是奔着利用AI赚钱的想法过来的,本身这没错,不过小侠要先给伙伴们泼盆冷水…… 想利用AI赚钱,这个准没错!但是要沉不下心学习一些AI知...
-
Datawhale X 魔搭 AI夏令营 - AIGC文生图方向Task2笔记
今天做的是AIGC文生图方向的 task 2 ,回顾一下 task 2 step 0 : Task 2 学习规划 step 1 : 认识通义千问 (使用通义千问大语言模型学习如何借助AI智能助手帮我们阅读代码) 链接:点击直达 1...
-
Datawhale X 魔搭 AI夏令营 AIGC方向 Task03学习笔记
一、ComfyUI 1. 工作流区域 这是 ComfyUI 的核心部分,用户在这里添加、编辑、删除和连接节点,以构建图像生成的工作流 (1)主要组件 节点(Node):节点是工作流的主要组成部分,每个节点代表一个特定的功能,如 Load...
-
AIGC-SparseCtrl: Adding Sparse Controls to Text-to-Video Diffusion Models
论文: https://arxiv.org/pdf/2311.16933 代码:https://guoyww.github.io/projects/SparseCtrl MOTIVATION relying solely on text p...
-
2024最新Stable Diffusion安装部署教程五分钟学会(附下载地址)
附上秋葉aaaki大佬整合包下载地址 👉下载地址24年8月最新 Stable Diffusion整合包v4.9(下载地址在文末)!三分钟入门AI绘画一、引言 在人工智能绘画领域,Stable Diffusion 无疑是一颗耀眼的明星。它能够根据文本描述生...
-
Datawhale X 魔搭 AI夏令营 Task1
Datawhale X 魔搭 AI夏令营 Task1 赛事解读 AI文生图相关概念 可图模型及微调简介 魔搭零代码生图、微调工具介绍 魔搭AI生图相关应用介绍 DataWhale开源组织网站主页:Datawhale DataWhaleAI夏令营第...
-
这么多AI大模型,就没一个能算清今年这破调休的?
虽然我人还在泰国跟红衣大叔周鸿祎在靶场开心的射击。 但是也知道昨天(8月27日)的一条微博热搜爆了。 这一大串看着“像代码”的文字,乍看莫名其妙,其实这说的是今年中秋节和国庆节的放假调休安排。。。 嗯,特酿的今年的中秋和国庆放假安排,从9月9日开始,先是...
-
全网最全RAG评估指南:全面解析RAG评估指标并提供代码示例
一、RAG痛点介绍 最近我一直在关注和优化RAG(Retrieval-Augmented Generation)相关的内容,总结了一下RAG的痛点和最佳实践,然后重点会介绍如何评估RAG。 二、RAG痛点优化 认识了RAG的痛点,就知道如...
-
Datawhale X 魔搭 AI夏令营-AIGC Task 02 精读代码,实战进阶 --笔记
前言 Task 01 通过预训练模型的调用,在baseline上跑通模型,实现内容→图片。即,根据prompt中输入的文本描述,模型生成对应的图片。Task 02 深入学习。 目录 一、AI生图技术 1.1 基础点 1.2 技术难点 1.3...
-
ECCV2024 | 小成本微调CLIP大模型!CLAP开源来袭:零样本和少样本训练有救了!
论文链接:https://arxiv.org/pdf/2311.16445 代码链接:https://github.com/YichaoCai1/CLAP 亮点直击 解耦潜在内容和风格因素:本文提出了一种通过对比学习和数据增强,从因果角度微...
-
如何利用AI创作PPT?
最强AI视频生成:小说文案智能分镜+智能识别角色和场景+批量Ai绘图+自动配音添加音乐+一键合成视频+百万播放量https://aitools.jurilu.com/ 你要是做一张只需要交差用的PPT,用ChatGPT连一分钟都用不了,你看我画...
-
使用FastChat快速部署LLM服务
原文:https://zhuanlan.zhihu.com/p/705915093 FastChat 是一个用于训练、服务和评估基于LLM的聊天机器人的开放平台,它的核心功能包括: 最先进模型(例如 Vicuna、MT-Bench)的训练和评估代码。...
-
Datawhale X 魔搭 AI夏令营-AIGC文生图方向Task2笔记
学习链接:https://datawhaler.feishu.cn/wiki/UM7awcAuQicI4ukd2qtccT51nug 因为不会专业性的术语所以在此依然是简单记录自己的运行和打卡。 1.文生图理论学习 Deepfake技术 Deepf...
-
Code Llama使用手册
Code Llama 是 Llama 2 的一系列最先进的开放访问版本,专门用于代码任务,我们很高兴发布与 Hugging Face 生态系统的集成! Code Llama 已使用与 Llama 2 相同的宽松社区许可证发布,并且可用于商业用途。 今天,...
-
Llama 3.1论文中文对照翻译
The Llama 3 Herd of Models 模型群 Llama 3 Llama Team, Al @ Meta 1...
-
Datawhale X 魔搭 AI0夏令营 魔搭-AIGC文生图方向 Tsak 2 震惊!!!AI小白竟然用AI生成这种图片......
本文为AI方向小白记录暑期参加魔搭夏令营-AIGC文生图方向的Task 01 报名赛事链接:可图Kolors-LoRA风格故事挑战赛_创新应用大赛_天池大赛-阿里云天池的赛制 欢迎所有小白,大神前来交流学习。 一.问题的提...
-
Datawhale AI夏令营第四期 AIGC方向 task02学习笔记
探探前沿:了解一下 AI生图技术 的能力&局限 今天我们的任务是对baseline的代码有一个更加细致的理解,然后我们会学习如何借助AI来提升我们的自学习能力,从而帮助大家在后面的学习工作中如何从容迎接各种挑战。授人以鱼不如授人以渔,你可以...
-
Stable Diffusion 的 `/sdapi/v1/img2img` 接口参数定义
{ "prompt": "", "negative_prompt": "", "styles": [ "string" ], "seed": -1, "subseed": -1, "subseed_strengt...
-
Datawhale X 魔搭 AI夏令营-AIGC文生图方向 Task02
1.AI生图的能力&局限: 如果我说这是一张AI生成的图片,你能相信吗? 然而幸运又不幸的是它确实是AI生成的。 很难想象在短短几年内,AI生图的能力已经像指数爆炸一样增长。一年前,AI还因为拙劣的画“手”能力被看轻,也因为当时这个情况,...
-
#Datawhale AI夏令营第4期#AIGC方向 文生图 Task2
Task2任务:对baseline的代码有一个更加细致的理解,然后学习如何借助AI来提升我们的自学习能力. 前沿知识:了解一下 AI生图技术 的能力&局限 AI生图技术,通常指的是使用人工智能(尤其是深度学习)来生成图像的技术。这类技术可以用于...
-
Datawhale夏令营第四期——从零入门AI生图AIGC方向 task1笔记总结
#目录# 一、夏令营内容介绍 适宜学习人群 学习内容提要 二、挑战赛介绍 比赛要求 样例 三、跑通...
-
AI绘画Stable Diffusion插件—LayerDiffusion 分层控图新突破!生成透明图片&前后景图片融合,毫无违和感!
大家好,我是画画的小强 用AI绘画Stable Diffusion 生成透明图片怎么搞? 这要搁之前,我们需要生成完图片,然后放到去背景插件中调整参数去除背景!效果一般般 如果想要在一张图片上添加主体,该怎么搞?我有个张照片,想要毫无违和感的融合到其它...
-
Datawhale X 魔搭AI夏令营 第四期-AIGC文生图lora方向 Task2笔记
继task01跑通baseline之后,有时候回想起实例中那些自己摸不着头脑的代码片段,确实有些好奇,task2正好用借助通用大语言模型工具精读了一下这些代码片段,并进行了实战演练一一基于话剧的连环画制作。 (这里学习文档给出的大语言模型...
-
解锁黑科技!百度AppBuilder助你秒变开发者,轻松实现文心一言
在数字化浪潮席卷全球的今天,人工智能(AI)和大模型技术正以前所未有的速度改变着我们的世界。从自然语言处理到图像识别,从智能推荐到自动化决策,大模型以其强大的数据处理能力和学习能力,正成为推动科技创新的核心动力。 然而,对于许多开发者而言,如何高效、便捷...
-
在亚马逊云科技上对Stable Diffusion模型提示词、输出图像内容进行安全审核
项目简介: 小李哥将继续每天介绍一个基于亚马逊云科技AWS云计算平台的全球前沿AI技术解决方案,帮助大家快速了解国际上最热门的云计算平台亚马逊云科技AWS AI最佳实践,并应用到自己的日常工作里。 本次介绍的是如何在亚马逊云科技机器学习托管服务Sage...
-
微调LLama 3.1——七月论文审稿GPT第5.5版:拿早期paper-review数据集微调LLama 3.1
前言 为更好的理解本文,建议在阅读本文之前,先阅读以下两篇文章 七月论文审稿GPT第2版:用一万多条paper-review数据微调LLaMA2 7B最终反超GPT4 提升大模型数据质量的三大要素:找到早期paper且基于GPT摘要出来7方面revi...
-
图像检索在ImageNet分类任务中的优势:超越扩散模型生成图像
🔍在之前AIGC助力ResNet分类任务:跃升10个百分点-CSDN博客文章中,提到使用Textual Inversion对COCO、PascalVOC、少样本数据集进行数据增强,再进行分类任务,精度上升。 📕而今天要聊到的这篇论文更全面地探究了扩散模型...
-
ComfyUl提示词技巧
ComfyUI prompt技巧 Prompt 输入不支持中文,建议使用翻译插件或者使用翻译软件来进行翻译。 翻译插件推荐:沙拉查词(opens in a new tab 🚧prompt 书写有什么技巧?要如何写AI绘图的prompt 在Comfy...
-
Llama 3.1深度解析:405B、70B及8B模型的多语言与长上下文处理能力
Llama 3.1 发布了!今天我们迎来了 Llama 家族的新成员 Llama 3.1 进入 Hugging Face 平台。我们很高兴与 Meta 合作,确保在 Hugging Face 生态系统中实现最佳集成。Hub 上现有八个开源权重模型 (3 个...
-
Datawhale AI夏令营第四期 魔搭-AIGC方向 task02 精读代码,实战进阶
今天我们的任务是对baseline的代码有一个更加细致的理解,然后我们会学习如何借助AI来提升我们的自学习能力,从而帮助大家在后面的学习工作中如何从容迎接各种挑战。授人以鱼不如授人以渔,你可以从中学大模型的提问技巧来实现快速学习,学会如何制作一个话剧连环画...
-
Datawhale AI夏令营第四期AIGC方向Task2学习笔记
Kolors(可图)模型 Kolors是由快手团队开发的大规模文本到图像生成模型(可图 · 模型库 (modelscope.cn )根据链接的文章内容,Kolors在视觉质量、复杂语义准确性以及中英文字符的文本渲染方面,显著优于开源和专有...
-
AIGC:clip-interrogator
文字生成图片是近年来多模态和大模型研究的热门方向,openai提出的CLIP提供了一个方法建立起了图片和文字的联系,但是只能做到给定一张图片选择给定文本语义最相近的那一个,实际项目开发中我们总是需要从一张图片获取描述,clip-interrogator应运...
-
ComfyUI插件:ComfyUI layer style 节点(三)
前言: 学习ComfyUI是一场持久战,而ComfyUI layer style 是一组专为图片设计制作且集成了Photoshop功能的强大节点。该节点几乎将PhotoShop的全部功能迁移到ComfyUI,诸如提供仿照Adobe Photoshop的图...