-
Ollama保姆级教程
Ollama保姆级教程 Ollama是一个开源框架,专门设计用于在本地运行大型语言模型。它的主要特点是将模型权重、配置和数据捆绑到一个包中,从而优化了设置和配置细节,包括GPU使用情况,简化了在本地运行大型模型的过程。 Ollama还提供了对模型量化...
-
Jetson 部署 Faster Whisper
文章目录 Whisper Faster Whisper 安装使用 尝试WSL部署 尝试 Jetson 部署 时间戳 实时转录 Whisper Whisper 是一种通用语音识别模型。它是在大量不同音频数据集上进行训练的,也是一...
-
StableDiffusion(SD)文生图教程
参数详解 📄提示词词输入(Prompt) SD中的关键词分为正面提示词和负面提示词。 正面提示词(Prompt) 将想要的图像进行描述,描述的越详细,越能达到你想要的效果;描述的越少,越由AI随意发挥,更加有创意性。 负面提示词(Negative Pro...
-
FastAPI部署大模型Llama 3.1
项目地址:self-llm/models/Llama3_1/01-Llama3_1-8B-Instruct FastApi 部署调用.md at master · datawhalechina/self-llm (github.com 目的:使用Aut...
-
stable diffusion的AnimateDiff动画插件
AnimateDiff简介 Stable Diffusion的AnimateDiff插件是一个用于生成和操作图像的强大工具,它属于Stable Diffusion模型的一个扩展。 1. 功能和用途 图像生成与修改: AnimateDiff插件能够...
-
免费体验!快速生成超逼真真人美图的Stable Diffusion模型!
环境安装 1、安装Python 下载地址:https://www.python.org/ftp/python/3.10.6/python-3.10.6-amd64.exe。 备注:把安装目录加入环境变量! 2、安装git 下载地址:h...
-
GitHub Copilot使用
本文会用更通俗的语言,并提供更全面的用例和具体操作步骤,帮助你更好地使用 Copilot 进行代码编写和优化。 **GitHub Copilot ** GitHub Copilot 是一款强大的 AI 辅助编程工具,通过编写提示词(Prompt)可以...
-
源码解析LLaMA-Factory/src/llmtuner/data/template.py + Qwen模板
@dataclass class Template: format_user: "Formatter" format_assistant: "Formatter" format_system: "Formatter" for...
-
DatawhaleX魔搭-AI夏令营AIGC-task2
一、了解AI生图技术 1,为什么了解生图技术 AIGC(AI-Generated Content 是通过人工智能技术自动生成内容的生产方式,很早就有专家指出,AIGC将是未来人工智能的重点方向,也将改造相关行业和领域生产内容的方式。 应用广泛...
-
Datawhale AI 夏令营 第四期 AIGC Task1
活动简介 活动链接:Datawhale AI 夏令营(第四期) 以及AIGC里面的本次任务说明:Task 1 从零入门AI生图原理&实践链接里的教程非常详细,很适合小白上手,从使用服务器平台到配置环境再到跑模型,手把手教! 具体细节我就不赘述了...
-
大模型+小模型协同处理跨文档理解任务,成本更低,性能更高
“Synergetic Event Understanding: A Collaborative Approach to Cross-Document Event Coreference Resolution with Large Language Mod...
-
谈谈Function Calling
👻 大模型分发助手,分发你的Prompt,助你学习AIGC 👻 LLM-HUB: Distribute Your Prompt, Unlock AIGC's Power Function Calling,这个让大语言模型 (LLM 如虎添翼的利器,...
-
一年拿下4500万用户,西语用户自己的“ChatGPT”
前些日子出炉的2024上半年 a16z Top50AI App 榜单中,有一个有点陌生的产品 Luzia,排在了第25位,压过了字节的豆包、Perplexity 等多个知名产品。 按 MAU 排名的 AI App 榜单中 Luzia 排名第25|图片来源...
-
Datawhale X 魔搭 AI夏令营第四期 魔搭-AIGC方向 task03笔记
在task02中,我们对baseline有了深度了解,我们学会了用AI工具来帮助我们学习。另外,我们制作了话剧连环画。 我们今天的任务是了解微调的基本原理,然后我们会对微调的各种参数有一个更加清楚的了解,来实现一个更好的效果,并且在这个Task中会给大家...
-
无需训练的 Diffusion MoE 方案 (SegMoE): Segmind Mixture of Diffusion Experts
Paper name SegMoE: Segmind Mixture of Diffusion Experts Paper Reading Note Blog URL: https://blog.segmind.com/introducing-seg...
-
【AIGC】ComfyUI 入门教程(3):图生图工作流|AI 生成图片
前言 对 AIGC 技术感兴趣,加个关注,保持联系: ComfyUI 是 Stable Diffusion 的一个基于节点组装绘图流程的图形用户界面(GUI)。通过将不同的节点连接在一起,你可以在 ComfyUI 中构建图像生成工作流。一个完整的工作...
-
Midjourney中文版教程:参数详解
1.长宽比 可以设置图片的纵横比。按照需求可以选择不同的尺寸,也可以自定义。 注意:--ar必须使用整数。使用139:100代替1.39:1。 长宽比会影响生成图像的形状和构图。 在放大时,某些长宽比可能会稍微改变。 较旧的Midjo...
-
IBM中国研发裁员与AIGC浪潮下的中国IT产业新篇章:挑战、机遇与未来展望
文章目录 一、跨国公司战略调整与全球IT版图的重构 1. 跨国公司的战略考量 2. 中国IT产业的应对策略 二、人才市场的深刻变革与应对策略 1. 人才流失与再就业压力 2. 人才培养与引进策略 3. 个人职业规划与发展 三、AIGC浪...
-
Flux【基础篇】:Flux&Midjourney&SDXL模型出图对比:细节质量
大家好我是极客菌!!! 前面和大家分享了Flux在手部和脚生成图片的效果。 今天我们看一下Flux在细节质量上面的表现。主要是以下3个模型的对比。 Flux.1 Dev Midjourney V6.1 SD大模型:RealVisXL V4...
-
AIGC 提示词(1):揭秘AIGC的世界:提示词的力量
引言: 在人工智能与创意产业交汇的前沿,AIGC(AI Generated Content)正成为热门话题。本文将深入探讨AIGC的核心组件之一——提示词(Prompt),它是如何激发AI创作潜能,推动内容创作的新革命。 1. AIGC基础概念 定...
-
Datawhale AI夏令营第四期魔搭-AIGC文生图方向Task1随笔
目录 前言: 一、Datawhale AI夏令营简单介绍: 二、Datawhale AI夏令营学习课程 AIGC方向: 大模型应用开发方向: 多模态大模型(数据合成 : 三、报名二维码 Task1: 一、赛题解读: 二、文生图: 1、...
-
Datawhale X 魔搭 AI夏令营 第四期魔搭-AIGC文生图方向Task1笔记及心得
从零入门AI生图原理&实践是Datawhale 2024年AI夏令营第四期“AIGC”方向的学习活动,基于魔搭社区“可图Kolors-LoRA风格故事挑战赛”开展的实践学习。 主要是通过对模型的微调,以及对prompt的调整,可以根据要求生成不同...
-
AI 音频/文本对话机器人:Whisper+Edge TTS+OpenAI API构建语音与文本交互系统(简易版)
文章目录 前言 思路: 环境配置 代码 1. 加载Whisper模型 2. 使用Whisper语音转文本 3. 使用OpenAI API生成文本进行智能问答 4. 实现文本转语音功能 5. 合并音频文件 6. 构建Gradio界面 注意 总...
-
AIGC工具推荐:构建自己的创作生态
AIGC工具推荐:构建自己的创作生态 在如今这个信息快节奏的时代,内容的创造与发布已成为越来越重要的趋势。人工智能生成内容(AIGC)技术的迅猛发展,使得创作变得更加高效、灵活且具创新性。通过合适的AIGC工具,创作者可以构建一个个人化的创作生态,释放...
-
关于大模型和AIGC的36条笔记和真话
行业到底有多卷? 最新统计,中国已有130多个大模型问世,在网信办备案的算法模型也超过70多家。BAT等互联网巨头悉数下场发布AI大模型,仅2023年就有超60家创业公司拿到融资,产品更是布满了基础层、模型层和应用层。新一代生成式AI,可能要回头看看上一...
-
【国产异构加速卡】基于llama.cpp实现Llama3模型的guff格式转换、4bit量化以及推理加速
重要说明:本文从网上资料整理而来,仅记录博主学习相关知识点的过程,侵删。 序言 本文使用llama.cpp框架,对 Llama3-8B-Instruct 模型进行gguf格式转换,8bit量化,并在CPU和GPU上对8bit模型进行推理。 测试平台...
-
现在的大模型榜单,真就没一个可信的。
现在的大模型榜单上,真的都是水分。 全是作弊的考生,真的。 上周,AI圈有个很炸裂的大模型发布,在全网引起了山呼海啸,一众从业者和媒体尊称它为开源新王。 就是Reflection70B。 在每项基准测试上都超过了 GPT-4o,还只用70B的参数,就击败...
-
记一次:Datawhale AI夏令营-第四期-魔搭-AIGC-Task02
前言:上一篇我们按步骤跑了一遍Baseline也生成了8张故事图片,但是原理啥的都是一头雾水,因为是初学者,所以只能一点点的分析来理解消化。这篇咱们就深入的来了解一下相关的内容。根据内容自己总结理解和查询相关的一些资料。不正确的地方提出来我修改一下。 学...
-
【Datawhale X 魔搭 AI夏令营】AIGC方向——Task02笔记GC
Task02 AI生图技术 为什么要了解AI生图前沿? AI生图的历史 AI生图的难点和挑战有哪些? 精读baseline代码(上次运行的) 再次生成图片 AI生图技术 为什么要了解AI生图前沿? AIGC(AI-Gene...
-
#Datawhale X 魔搭 AI 夏令营# AIGC文生图 Task2
1. 什么是AI生图 一般来说,AI生图模型属于多模态机器学习模型,通过海量的图库和文本描述的深度神经网络学习,最终的目标是可以根据输入的指示(不管是文本还是图片还是任何 生成符合语义的图片。 通俗来说,AI生图模型获得图片生成能力主要是通过 学习 图...
-
使用亚马逊Bedrock的Stable Diffusion XL模型实现文本到图像生成:探索AI的无限创意
引言 什么是Amazon Bedrock? Amazon Bedrock是亚马逊云服务(AWS)推出的一项旗舰服务,旨在推动生成式人工智能(AI)在各行业的广泛应用。它的核心功能是提供由顶尖AI公司(如AI21 Labs、Anthropic、Cohere...
-
Datawhale X 魔搭AI夏令营 第四期 AIGC文生图方向 Task2笔记
这次的笔记主要是结合了AI来辅助学习和生成提示词,和上次Task1的笔记一样,笔者会先过一遍流程,在文末再补充相应的理论知识。 通义千问(如果已经有习惯的大语言模型可以跳过这一段) 通义千问是由阿里云开发的人工智能助手,这里给出链接,大家可以自行体验...
-
Datawhale X 魔搭 AI夏令营‣AIGC文生图方向-Task2笔记
目录 一、用AI的prompts进行AI文生图 ‣通义千问 ‣跑baseline ‣结果展示: ‣另,prompts风格补充: 三、精读baseline ‣原始代码详情 ‣分析代码的主题架构 & 分析代码的主题...
-
AI绘画Stable Diffusion【图片线稿转绘】:一分钟将建筑图片转绘成线稿,原来这么简单!保姆级教程建议收藏!
大家好,我是程序员晓晓 关于AI绘画Stable Diffusion 的线稿转绘,前面和大家分享了文生图的实现方式 AI绘画 Stable Diffusion【线稿转绘保姆级教程】:一分钟实现照片转绘线稿、图片转绘灰度图! 前面这种方式,在实现建筑图片...
-
AI绘画-黑神话悟空【Lora模型】:超写实逼真黑悟空Flux Lora它来了!一键直出超写实的悟空图片!
大家好,我是程序员晓晓 最近两天,可以说《黑神话:悟空》真的是太火了。在大家热心谈论黑悟空的时候,AI绘画领域也不甘落后,结合最近火爆的AI绘画工具Flux模型,各路大神第一时间就训练出了Flux的Lora版本,今天我们就来体验感受一下大神最新推出的Fl...
-
AI图像生成新纪元:Ideogram 2.0的突破与行业响应,Midjourney开放免费网页版!附订阅教程
随着Ideogram 2.0的发布,AI图像生成能力被推向了全新的高度。 1.Ideogram 2.0是什么? Ideogram 2.0是最新推出的AI文本到图像生成模型,设计的初衷通过人工智能技术提供更精细、更优质的图像生成服务。 长期以来,对于...
-
ComfyUI - 在服务器中部署 AIGC 绘画的 ComfyUI 工具 教程
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/141140498 免责声明:本文来源于个人知识与公开资料,仅用于学术交...
-
【diffusers极速入门(七)】Classifier-Free Guidance (CFG)直观理解以及对应代码
系列文章目录 【diffusers 极速入门(一)】pipeline 实际调用的是什么? call 方法! 【diffusers 极速入门(二)】如何得到扩散去噪的中间结果?Pipeline callbacks 管道回调函数 【diffusers极速...
-
新AI编程工具爆火:手机2分钟创建一个APP
继Cursor之后,编程界又一新贵走红。 它就是由AI初创公司Replit推出的智能体——Replit Agent。 有了它,现在编程这事儿的“打开方式”就变这样了: 而且操作方式也是极其简单,只需一个提出Prompt的动作即可: 不难看出,Repli...
-
lit-llama代码解析
https://github.com/Lightning-AI/lit-llama/blob/main/README.md 下载的时候会报错误,因为网不行,一种方法就是多次尝试,另一种方法是终端连上代理下载 pycharm连接hugging fac...
-
【Datawhale X 魔搭 AI夏令营】第四期 AIGC方向 学习笔记
零基础30分钟速通文生图 一、开通阿里云PAI-DSW试用 1、开通阿里云免费试用 链接:https://free.aliyun.com/?productCode=learn 2、在魔搭社区进行授权 链接:https://www.models...
-
Datawhale X 魔搭 第四期 AIGC文生图方向-Task03笔记
Hello,各位小伙伴们,继上一次我们精读并跑通了baseline2后,我们对AIGC文生图方向又有了更进一步的了解。今天呢我们实现AIGC方向的进阶上分,还在犹豫什么,还不快快行动起来~ 好,话不多说,今天我们就来聊聊ComfyUI和Lora微调吧~...
-
Stable Diffusion majicMIX_realistic模型的介绍及使用
一、简介 majicMIX_realistic模型是一种能够渲染出具有神秘或幻想色彩的真实场景的AI模型。这个模型的特点是在现实场景的基础上,通过加入一些魔法与奇幻元素来营造出极具画面效果和吸引力的图像。传统意义的现实场景虽然真实,但通常情况下缺乏奇幻...
-
Stable Diffusion【Lora模型】【服饰妆造】:AI绘画技术,让服装设计变得更加多彩多姿
大家好,我是小梁子。专注于AI绘画技术干货分享。喜欢的可以添加个人微信:willard_liang(文章底部可扫码),加入小梁子AI绘画学习交流群,期待与你一路同行,共同成长。 今天和大家分享一个服装饰品分类背景的基于SDXL的Lora模型:分类背景...
-
05 Midjourney从零到商用·入门篇:Describe反推-让图片变成关键词
大家好,今天告诉大家一个AI出图的小技巧,Midjourney的AI绘图过程几乎就是寻找合适的prompt(提示语,俗称咒语, 的过程,在看到一幅心仪的作品后,就想知道别人是通过什么样的咒语实现的,为了找到合适的prompt,很多同学可以说是绞尽脑汁...
-
Llama 3.1:开源LLM新突破
在人工智能的浩瀚星海中,每一颗新星的诞生都预示着科技的一次飞跃。Meta 的 Llama 3.1,携带着 4050 亿个参数的庞大身躯,以其卓越的准确性、速度和多模态能力,正引领我们进入一个全新的 AI 时代。这不仅是技术的突破,更是对未来无限可能的一次大...
-
美团 AIGC产品经理面经(已拿 offer)
背景:211本科毕业,毕业之后在北京一家中型电商公司做了3年商家后台产品经理,目前通过老薛的朋友关系拿到了美团的offer。 目前还有几家在面试流程中,继续加油💪 美团AIGC产品面经-业务面 💥1、自我介绍(每次面试必问)。 💥2、在做XX智...
-
超详细的Stable Diffusion扩展插件的推荐与安装
Stable Diffusion的强大之处不仅仅是控图的能力。强大的扩展,插件的能力可以非常高效的匹配到任何你想要的工作插件,“工欲善其事必先利其器”对于自己的sd工作区的配置可以这样做。有些插件的安装需要魔法上网(不会科学上网可以+LIULANGDITU...
-
RAG 的优化进阶与引入 Reranker
引言 在简单的 RAG 系统中,通过结合检索和生成技术,已经可以显著提升了对复杂查询的响应质量。Reranker 作为 RAG 系统中一个关键的进阶组件,通过对原 RAG 中检索到的内容进行重新组织,可以进一步提高系统的准确性。 本文将深入探讨 RA...
-
视频生成AI-可灵的具体使用方法(含提示词撰写方式)
可灵AI简介: 这个AI工具可以进行文生视频以及图生视频,支持生成长达2分钟、1080p分辨率的高清视频,帧率为30fps,并且支持多种宽高比。同时具备一键续写功能,可以延长视频运动延续时间,最长可生成3分钟的视频。接下来我们会详细的说下它的使用...