-
Window下部署使用Stable Diffusion AI开源项目绘图
Window下部署使用Stable Diffusion AI开源项目绘图 前言 前提条件 相关介绍 Stable Diffusion AI绘图 下载项目 环境要求 环境下载 运行项目 打开网址,即可体验 文字生成图像(txt2img) 庐山瀑...
-
文献阅读:LLaMA: Open and Efficient Foundation Language Models
文献阅读:LLaMA: Open and Efficient Foundation Language Models 1. 文章简介 2. 模型训练 1. 训练数据 2. 模型结构 3. 模型训练 1. Optimiz...
-
运行stable diffusion
1、stable diffusion git下载代码 https://github.com/CompVis/stable-diffusion 安装环境ldm 2、下载模型 从网站中 CompVis (CompVis 下载compvis的模型,有如...
-
语音识别神器 Whisper 的几个小技巧
1、前言 OpenAI开源的免费离线语音识别神器Whisper,我在安装使用后发现一些问题,于是搜了半天最终汇总了这几个主要的小技巧,希望对大家有帮助,不用满世界再搜了。 我主要用于中文的识别,所以就只说中文相关的了,我的环境是: 系统:Ubunt...
-
GPT-4V都考不过?基于大学水平考试的多模态AI测试基准MMMUs发布
近日,一项基于大学水平考试的多模态AI测试基准MMMUs发布,旨在评估机器在广泛多样的任务上的专家级多模态理解和推理能力。这一基准对当前最先进的GPT-4V等模型提出挑战,通过涵盖艺术与设计、商科、科学、健康与医学、人文与社会科学、技术与工程等六个学科的3...
-
关于python环境下的语音转文本,whisper或funASR
因为前阵子,有需求要将语音转为文本再进行下一步操作。感觉这个技术也不算是什么新需求,但是一搜,都是大厂的api,或者是什么什么软件,由于想要免费的,同时也要嵌入在代码中,所以这些都不能用。、 一筹莫展的时候,突然搜到whi...
-
Stable Diffusion WebUI 图生图 DeepBooru反推提示词 结果翻车了
图生图界面,上传图片,点击“DeepBooru反推提示词” 图形界面没有反应,终端日志 Downloading: "https://github.com/AUTOMATIC1111/TorchDeepDanbooru/releases/downl...
-
280万大模型中文开发者拿到最后一块拼图
2023年5月,微软CEO纳德拉抛出一个惊人数字,未来全球的开发者数量将会达到10亿。 那时候Meta的Llama已经开源4个月,但一些国内的开发者发现,从小以英文语料喂养起来的Llama,对中文世界并不友好。 这未来的“10亿”开发者里会有多少中文开发者...
-
最强的GPT-4V都考不过?基于大学考试的测试基准MMMU诞生了
目前最好的大型多模态模型 GPT-4V 与大学生谁更强?我们还不知道,但近日一个新的基准数据集 MMMU 以及基于其的基准测试或许能给我们提供一点线索,如下排行榜所示。 看起来,GPT-4V 在一些科目上已经强过挂科的大学生了。当然这个数据集的创造目的...
-
stable diffusion制作韩国版AI女友关键词
问题 怎么样使用stable diffusion简单制作韩国版AI女友?这里假设已经安装好stable diffusion webui版。这里主要记录一下韩国版AI女友sd配置参数 Stable Diffusion prompt RAW ph...
-
大模型部署手记(12)LLaMa2+Chinese-LLaMA-Plus-2-7B+Windows+text-gen+中文对话
1.简介: 组织机构:Meta(Facebook) 代码仓:https://github.com/facebookresearch/llama 模型:chinese-alpaca-2-7b-hf 下载:使用百度网盘下载 硬件环境:暗影精灵7Plu...
-
使用PyTorch加速生成式 AI模型
PyTorch 团队发布了一篇名为《Accelerating Generative AI with PyTorch II: GPT, Fast》的博文,重点介绍如何使用纯原生 PyTorch 加速生成式 AI 模型。 正如最近在PyTorch 开发者大会上...
-
VSCode安装Copilot
GitHub Copilot 是什么 GitHub Copilot 是一个可以帮助你更简单、更快速地编写代码的工具,由 GPT-3 提供支持。你只需编写所需代码的描述——例如,编写一个函数来生成一个随机数,或对一个数组进行排序——Copilot 就会为...
-
当微软Office接入Copilot后:公主,请办公
在AI的加持下,未来的办公室可能不需要那么多咖啡了。 科幻文学一代宗师、赛博朋克之父威廉·吉布森曾说:未来早已到来,只是尚未平均分布。当“所有行业都要被大模型重新做一遍”这句话传遍大街小巷,人人思考AI究竟如何改变人类行为时,有一个赛道已经悄然完成了A...
-
AI制作视频——mov2mov以及inpaint
背景 AI制作视频的几种思路 1.从零开始生成:清华的cogview,runway gen-1、gen-2,微软的女娲 这个思路,就是认为可以通过文字描述的方式把视频画面描述出来,通过对文本-视频帧内容-视频内容的数据对的平行语料的学习。学习到文本故...
-
二次-InsCode Stable Diffusion 美图活动一期
模型: AbyssOrangeMix2 - SFW_Soft NSFW_AbyssOrangeMix2_sfw.safetensors 参数配置: 正:Mountains and seas, people 负:NSFW, (worst qualit...
-
解读Lawyer LLaMA,延申专业领域大模型微调:数据集构建,模型训练
解读Lawyer LLaMA,延申自己领域大模型微调:数据集构建,模型训练 项目地址link 自己领域的大模型微调,实现思路大都和这篇文章是一样的,有的是基于LLaMA,或者有的是基于Chinese-LLaMA,或者是其他开源的大模型,本文基于自己训...
-
【开源工具】使用Whisper提取视频、语音的字幕
这里写目录标题 一、语音转字幕操作步骤 1、下载安装包Assets\WhisperDesktop.zip[^2] 2、加载模型 2.1 下载模型 2.1.1 进入Hugging Face[^3]的仓库 2.1.2 选择需要下载的模型 2....
-
分享:前端开发使用的各类 AI Copilot 辅助开发
前言 不会现在还有哪位码农没用过AI辅助编程工具吧? 网上各种当生意一样教直接使用的,但是这种方式是不合规的,这里不推荐。为了不再被封,本文会避免使用无关的关键词。 虽然因为种种原因,无法直接使用。但现如今,已经有的很多合规方式可以让我们稳定使用了...
-
AI绘图软件Stable Diffusion 安装和使用
Stable Diffusion2是目前最流行开源AI绘图软件,它有两种使用方式:线上使用和本地部署。 线上使用有4种方式:(1) Stable Diffusion官网,(2) Huggingface,(3) 百度飞桨AI实训平台,(4)Google的C...
-
Stable Diffusion - 真人照片的高清修复 (StableSR + GFPGAN) 最佳实践
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/132032216 GFPGAN (Generative Facial...
-
Stable Diffusion AI绘画学习指南【本地环境搭建win+mac】
一、硬件配配置要求 系统:windows 10 / Mac os 硬盘:C 盘预留 15GB 以上,其他盘 50GB 以上,Stable Ddiffusion的很多大模型都是以 GB 起步。 显卡:4GB 以上,建议 8GB, 效率高,能玩大尺寸的...
-
视频版ContorlNet来了!SparseCtrl增强AI生成视频可控性
在文本到视频(T2V)领域的最新研究中,SparseCtrl技术通过引入时间稀疏信号实现了对视频结构的灵活控制。传统的文本提示在空间不确定性方面存在问题,容易导致模糊的帧组合。 为了提高可控性,SparseCtrl采用了密集结构信号,如逐帧深度/边缘序列,...
-
Duck AI推多模式计算机交互数据收集器 DuckTrack:可收集鼠标、键盘、屏幕等数据
近日,Duck AI发布了一项引人注目的创新——DuckTrack,一款多模式计算机交互数据收集器。该工具的研发旨在为计算机代理的进步提供精准而准确的用户交互跟踪,成为训练智能系统的关键工具。 DuckTrack能够通过用户友好的桌面应用程序在主要操作系统...
-
VsCode 安装 GitHub Copilot插件 (最新)
##在线安装: 打开Vscode扩展商店,输入 "GitHub Copilot " ,选择下载人数最多的那个。(这个是你写一部分代码或者注释,Ai自动帮你提示/补全代码),建议选择这个 注意下面有个和他类似的 "GitHub Copilot Chat"...
-
Stable Diffusion的使用以及各种资源
Stable Diffsuion资源目录 SD简述 sd安装 模型下载 关键词,描述语句 插件管理 controlNet 自己训练模型 SD简述 Stable Diffusion是2022年发布的深度学习文本到图像生成模型。它主要...
-
云服务器部署stable diffusion webui
一些过程+亿些踩坑记录 都是因为自己显卡太差,正好还有剩下来的深度学习平台租的服务器,单纯用的话没有必要这么麻烦,但训练对显存有要求而且我也没打算拿着小笔记本电脑跑到天荒地老。 目前时间是2022.11.12,以后和以前的版本可能会不适用。 我用到的...
-
英特尔推Extension for Transformers工具包 大模型推理性能提升40倍
在当前技术发展的背景下,英特尔公司推出的Extension for Transformers工具包成为一个重要创新,实现了在CPU上对大型语言模型(LLM)推理性能的显著加速。该工具包通过LLM Runtime技术,优化了内核,支持多种量化选择,提供更优的...
-
神经网络实用工具(整活)系列---使用OpenAI的翻译模型whisper实现语音(中、日、英等等)转中字,从此生肉变熟肉---基础篇
最近在做神经网络的研究,偶然间看到OpenAI开源出了一个多国语音转文字的模型,脑海里突然想到余大嘴在华为发布会发布实时语音翻译时满屏弹幕的“???”和“!!!”,于是决定做一个多国语音转简体中文字幕的软件来玩一玩。 想法是这样的:通过OpenAI最新发...
-
【AIGC】【AI绘画】controlNet介绍(原理+使用)
文章目录 安装教程 1.环境安装 2. 下载预训练的模型文件 3.运行(生成可视化界面) 1、ControlNet:AI绘画 1.1、ControlNet的本质是文生图(txt2img 2.2、预处理器 & 模型选择 1.3、参...
-
AI视野:OpenAI官宣奥特曼回归;元象推出3D拍摄与混合编辑插件工具;百度灵医大模型将接入孚宝机器人;together.ai融资7.3亿元
???AI新鲜事 OpenAI官宣Sam Altman回归担任CEO OpenAI正式宣布Sam Altman回归担任CEO,Mira Murati将回到CTO职位,新的董事会由Bret Taylor、Larry Summers和Adam D'Angelo...
-
一夜爆火!4人公司半年打造估值2亿的AI视频工具,撼动Runway地位
谁能想到,短短一周内AI视频生成工具一连炸场两次。 上周二,Stability AI刚发布首个开源AI视频模型Stable Video Diffusion(SVD),后脚Pika本周二发布了第一个正式产品:Pika1.0。 这次Pika1.0比SVD还炸裂...
-
MacOS-use-Stable-Diffusion
导航 (返回顶部 1. Stable Diffusion 1.1 用法和争议 1.2 许可证 1.3 不可控性 1.4 一点想法 1.5 用途 1.6 教程链接 2. Setup 2.1...
-
Stable Diffusion实操示例
目录 一、负向提示词 二、高清修复(Hi-Res Fix 三、局部重绘inPaint 1、“让眼睛闭起来”的特效 2、“将花朵替换为蝴蝶”的特效 3、更换背景 四、涂鸦重绘 1、与局部重绘的区别 2、修复手指 五、Control...
-
[效率提升]vscode+copilot
1,安装最新版本的vscode; https://code.visualstudio.com/docs/getstarted/introvideos 点击最新版本后,将链接中 http://az764295.vo.msecnd.net 替换为 http...
-
在idea或pycharm中安装github copilot登录后状态无变化,继续提示登录
一、我目前使用的版本 idea 2022.3.1 专业版 pycharm 2022.3.1 专业版 GitHub Copilot 1.1.38.2229 二、遇到的问题 遇到的问题:在idea中安装GitHub Copilot登录后状态无变化,继...
-
Stable Diffusion WebUI挂VPN不能跑图解决办法(Windows)
如何解决SD在打开VPN的状态不能运行的问题 在我们开VPN的时候会出现无法生成图片,也无法做其他任何事,这个时候是不是很着急呢? 别急,我这里会说明如何解决。 就像这样,运行半天生成不了图,有时还会出现各种Error。 其实很简单,关掉VPN就行...
-
LLM-LLaMA:手动模型转换与合并【Step 1: 将原版LLaMA模型转换为HF(HuggingFace)格式;Step 2: 合并LoRA权重,生成全量模型权重】
准备工作 运行前确保拉取仓库最新版代码:git pull 确保机器有足够的内存加载完整模型(例如7B模型需要13-15G)以进行合并模型操作。 务必确认基模型和下载的LoRA模型完整性,检查是否与SHA256.md所示的值一致,否则无法进行合并...
-
深度求索开源DeepSeek LLM 67B大模型 无需申请免费商用
深度求索发布了一个67B 的大模型,名为 DeepSeek LLM67B。这个模型完全开源,可以通过访问 chat.deepseek.com 来使用。 DeepSeek LLM67B 在公开评测榜单上表现良好,特别是在推理、数学和编程能力方面。DeepS...
-
stable diffusion和gpt4-free快速运行
这是一个快速搭建环境并运行的教程 stable diffusion快速运行 gpt快速运行 包含已经搭建好的环境和指令,代码等运行所需。安装好系统必备anaconda、conda即可运行。 stable diffusion快速运...
-
使用 RLHF 训练 LLaMA 的实践指南:StackLLaMA
由于LLaMA没有使用RLHF,后来有一个初创公司 Nebuly AI使用LangChain agent生成的数据集对LLaMA模型使用了RLHF进行学习,得到了ChatLLaMA模型,详情请参考:Meta开源的LLaMA性能真如论文所述吗?如果增加RLH...
-
Stable Diffusion WebUI部署过程踩坑记录
概述 AI绘画十分火爆。博主最近在本地部署Stable Diffusion的时候遇到了一点问题,在查找解决办法的时候也是找了好几个不同的回答,但感觉都不全面,特在此记录一下自己遇到的问题。 问题 Couldn’t install gfpgan....
-
【AI作画】使用stable-diffusion-webui搭建AI作画平台
一、安装配置Anaconda 进入官网下载安装包https://www.anaconda.com/并安装,然后将Anaconda配置到环境变量中。 打开命令行,依次通过如下命令创建Python运行虚拟环境。 conda env create n...
-
Copilot使用教程
官网及申请地址:https://copilot.github.com/ 教程包含如下内容: copilot简单介绍 使用python对copilot做些简单使用测试 使用copilot对LeetCode 题目解答 一、copilot简单介绍...
-
Stable Diffusion 动画SD-Animatediff V2
AI不仅可以生成令人惊叹的图片,还能给这些图片注入生命,让它们动起来。 这就是AnimateDiff要做的事情,一个神奇的工具,能将静态的AI生成图像转换成动画。 本次介绍基于SD如何实现这个神奇的方法。 文章目录 插件安装 使用...
-
GitHub 推出 Copilot X(集合 GPT-4),可自动补全代码和注释,将带来哪些改变?
作为一名CSDN大博主,我非常关注近期 GitHub 推出的基于 GPT-4 的智能编程工具 Copilot X。这种技术对于程序员来说是一个重要的进步,因为它可以显著提高他们的效率和准确性。那么,Copilot X 到底将带来哪些改变呢?让我们来深...
-
【AI绘画】云服务器部署stable-diffusion-webui保姆级教程
1.背景 之前给大家写过Mac苹果笔记本上部署stable-diffusion-webui的教程,知乎链接:【奶奶看了也不会】AI绘画 Mac安装stable-diffusion-webui绘制AI妹子保姆级教程 但是安装过程就花了一天的时间,各种问...
-
本地部署_语音识别工具_Whisper
1 简介 Whisper 是 OpenAI 的语音识别系统(几乎是最先进),它是免费的开源模型,可供本地部署。 2 docker https://hub.docker.com/r/onerahmet/openai-whisper-asr-webs...
-
Llama 2 来袭 - 在 Hugging Face 上玩转它
? 宝子们可以戳 阅读原文 查看文中所有的外部链接哟! 引言 今天,Meta 发布了 Llama 2,其包含了一系列最先进的开放大语言模型,我们很高兴能够将其全面集成入 Hugging Face,并全力支持其发布。Llama 2...
-
ChatGPT的Prompts关键词提示工程集合:包含AI绘画和GPT文本对话
文章目录 1 前言 2 Awesome ChatGPT Prompts 2.1 文本提示词 2.2 提示词汇总 2.3 绘画提示词 3 PromptBase 4 Prompt-Engineering-Guide 5 讨论 1 前...