git 第74页 - AIGC资讯

Window下部署使用Stable Diffusion AI开源项目绘图

Window下部署使用Stable Diffusion AI开源项目绘图前言前提条件相关介绍 Stable Diffusion AI绘图下载项目环境要求环境下载运行项目打开网址，即可体验文字生成图像（txt2img）庐山瀑...

生成式AI 2023-12-01 人工智能

921阅读

文献阅读：LLaMA: Open and Efficient Foundation Language Models

文献阅读：LLaMA: Open and Efficient Foundation Language Models 1. 文章简介 2. 模型训练 1. 训练数据 2. 模型结构 3. 模型训练 1. Optimiz...

AIGC 2023-12-01 人工智能

831阅读

运行stable diffusion

1、stable diffusion git下载代码 https://github.com/CompVis/stable-diffusion 安装环境ldm 2、下载模型从网站中 CompVis (CompVis 下载compvis的模型，有如...

AIGC 2023-12-01 人工智能

860阅读

语音识别神器 Whisper 的几个小技巧

1、前言 OpenAI开源的免费离线语音识别神器Whisper，我在安装使用后发现一些问题，于是搜了半天最终汇总了这几个主要的小技巧，希望对大家有帮助，不用满世界再搜了。我主要用于中文的识别，所以就只说中文相关的了，我的环境是：系统：Ubunt...

AIGC 2023-12-01 人工智能

2046阅读

GPT-4V都考不过？基于大学水平考试的多模态AI测试基准MMMUs发布

近日，一项基于大学水平考试的多模态AI测试基准MMMUs发布，旨在评估机器在广泛多样的任务上的专家级多模态理解和推理能力。这一基准对当前最先进的GPT-4V等模型提出挑战，通过涵盖艺术与设计、商科、科学、健康与医学、人文与社会科学、技术与工程等六个学科的3...

大数据 2023-12-01 人工智能

899阅读

关于python环境下的语音转文本，whisper或funASR

因为前阵子，有需求要将语音转为文本再进行下一步操作。感觉这个技术也不算是什么新需求，但是一搜，都是大厂的api，或者是什么什么软件，由于想要免费的，同时也要嵌入在代码中，所以这些都不能用。、一筹莫展的时候，突然搜到whi...

生成式AI 2023-12-01 人工智能

1249阅读

Stable Diffusion WebUI 图生图 DeepBooru反推提示词结果翻车了

图生图界面，上传图片，点击“DeepBooru反推提示词” 图形界面没有反应，终端日志 Downloading: "https://github.com/AUTOMATIC1111/TorchDeepDanbooru/releases/downl...

AIGC 2023-12-01 人工智能

1231阅读

280万大模型中文开发者拿到最后一块拼图

2023年5月，微软CEO纳德拉抛出一个惊人数字，未来全球的开发者数量将会达到10亿。那时候Meta的Llama已经开源4个月，但一些国内的开发者发现，从小以英文语料喂养起来的Llama，对中文世界并不友好。这未来的“10亿”开发者里会有多少中文开发者...

生成式AI 2023-12-01 人工智能

860阅读

最强的GPT-4V都考不过？基于大学考试的测试基准MMMU诞生了

目前最好的大型多模态模型 GPT-4V 与大学生谁更强？我们还不知道，但近日一个新的基准数据集 MMMU 以及基于其的基准测试或许能给我们提供一点线索，如下排行榜所示。看起来，GPT-4V 在一些科目上已经强过挂科的大学生了。当然这个数据集的创造目的...

AIGC 2023-12-01 人工智能

888阅读

stable diffusion制作韩国版AI女友关键词

问题怎么样使用stable diffusion简单制作韩国版AI女友？这里假设已经安装好stable diffusion webui版。这里主要记录一下韩国版AI女友sd配置参数 Stable Diffusion prompt RAW ph...

AIGC 2023-12-01 人工智能

837阅读

大模型部署手记（12）LLaMa2+Chinese-LLaMA-Plus-2-7B+Windows+text-gen+中文对话

1.简介：组织机构：Meta（Facebook）代码仓：https://github.com/facebookresearch/llama 模型：chinese-alpaca-2-7b-hf 下载：使用百度网盘下载硬件环境：暗影精灵7Plu...

大数据 2023-12-01 人工智能

962阅读

使用PyTorch加速生成式 AI模型

PyTorch 团队发布了一篇名为《Accelerating Generative AI with PyTorch II: GPT， Fast》的博文，重点介绍如何使用纯原生 PyTorch 加速生成式 AI 模型。正如最近在PyTorch 开发者大会上...

生成式AI 2023-12-01 人工智能

1218阅读

VSCode安装Copilot

GitHub Copilot 是什么 GitHub Copilot 是一个可以帮助你更简单、更快速地编写代码的工具，由 GPT-3 提供支持。你只需编写所需代码的描述——例如，编写一个函数来生成一个随机数，或对一个数组进行排序——Copilot 就会为...

大数据 2023-12-01 人工智能

843阅读

当微软Office接入Copilot后：公主，请办公

在AI的加持下，未来的办公室可能不需要那么多咖啡了。科幻文学一代宗师、赛博朋克之父威廉·吉布森曾说：未来早已到来，只是尚未平均分布。当“所有行业都要被大模型重新做一遍”这句话传遍大街小巷，人人思考AI究竟如何改变人类行为时，有一个赛道已经悄然完成了A...

人工智能 2023-12-01 人工智能

879阅读

AI制作视频——mov2mov以及inpaint

背景 AI制作视频的几种思路 1.从零开始生成：清华的cogview，runway gen-1、gen-2，微软的女娲这个思路，就是认为可以通过文字描述的方式把视频画面描述出来，通过对文本-视频帧内容-视频内容的数据对的平行语料的学习。学习到文本故...

AIGC 2023-12-01 人工智能

997阅读

二次-InsCode Stable Diffusion 美图活动一期

模型： AbyssOrangeMix2 - SFW_Soft NSFW_AbyssOrangeMix2_sfw.safetensors 参数配置：正：Mountains and seas, people 负：NSFW, (worst qualit...

人工智能 2023-12-01 人工智能

731阅读

解读Lawyer LLaMA，延申专业领域大模型微调：数据集构建，模型训练

解读Lawyer LLaMA，延申自己领域大模型微调：数据集构建，模型训练项目地址link 自己领域的大模型微调，实现思路大都和这篇文章是一样的，有的是基于LLaMA,或者有的是基于Chinese-LLaMA,或者是其他开源的大模型，本文基于自己训...

人工智能 2023-12-01 人工智能

1099阅读

【开源工具】使用Whisper提取视频、语音的字幕

这里写目录标题一、语音转字幕操作步骤 1、下载安装包Assets\WhisperDesktop.zip[^2] 2、加载模型 2.1 下载模型 2.1.1 进入Hugging Face[^3]的仓库 2.1.2 选择需要下载的模型 2....

AIGC 2023-12-01 人工智能

1822阅读

分享：前端开发使用的各类 AI Copilot 辅助开发

前言不会现在还有哪位码农没用过AI辅助编程工具吧？网上各种当生意一样教直接使用的，但是这种方式是不合规的，这里不推荐。为了不再被封，本文会避免使用无关的关键词。虽然因为种种原因，无法直接使用。但现如今，已经有的很多合规方式可以让我们稳定使用了...

生成式AI 2023-12-01 人工智能

1158阅读

AI绘图软件Stable Diffusion 安装和使用

Stable Diffusion2是目前最流行开源AI绘图软件，它有两种使用方式:线上使用和本地部署。线上使用有4种方式：（1） Stable Diffusion官网，（2） Huggingface，（3）百度飞桨AI实训平台，（4）Google的C...

人工智能 2023-12-01 人工智能

1108阅读

Stable Diffusion - 真人照片的高清修复 (StableSR + GFPGAN) 最佳实践

欢迎关注我的CSDN：https://spike.blog.csdn.net/ 本文地址：https://spike.blog.csdn.net/article/details/132032216 GFPGAN (Generative Facial...

人工智能 2023-11-30 人工智能

1308阅读

Stable Diffusion AI绘画学习指南【本地环境搭建win+mac】

一、硬件配配置要求系统：windows 10 / Mac os 硬盘：C 盘预留 15GB 以上，其他盘 50GB 以上,Stable Ddiffusion的很多大模型都是以 GB 起步。显卡：4GB 以上，建议 8GB, 效率高，能玩大尺寸的...

大数据 2023-11-30 人工智能

1038阅读

视频版ContorlNet来了！SparseCtrl增强AI生成视频可控性

在文本到视频（T2V）领域的最新研究中，SparseCtrl技术通过引入时间稀疏信号实现了对视频结构的灵活控制。传统的文本提示在空间不确定性方面存在问题，容易导致模糊的帧组合。为了提高可控性，SparseCtrl采用了密集结构信号，如逐帧深度/边缘序列，...

大数据 2023-11-30 人工智能

821阅读

Duck AI推多模式计算机交互数据收集器 DuckTrack:可收集鼠标、键盘、屏幕等数据

近日，Duck AI发布了一项引人注目的创新——DuckTrack，一款多模式计算机交互数据收集器。该工具的研发旨在为计算机代理的进步提供精准而准确的用户交互跟踪，成为训练智能系统的关键工具。 DuckTrack能够通过用户友好的桌面应用程序在主要操作系统...

人工智能 2023-11-30 人工智能

1055阅读

VsCode 安装 GitHub Copilot插件（最新）

##在线安装：打开Vscode扩展商店，输入 "GitHub Copilot " ,选择下载人数最多的那个。（这个是你写一部分代码或者注释，Ai自动帮你提示/补全代码）,建议选择这个注意下面有个和他类似的 "GitHub Copilot Chat"...

人工智能 2023-11-30 人工智能

1766阅读

Stable Diffusion的使用以及各种资源

Stable Diffsuion资源目录 SD简述 sd安装模型下载关键词，描述语句插件管理 controlNet 自己训练模型 SD简述 Stable Diffusion是2022年发布的深度学习文本到图像生成模型。它主要...

AIGC 2023-11-30 人工智能

975阅读

云服务器部署stable diffusion webui

一些过程+亿些踩坑记录都是因为自己显卡太差，正好还有剩下来的深度学习平台租的服务器，单纯用的话没有必要这么麻烦，但训练对显存有要求而且我也没打算拿着小笔记本电脑跑到天荒地老。目前时间是2022.11.12，以后和以前的版本可能会不适用。我用到的...

人工智能 2023-11-30 人工智能

919阅读

英特尔推Extension for Transformers工具包大模型推理性能提升40倍

在当前技术发展的背景下，英特尔公司推出的Extension for Transformers工具包成为一个重要创新，实现了在CPU上对大型语言模型（LLM）推理性能的显著加速。该工具包通过LLM Runtime技术，优化了内核，支持多种量化选择，提供更优的...

人工智能 2023-11-30 人工智能

855阅读

神经网络实用工具（整活）系列---使用OpenAI的翻译模型whisper实现语音（中、日、英等等）转中字，从此生肉变熟肉---基础篇

最近在做神经网络的研究，偶然间看到OpenAI开源出了一个多国语音转文字的模型，脑海里突然想到余大嘴在华为发布会发布实时语音翻译时满屏弹幕的“？？？”和“！！！”，于是决定做一个多国语音转简体中文字幕的软件来玩一玩。想法是这样的：通过OpenAI最新发...

人工智能 2023-11-30 人工智能

2001阅读

【AIGC】【AI绘画】controlNet介绍（原理+使用）

文章目录安装教程 1.环境安装 2. 下载预训练的模型文件 3.运行（生成可视化界面） 1、ControlNet：AI绘画 1.1、ControlNet的本质是文生图(txt2img 2.2、预处理器 & 模型选择 1.3、参...

大数据 2023-11-30 人工智能

1752阅读

AI视野：OpenAI官宣奥特曼回归；元象推出3D拍摄与混合编辑插件工具；百度灵医大模型将接入孚宝机器人；together.ai融资7.3亿元

???AI新鲜事 OpenAI官宣Sam Altman回归担任CEO OpenAI正式宣布Sam Altman回归担任CEO，Mira Murati将回到CTO职位，新的董事会由Bret Taylor、Larry Summers和Adam D'Angelo...

人工智能 2023-11-30 人工智能

952阅读

一夜爆火！4人公司半年打造估值2亿的AI视频工具，撼动Runway地位

谁能想到，短短一周内AI视频生成工具一连炸场两次。上周二，Stability AI刚发布首个开源AI视频模型Stable Video Diffusion（SVD），后脚Pika本周二发布了第一个正式产品:Pika1.0。这次Pika1.0比SVD还炸裂...

AIGC 2023-11-30 人工智能

1039阅读

MacOS-use-Stable-Diffusion

导航 (返回顶部 1. Stable Diffusion 1.1 用法和争议 1.2 许可证 1.3 不可控性 1.4 一点想法 1.5 用途 1.6 教程链接 2. Setup 2.1...

AIGC 2023-11-30 人工智能

1021阅读

Stable Diffusion实操示例

目录一、负向提示词二、高清修复(Hi-Res Fix 三、局部重绘inPaint 1、“让眼睛闭起来”的特效 2、“将花朵替换为蝴蝶”的特效 3、更换背景四、涂鸦重绘 1、与局部重绘的区别 2、修复手指五、Control...

AIGC 2023-11-30 人工智能

1130阅读

[效率提升]vscode+copilot

1，安装最新版本的vscode； https://code.visualstudio.com/docs/getstarted/introvideos 点击最新版本后，将链接中 http://az764295.vo.msecnd.net 替换为 http...

大数据 2023-11-30 人工智能

892阅读

在idea或pycharm中安装github copilot登录后状态无变化，继续提示登录

一、我目前使用的版本 idea 2022.3.1 专业版 pycharm 2022.3.1 专业版 GitHub Copilot 1.1.38.2229 二、遇到的问题遇到的问题：在idea中安装GitHub Copilot登录后状态无变化，继...

生成式AI 2023-11-30 人工智能

841阅读

Stable Diffusion WebUI挂VPN不能跑图解决办法(Windows)

如何解决SD在打开VPN的状态不能运行的问题在我们开VPN的时候会出现无法生成图片，也无法做其他任何事，这个时候是不是很着急呢？别急，我这里会说明如何解决。就像这样，运行半天生成不了图，有时还会出现各种Error。其实很简单，关掉VPN就行...

大数据 2023-11-30 人工智能

1195阅读

LLM-LLaMA：手动模型转换与合并【Step 1: 将原版LLaMA模型转换为HF(HuggingFace)格式；Step 2: 合并LoRA权重，生成全量模型权重】

准备工作运行前确保拉取仓库最新版代码：git pull 确保机器有足够的内存加载完整模型（例如7B模型需要13-15G）以进行合并模型操作。务必确认基模型和下载的LoRA模型完整性，检查是否与SHA256.md所示的值一致，否则无法进行合并...

AIGC 2023-11-30 人工智能

1188阅读

深度求索开源DeepSeek LLM 67B大模型无需申请免费商用

深度求索发布了一个67B 的大模型，名为 DeepSeek LLM67B。这个模型完全开源，可以通过访问 chat.deepseek.com 来使用。 DeepSeek LLM67B 在公开评测榜单上表现良好，特别是在推理、数学和编程能力方面。DeepS...

大数据 2023-11-30 人工智能

938阅读

stable diffusion和gpt4-free快速运行

这是一个快速搭建环境并运行的教程 stable diffusion快速运行 gpt快速运行包含已经搭建好的环境和指令，代码等运行所需。安装好系统必备anaconda、conda即可运行。 stable diffusion快速运...

生成式AI 2023-11-30 人工智能

857阅读

使用 RLHF 训练 LLaMA 的实践指南：StackLLaMA

由于LLaMA没有使用RLHF，后来有一个初创公司 Nebuly AI使用LangChain agent生成的数据集对LLaMA模型使用了RLHF进行学习，得到了ChatLLaMA模型，详情请参考：Meta开源的LLaMA性能真如论文所述吗？如果增加RLH...

人工智能 2023-11-30 人工智能

993阅读

Stable Diffusion WebUI部署过程踩坑记录

概述 AI绘画十分火爆。博主最近在本地部署Stable Diffusion的时候遇到了一点问题，在查找解决办法的时候也是找了好几个不同的回答，但感觉都不全面，特在此记录一下自己遇到的问题。问题 Couldn’t install gfpgan....

生成式AI 2023-11-30 人工智能

1276阅读

【AI作画】使用stable-diffusion-webui搭建AI作画平台

一、安装配置Anaconda 进入官网下载安装包https://www.anaconda.com/并安装，然后将Anaconda配置到环境变量中。打开命令行，依次通过如下命令创建Python运行虚拟环境。 conda env create n...

大数据 2023-11-30 人工智能

1066阅读

Copilot使用教程

官网及申请地址：https://copilot.github.com/ 教程包含如下内容： copilot简单介绍使用python对copilot做些简单使用测试使用copilot对LeetCode 题目解答一、copilot简单介绍...

人工智能 2023-11-30 人工智能

1328阅读

Stable Diffusion 动画SD-Animatediff V2

AI不仅可以生成令人惊叹的图片，还能给这些图片注入生命，让它们动起来。这就是AnimateDiff要做的事情，一个神奇的工具，能将静态的AI生成图像转换成动画。本次介绍基于SD如何实现这个神奇的方法。文章目录插件安装使用...

AIGC 2023-11-30 人工智能

943阅读

GitHub 推出 Copilot X（集合 GPT-4），可自动补全代码和注释，将带来哪些改变？

作为一名CSDN大博主，我非常关注近期 GitHub 推出的基于 GPT-4 的智能编程工具 Copilot X。这种技术对于程序员来说是一个重要的进步，因为它可以显著提高他们的效率和准确性。那么，Copilot X 到底将带来哪些改变呢？让我们来深...

AIGC 2023-11-30 人工智能

867阅读

【AI绘画】云服务器部署stable-diffusion-webui保姆级教程

1.背景之前给大家写过Mac苹果笔记本上部署stable-diffusion-webui的教程，知乎链接：【奶奶看了也不会】AI绘画 Mac安装stable-diffusion-webui绘制AI妹子保姆级教程但是安装过程就花了一天的时间，各种问...

生成式AI 2023-11-29 人工智能

1033阅读

本地部署_语音识别工具_Whisper

1 简介 Whisper 是 OpenAI 的语音识别系统（几乎是最先进），它是免费的开源模型，可供本地部署。 2 docker https://hub.docker.com/r/onerahmet/openai-whisper-asr-webs...

AIGC 2023-11-29 人工智能

1539阅读

Llama 2 来袭 - 在 Hugging Face 上玩转它

? 宝子们可以戳阅读原文查看文中所有的外部链接哟！引言今天，Meta 发布了 Llama 2，其包含了一系列最先进的开放大语言模型，我们很高兴能够将其全面集成入 Hugging Face，并全力支持其发布。Llama 2...

生成式AI 2023-11-29 人工智能

900阅读

ChatGPT的Prompts关键词提示工程集合：包含AI绘画和GPT文本对话

文章目录 1 前言 2 Awesome ChatGPT Prompts 2.1 文本提示词 2.2 提示词汇总 2.3 绘画提示词 3 PromptBase 4 Prompt-Engineering-Guide 5 讨论 1 前...

大数据 2023-11-29 人工智能

879阅读