-
神经网络实用工具(整活)系列---使用OpenAI的翻译模型whisper实现语音(中、日、英等等)转中字,从此生肉变熟肉---基础篇
最近在做神经网络的研究,偶然间看到OpenAI开源出了一个多国语音转文字的模型,脑海里突然想到余大嘴在华为发布会发布实时语音翻译时满屏弹幕的“???”和“!!!”,于是决定做一个多国语音转简体中文字幕的软件来玩一玩。 想法是这样的:通过OpenAI最新发...
-
[深度学习]stable-diffusion-webui部署后局域网无法访问
当你把stable-diffusion-webui环境安装好后,启动python webui.py后发现,局域网里面是不能访问这个网页的,为了解决这个问题翻阅资料发现解决起来很简单。我们去 stable-diffusion-webui/modules/s...
-
TS版LangChain实战:基于文档的增强检索(RAG) | 京东云技术团队
LangChain LangChain是一个以 LLM (大语言模型)模型为核心的开发框架,LangChain的主要特性: 可以连接多种数据源,比如网页链接、本地PDF文件、向量数据库等 允许语言模型与其环境交互 封装了Model I/O(输...
-
stable diffusion安装问题求教!
最后的webui-user.bat执行的过程真的是痛苦而漫长,网上什么破教程,问题一个接一个,解决一个就跳出另一个! 现在卡在这里了! 求教!如何解决。 Traceback (most recent call last : File "D:\SD...
-
Llama 及 中文Alpaca模型部署测试
环境: Xeon E5-2680v4 16C 40G RAM WinServer 2019 Standard Edition Python 3.10 依赖库: accelerate==0.18.0 anyio==3.5.0 argon2-c...
-
(三)SadTalker 让stable diffusion 人物可以说话
功能说明 github 项目SadTalker 可以根据一张图片、一段音频,合成面部说这段语音的视频。图片需要真人或者接近真人。目前项目已经支持stable diffusion webui,可以SD出图后,结合一段音频合成面部说话的视频(抖音常见的数字...
-
视频生成: 基于Stable Diffusion的微调方法
chatGPT带来了几个月的AIGC热度,文本图像生成模型大行其道,但AI在视频生成任务上尚没有较好的开源仓库,并受限于“缺那么几百块A100"的资源问题,大多数人无法展开视频生成的研究。好在目前有不少针对视频生成的相关paper,也有不少开源实现...
-
AIGC 文生图及 stable diffusion webui 练习笔记
文章目录 环境要求 一. stable-diffusion-webui 安装 windows/linux 安装 docker 容器内安装 二. 运行 web-ui 插件安装 civitai helper additional netwo...
-
Vue3+NodeJS 接入文心一言, 发布一个 VSCode 大模型问答插件
目录 一:首先明确插件开发方式 二:新建一个Vscode 插件项目 1. 官网教程地址 2. 一步一步来创建 3. 分析目录结构以及运行插件 三:新建一个Vue3 项目,在侧边栏中展示,实现vscode插件 <=> vue项目 双向...
-
使用QLoRA对Llama 2进行微调的详细笔记
使用QLoRA对Llama 2进行微调是我们常用的一个方法,但是在微调时会遇到各种各样的问题,所以在本文中,将尝试以详细注释的方式给出一些常见问题的答案。这些问题是特定于代码的,大多数注释都是针对所涉及的开源库以及所使用的方法和类的问题。 导入库...
-
要点初见:Stable Diffusion NovelAI模型优质文字Tag汇总与实践【魔咒汇总】
目前贴吧、B站上有大量Stable Diffusion的模型资源、TAG、TAG生成器分享,其中居然有不少试图靠信息差把这些开源资源卖钱的。加上目前网上相关的TAG整理贴极少,不少TAG也是以图片的形式存在,故博主打算在此专门整理一下网友们实践过的成套的“...
-
stable-diffusion-webui 本地部署git报错问题解决
项目场景: 运行时python launch.py --autolaunch 产生Error code:1 问题描述 由于git安全机制问题,导致项目读取不到相应的stable-diffusion-stability-ai等插件。 Runt...
-
stable diffusion error code:128 stdout:HEAD解决方案
错误 Python 3.10.10 (main, Mar 21 2023, 18:45:11 [GCC 11.2.0] Commit hash: Traceback (most recent call last : File “/home/xxxx...
-
星火大模型AI接口Spring中项目中使用【星火、AIGC】
星火大模型AI接口使用 讯飞的星火大模型是有免费版本赠送200万个Token,就个人学习来说完全够用了。 免费申请过后,到控制台,两个红色方框是最要紧的。 星火认知大模型Web文档 | 讯飞开放平台文档中心 (xfyun.cn 这是官方文档...
-
Amazon CodeWhisperer——省心、省力、省时的AI编程助手
前言 本篇文章致力于让更多的程序员们在生产实践中能节约更多的宝贵时间,更快、更安全地构建应用程序而发布。Amazon CodeWhisperer它提供了智能提示、代码自动补全和错误检测等功能,以支持开发人员的编码工作。在这里勇哥我特意的推荐给大家,让大家...
-
基于 huggingface diffuser 库本地部署 Stable diffusion
前言 Stable Diffusion 是用 LAION-5B 的子集(图像大小为512*512)训练的扩散模型。此模型冻结 CLIP 的 ViT-L/14 文本编码器建模 prompt text。模型包含 860M UNet 和123M 文本编码器,...
-
计算机视觉中目标检测的数据预处理
本文涵盖了在解决计算机视觉中的目标检测问题时,对图像数据执行的预处理步骤。 首先,让我们从计算机视觉中为目标检测选择正确的数据开始。在选择计算机视觉中的目标检测最佳图像时,您需要选择那些在训练强大且准确的模型方面提供最大价值的图像。在选择最佳图像时,考...
-
PyTorch团队重写「分割一切」模型,比原始实现快八倍
从年初到现在,生成式 AI 发展迅猛。但很多时候,我们又不得不面临一个难题:如何加快生成式 AI 的训练、推理等,尤其是在使用 PyTorch 的情况下。 本文 PyTorch 团队的研究者为我们提供了一个解决方案。文章重点介绍了如何使用纯原生 PyTo...
-
AI绘画stable-diffusion-webui指定GPU运行
在cmd_args.py文件中,进行运行参数的设定,其中可以指定gpu信息 import argparse import os from modules.paths_internal import models_path, script_path, da...
-
【文心一言 vs. 通义千文】一言对千问:自百度之后,阿里终于还是出手了——通义千问
通义千问 : https://tongyi.aliyun.com/通义千问https://tongyi.aliyun.com/ 目录 通义千问 : 达摩院 GPT-30B 模型复现 GPT-3 模型介绍 GPT3中文30B参数量文本生...
-
用检索增强生成让大模型更强大,这里有个手把手的Python实现
本文首先将关注 RAG 的概念和理论。然后将展示可以如何使用用于编排(orchestration)的 LangChain、OpenAI 语言模型和 Weaviate 向量数据库来实现一个简单的 RAG。 检索增强生成是什么? 检索增强生成(RAG)这一...
-
处理stable-diffusion-webui本地部署过程中的commit hash <none>问题的一个方法
安装webui时一直卡在commit hash none RuntimeError: Couldn't determine Stable Diffusion's hash: 69ae4b35e0a0f6ee1af8bb9a5d0016ccb27e36dc...
-
只需3步,使用Stable Diffusion无限生产AI数字人视频
效果演示 先看效果,感兴趣的可以继续读下去。 没有找到可以上传视频的地方,大家打开这个网盘链接观看:https://www.aliyundrive.com/s/CRBm5NL3xAE 基本方法 搞一张照片,搞一段语音,合成照片和语音,同时让照片...
-
百度文心一言接入教程-Java版
原文链接 前言 前段时间由于种种原因我的AI BOT网站停运了数天,后来申请了百度的文心一言和阿里的通义千问开放接口,文心一言的接口很快就通过了,但是文心一言至今杳无音讯。文心一言通过审之后,很快将AI BOT的AI能力接入了文心一言,这里记录一下具...
-
ChatGPT + Stable Diffusion + 百度AI + MoviePy 实现文字生成视频,小说转视频,自媒体神器!(二)
ChatGPT + Stable Diffusion + 百度AI + MoviePy 实现文字生成视频,小说转视频,自媒体神器!(二 前言 最近大模型频出,但是对于我们普通人来说,如何使用这些AI工具来辅助我们的工作呢,或者参与进入我们的生活,就着...
-
java调用文心一言API的方法
话不多说,直接上干货: 一、首先去官网注册一个账号百度智能云-登录 (baidu.com ,注册完成后等待审核,审核后就可以去控制台操作啦! 二、根据官网介绍,由于文心一言属于收费产品(也有免费的,但功能限制),因此建议可以充值几块钱,足以做实验用了。...
-
CVPR 2023 | 去雨去噪去模糊,图像low-level任务,视觉AIGC系列
Learning A Sparse Transformer Network for Effective Image Deraining 基于Transformer的方法在图像去雨任务中取得了显著的性能,因为它们可以对重要的非局部信息进行建模,这对...
-
stable diffusion webui 安装部署(linux系统)
文中部署stable diffusion webui所使用的机器是腾讯云服务器linux系统,centos7 一 环境准备 在这里使用anaconda安装,优势就是可以方便地安装和管理软件包,同一系统上可以同时使用不同版本的 Python 和第三方软件...
-
OpenAI 上线新功能力捧 RAG,开发者真的不需要向量数据库了?
近期, OpenAI 的开发者大会迅速成为各大媒体及开发者的热议焦点,有人甚至发出疑问“向量数据库是不是失宠了?” 这并非空穴来风。的确,OpenAI 在现场频频放出大招,宣布推出 GPT-4 Turbo 模型、全新 Assistants API 和一系...
-
Stable Diffusion本地部署报错解决:RuntimeError: Couldn‘t determine Stable Diffusion‘s hash: xxxxxxx
报错信息 Commit hash: c9c8485bc1e8720aba70f029d25cba1c4abf2b5c Traceback (most recent call last : File "D:\AI\stable-diffusion-w...
-
网络爬虫——GO
这里写目录标题 go-colly网络爬虫框架 goquery HTML解析 goquery主要的结构 怎么使用goquery 常用选择器 go-colly网络爬虫框架 go-colly是用Go实现的网络爬虫框架。go-coll...
-
微软AI研究提出AI模型HMD-NeMo:可基于部分手部动作准确生成全身动作
在混合现实场景中,生成准确和真实的全身虚拟角色动作一直是一个持久性的挑战。传统解决方案通常使用头戴式设备(HMDs),依赖有限的输入信号,如头部和手部的6自由度(DoF 。然而,最近的进展在从头部和手部信号生成全身动作方面取得了令人印象深刻的表现。然而,它...
-
NeRF与自动驾驶的前世今生,近10篇论文汇总!
神经辐射场(Neural Radiance Fields)自2020年被提出以来,相关论文数量呈指数增长,不但成为了三维重建的重要分支方向,也逐渐作为自动驾驶重要工具活跃在研究前沿。 NeRF这两年异军突起,主要因为它跳过了传统CV重建pipeline的...
-
关于AI 绘画,我给你总结了一份详细的关键词(Prompt 知识)
写在前面 随着人工智能技术的不断发展,越来越多的应用场景被发掘。其中,AI绘画是一种新兴的领域,其应用范围涵盖了数字媒体、游戏设计、动画制作、艺术创作等多个领域。在本文中,我们将介绍AI绘画的基本概念、发展历程、技术原理以及应用前景。 基本概念...
-
如何在VS Code中运用GitHub Copilot提高编程效率
本文首发于公众号:更AI (power_ai ,欢迎关注,编程、AI干货及时送! 在Visual Studio Code中开始使用GitHub Copilot GitHub Copilot是一个AI配对编程工具。这是一个花哨的说法,称它为"第二程...
-
无监督学习的集成方法:相似性矩阵的聚类
在机器学习中,术语Ensemble指的是并行组合多个模型,这个想法是利用群体的智慧,在给出的最终答案上形成更好的共识。 这种类型的方法已经在监督学习领域得到了广泛的研究和应用,特别是在分类问题上,像RandomForest这样非常成功的算法。通常应用一...
-
Whisper、React 和 Node 构建语音转文本 Web 应用程序
在本文中,我们将使用 OpenAI 的 Whisper 以及 React、Node.js 和 FFmpeg 构建一个语音转文本应用程序。该应用程序将获取用户输入,使用 OpenAI 的 Whisper API 将其合成为语音,并输出结果文本。Whisper...
-
测试离线音频转文本模型Whisper.net的基本用法
微信公众号“dotNET跨平台”中的文章《OpenAI的离线音频转文本模型Whisper的.NET封装项目》介绍了基于.net封装的开源语音辨识Whisper神经网络项目Whisper.net,其GitHub地址见参考文献2。本文基于Whisper.n...
-
M1芯片Mac book pro部署stable diffusion模型
使用的电脑配置: 本文中,我的实验环境是 Apple M1CPU 的 MacBook Pro,机器内存容量为 16GB。同样还能够运行本文的设备包含: 2022 年生产的MacBook Air (M2 、13寸的 MacBook Pro (M2 、M...
-
Java接入文心一言
文章目录 文心一言应用创建 接口对接 接口文档 代码示例 依赖 常量类 实体类 结束语 文心一言应用创建 首先需要先申请文心千帆大模型,申请地址:文心一言 (baidu.com ,点击加入体验,等通过审核之后就可以进入文心千帆...
-
UniPAD:通用自动驾驶预训练模式!各类感知任务都可支持
本文经自动驾驶之心公众号授权转载,转载请联系出处。 最近,新论文推陈出新的速度着实太快有点读不过来的感觉。可以看到的是,语言视觉多模态大模型融合已经是业界共识了,UniPad 这篇文章就比较有代表性,多模态的输入,类世界模型的预训练基座模型,同时又方便扩...
-
python爬虫从入门到精通
目录 一、正确认识Python爬虫 二、了解爬虫的本质 1. 熟悉Python编程 2. 了解HTML 3. 了解网络爬虫的基本原理 4. 学习使用Python爬虫库 三、了解非结构化数据的存储 1. 本地文件 2. 数据库 四、掌...
-
开启想象翅膀:轻松实现文本生成模型的创作应用,支持LLaMA、ChatGLM、UDA、GPT2、Seq2Seq、BART、T5、SongNet等模型,开箱即用
开启想象翅膀:轻松实现文本生成模型的创作应用,支持LLaMA、ChatGLM、UDA、GPT2、Seq2Seq、BART、T5、SongNet等模型,开箱即用 TextGen: Implementation of Text Generation...
-
ChatGPT开源平替(2)llama
最近,FacebookResearch 开源了他们最新的大语言模型 LLaMA,训练使用多达14,000 tokens 语料,包含不同大小参数量的模型 7B、13B 、30B、 65B,研究者可以根据自身算力配置进行选择。 ...
-
探索人工智能的世界:构建智能问答系统之环境篇
引言 在之前的一篇文章中,我们已经对项目所需的知识点进行了简单的了解。今天,我们将开始搭建整个项目的环境。在接下来的文章中,我们将详细介绍如何配置项目所需的各种工具和环境,以确保项目的顺利进行。 部署 接下来,你可能需要多次重启电脑来确保环境变量的生效。...
-
理论+实践详解最热的LLM应用框架LangChain
3.3 Chat 聊天模型是语言模型的一个变体,聊天模型以语言模型为基础,其内部使用语言模型,不再以文本字符串为输入和输出,而是将聊天信息列表为输入和输出,他们提供更加结构化的 API。通过聊天模型可以传递一个或多个消息。LangChain 目前支持四类...
-
MoE:LLM终身学习的可能性
性质 说明 知识记忆(knowledge retention) √ LLM预训练后,具备世界知识,小规模finetune不易对LLM造成遗忘灾难。但大规模数据续训会造成。 前向迁移(forward...
-
【LLM】Windows本地CPU部署民间版中文羊驼模型(Chinese-LLaMA-Alpaca)踩坑记录
目录 前言 准备工作 Git Python3.9 Cmake 下载模型 合并模型 部署模型 前言 想必有小伙伴也想跟我一样体验下部署大语言模型, 但碍于经济实力, 不过民间上出现了大量的量化模型, 我们平民也能体验体验啦~...
-
万万没想到,我用文心一言开发了一个儿童小玩具
最近关注到一年一度的百度世界大会今年将于10月17日在北京首钢园举办,本期大会的主题是“生成未来(PROMPT THE WORLD)”。会上,李彦宏会做主题为「手把手教你做AI原生应用」的演讲,比较期待 Robin 会怎么展示。据说,大会当天百度还会发布文...
-
使用JSoup+CSSPath采集和讯网人物信息
使用JSoup+CSSPath采集和讯网人物信息 代码见github 模型类: public class Person { private String name; //基本信息 private Map&l...