-
Stable diffusion环境部署搭建
1、安装Nvidia驱动、cuda版本等 略 2、安装anaconda环境 略 3、安装git #git工具的安装参考下面命令 apt-get update -y a pt-get upgrade -y apt install git 4、...
-
聊聊拉长LLaMA的一些经验
Sequence Length是指LLM能够处理的文本的最大长度,越长,自然越有优势: 更强的记忆性。更多轮的历史对话被拼接到对话中,减少出现遗忘现象 长文本场景下体验更佳。比如文档问答、小说续写等 当今开源LLM中的当红炸子鸡——LLaMA...
-
GitHub Copilot
介绍 GitHub Copilot 是人工智能编程助手,它可以帮助你编写程序。在你用visual studio或visual studio code等软件设计工具进行编程时,它可以直接给你整行或整个方法的代码提示,并且提供多种提示方案供你选择。...
-
(9.1更新弃用)AI绘画stable diffusion SDXL 1.0 refiner 插件
弃用说明:这可能是最短命的插件了,automatic1111的1.6版本中,已经作为原生集成部件支持了,所以不需要再独立安装了)。尽管已经有开源支持者对automatic1111提出过违反GPL协议的问题。但对于伸手党来说,还是很喜欢这种做法的。 之...
-
【Java干货教程】JSON,JSONObject,JSONArray类详解
一、定义 JSON:就是一种轻量级的数据交换格式,被广泛应用于WEB应用程序开发。JSON的简洁和清晰的层次结构,易于阅读和编写;同时也易于机器解析和生成,有效的提升网络传输效率;支持多种语言,很多流行的语言都对JSON格式有着很友好的支持。 JS...
-
MacOS系统(M1/M2)安装AI绘画StableDiffusion保姆级教程
@TOC 安装完成后,推荐阅读这篇教程:AI绘画:Stable Diffusion 终极炼丹宝典:从入门到精通 实操环境: macOS 13 Arm64(建议12以上的系统使用) Apple M1 先来看几个样例: AI绘画StableDiff...
-
whisper+剪映+chatgpt实现实时语音对话功能
whisper将录音文件转成文字---chatgpt回答---剪映tts将文字转成语言。 GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervisio...
-
github copilot X - chat 使用体验分享
文章目录 准备 测试 代码修改测试 贪吃蛇游戏生成测试 行内对话模式 使用总结 昨天一觉醒来发现等待了好久的基于GPT-4的copilot chat 终于通过了,在这里分享一下我的试用体验~ 准备 使用copilot ch...
-
安装stable diffusion报错
安装stable diffusion报错 总是报 RuntimeError: Couldn’t install gfpgan. 最终解决方案参照网络文章:https://zhuanlan.zhihu.com/p/608397859 设置了以下之后再重新运...
-
Github Copilot 的补强工具Github Copilot Labs的常用功能介绍
一、什么是Github Copilot Labs Github Copilot Labs是由GitHub推出的一款基于人工智能技术的代码协作工具,旨在协助开发者更加快速、高效地编写代码。该工具使用了机器学习技术,通过学习大量的开源代码和编写实践,提供了...
-
语音识别之百度语音试用和OpenAiGPT开源Whisper使用
0.前言: 本文作者亲自使用了百度云语音识别,腾讯云,java的SpeechRecognition语言识别包 和OpenAI近期免费开源的语言识别Whisper(真香警告 介绍了常见的语言识别实现原理 1.NLP 自然语言处理(人类语言处理 你好不同人...
-
LLM之RAG实战(七)| 使用llama_index实现多模态RAG
一、多模态RAG OpenAI开发日上最令人兴奋的发布之一是GPT-4V API(https://platform.openai.com/docs/guides/vision)的发布。GPT-4V是一个多模态模型,可以接收文本/图像,并可以...
-
Stable Diffusion进阶玩法说明
之前章节介绍了Stable Diffusion的入门,介绍了文生图的魅力,可以生成很多漂亮的照片,非常棒 传送门: Stable Diffusion新手村-我们一起完成AI绘画-CSDN博客 那我们今天就进一步讲讲这个Stable Dif...
-
在自定义数据集上微调Alpaca和LLaMA
本文将介绍使用LoRa在本地机器上微调Alpaca和LLaMA,我们将介绍在特定数据集上对Alpaca LoRa进行微调的整个过程,本文将涵盖数据处理、模型训练和使用流行的自然语言处理库(如Transformers和hugs Face 进行评估。此外还将介...
-
ubuntu16.04安装语音识别whisper及whisper-ctranslate2工具(填坑篇)
环境:系统ubuntu16.04,显卡是NVIDIA Quadro RTX5000 目标:安装语音识别工具whipser/whipser-ctranslate2 因之前有过几次在linux和windows上有过部署whisper经验和...
-
【异常错误】pycharm copilot 错误:detected dubious ownership in repository ****** is owned by: 修改后无显示
问题描述: 今天在github git的时候,突然出现了这种问题,下面的框出的部分一直显示: detected dubious ownership in repository at 'D:/Pycharm_workspace/SBDD/1/FL...
-
字节具身智能新成果:用大规模视频数据训练GR-1,复杂任务轻松应对
最近 GPT 模型在 NLP 领域取得了巨大成功。GPT 模型首先在大规模的数据上预训练,然后在特定的下游任务的数据上微调。大规模的预训练能够帮助模型学习可泛化的特征,进而让其轻松迁移到下游的任务上。 但相比自然语言数据,机器人数据是十分稀缺的。而且机器...
-
中科院和汪军团队发布 大模型玩星际争霸秀到起飞
面对星际争霸II这一巨大挑战,团队开发了TextStarCraftII——一个全新的交互环境。TextStarCraftII基于python-sc2框架,将游戏中的状态信息和动作空间映射到文本空间。宏观战略动作被转化为LLMAgent能够理解并执行的具体语...
-
AI作画工具 stable-diffusion-webui 本地部署 多种模型 可生成NSFW
最近,人工智能绘画非常受欢迎。在本文中,我使用了一台带有N卡的电脑,安装了stable-diffusion-webui前端并替换了默认的模型。这样就可以生成高质量的二次元图像,并且可以不受限制地生成图片(在线版通常会阻止NSFW内容的生成)。 所需资...
-
一份保姆级的Stable Diffusion部署教程,开启你的炼丹之路 | 京东云技术团队
市面上有很多可以被用于AI绘画的应用,例如DALL-E、Midjourney、NovelAI等,他们的大部分都依托云端服务器运行,一部分还需要支付会员费用来购买更多出图的额度。在2022年8月,一款叫做Stable Diffusion的应用,通过算法迭代将...
-
精调llama模型
github地址:https://github.com/facebookresearch/llama-recipes github:https://github.com/facebookresearch/llama import torch from t...
-
人工智能 | Llama大模型:与AI伙伴合二为一,共创趣味交流体验
Llama 大模型介绍 我们介绍 LLaMA,这是一个基础语言模型的集合,参数范围从 7B 到 65B。我们在数万亿个Token上训练我们的模型,并表明可以专门使用公开可用的数据集来训练最先进的模型,而无需诉诸专有的和无法访问的数据集。特别是,LL...
-
Copilot概述
人不走空 ?个人主页:人不走空 ?系列专栏:算法专题 ⏰诗词歌赋:斯是陋室,惟吾德馨 引言 在软件开发领域,提高编码效率一直是开发者们追求的目标。GitHub Copilot 作为一个代...
-
CVPR 2023 | 图像超分,结合扩散模型/GAN/部署优化,low-level任务,视觉AIGC系列
1、Activating More Pixels in Image Super-Resolution Transformer 基于Transformer的方法在低级别视觉任务中,如图像超分辨率,表现出了令人印象深刻的性能。Transformer的...
-
【AIGC】图片生成的原理与应用
前言 近两年 AI 发展非常迅速,其中的 AI 绘画也越来越火爆,AI 绘画在很多应用领域有巨大的潜力,AI 甚至能模仿各种著名艺术家的风格进行绘画。 目前比较有名商业化的 AI 绘画软件有 Midjourney、DALL·E2、以及百度出品...
-
VSCode GitHub Copilot could not connect to server. Extension activation failed: “connect ETIMEDOUT
VSCode GitHub Copilot could not connect to server. Extension activation failed: "connect ETIMEDOUT VSCode 打开设置, 搜索 proxy, 设置为你...
-
AI视野:Midjourney开始训练视频模型;文心一言用户破亿;优酷上线“AI搜片”功能;快手开源KwaiAgents系统
???AI新鲜事 Midjourney开始训练视频模型 Midjourney昨晚发布了重要消息,将开始视频模型训练,同时计划下周推出V6版本的重大更新。该更新将在文本处理方面有显著进步,提高内容连贯性和提示准确性。重点改进包括Inpainting功能和全新...
-
Stable Diffusion XL webui tagger 插件Linux安装(保姆级教程)
文章目录 Stable Diffusion XL webui tagger 插件Linux安装 为什么要安装tagger插件 安装tagger插件 下载tagger仓库 下载wd-v1-4-vit-tagger 模型权重 S...
-
在autodl算力云上部署Stable Diffusion
这里写自定义目录标题 如何在算力云上部署Stable Diffusion 零、基础环境 一、初始准备,用户权限的设置 1.创建非root管理员用户并改主目录为数据盘 2.删除lock锁 3.更改这两个目录权限 4.改python的用户权限...
-
数据闭环!DrivingGaussian:逼真环视数据,驾驶场景重建SOTA
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 北大王选计算机研究所的最新工作,提出了DrivingGaussian,一个高效、有效的动态自动驾驶场景框架。对于具有移动目标的复杂场景,首先使用增量静态3D高斯对整个...
-
llama.cpp LLM模型 windows cpu安装部署;运行LLaMA2模型测试
参考: https://www.listera.top/ji-xu-zhe-teng-xia-chinese-llama-alpaca/ https://blog.csdn.net/qq_38238956/article/details/130113599...
-
快手开源KwaiAgents系统 性能超越GPT-3.5
近日,快手联合哈尔滨工业大学成功开源了「KwaiAgents」系统,实现了7B/13B模型的超越效果。这一成果的背后,是通过Meta-Agent Tuning(MAT)方法提升大模型的通用能力。整个项目包含了系统、模型、以及评测三个方面的内容,并通过Git...
-
谷歌Bard更新:支持中文提问和语音朗读
ChatGPT不断更新功能,从GPT-3到3.5,再到GPT-4,甚至最新的plus版已经支持图像处理和图表生成,而谷歌Bard却自从推出后就一直很安静,没有什么大动作。眼见被ChatGPT、Claude甚至是文心一言抢去了风头,自然心有不甘。 7月13...
-
带你从零开始入门AI绘画神器Stable Diffusion
一、本地部署 Stable diffusion 1. 前言 目前市面上比较权威,并能用于工作中的 AI 绘画软件其实就两款。一个叫 Midjourney(简称 MJ),另一个叫 Stable-Diffusion(简称 SD)。MJ 需要付费使用,而 S...
-
【超详细】AIGC生成图片和视频
前沿 准备 接入 源代码 【前沿】 这两天突然看到一个niubility的项目,名叫:stability,这个网站就是大名鼎鼎的stability,网址是:stability.io,感兴趣的朋友可以去访问试试。 今天的主要目的是写一个对接这个项目的一...
-
微软推大模型整合性工具库PromptBench
微软最近推出了一个专门用于评估大语言模型的整合性工具库,名为PromptBench。该工具库提供了一系列工具,包括创建不同类型的提示、进行数据集和模型加载、执行对抗性提示攻击等,以支持研究人员从不同方面对LLMs进行评估和分析。 项目地址:https:/...
-
llama.cpp Mac版本llama
骆驼.cpp 路线图/宣言/ ggml 纯C/C++中LLaMA模型的推理 热点话题: 简单的网络聊天示例:#1998 k-quants 现在支持 64 的超级块大小 super-block size of 64::#2001 新...
-
快手Agents系统、模型、数据全部开源!
7B 大小的模型也能玩转 AI Agents 了?近期,快手开源了「KwaiAgents」,问它周末滑雪问题,它不但帮你找到场地,连当天的天气都帮你考虑周到了。 大家都知道大语言模型(LLM)通过对语言的建模而掌握了大量知识,并具备一定认知和推理能力。...
-
ai绘画,初级召唤师教程
前言 novel ai是最近以世界上最大的二次元D站为数据集训练出来的一个ai,所以生成二次元风格图的效果很不错,其他的就一般般了。 我自己生成的图例 声明: 以下内容仅代表个人观点 如存在一些问题请联系笔者 资源来源于互联网,仅供学习...
-
什么?NeRF还能提升BEV泛化性能!首个BEV跨域开源代码并首次完成Sim2Real!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人总结 鸟瞰图(Bird eye's view, BEV 检测是一种通过融合多个环视摄像头来进行检测的方法。目前算法大部分算法都是在相同数据集训练并且评测,这导致了这些算法过...
-
AI 舵手:Copilot 指南!
各位代码行者,握紧你的键盘,戴好你的眼镜,来一场与代码世界的超真实飞行吧!今天的副驾驶,是那个在开发者社区中爆红的飞行员——Copilot。让我们详细了解一下这位AI飞行员,以及如何让它成为你开发旅途中的得力助手。 Copilot,那不是飞机上的副驾驶吗...
-
在Linux(Centos7)上编译whisper.cpp的详细教程
whisper.cpp的简单介绍: Whisper 是 OpenAI 推出的一个自动语音识别(ASR)系统,whisper.cpp 则是 Whisper 模型的 C/C++ 移植。whisper.cpp 具有无依赖项、内存使用量低等特点,支持 Ma...
-
LLaMa、Qwen、ChatGLM、ChatGLM2的区别
LLaMa、Qwen、ChatGLM、ChatGLM2的区别 以下比较的前提是首先和BERT(transfomer 的对比 感谢帮忙给我github repository的star,更多最新模型长期更新:https://github.com/zysN...
-
全参数finetune Ziya-LLaMA-13B相关模型,目前支持数据并行+张量并行+ZeRO
全参数Finetune 这个示例主要用于全参数finetune Ziya-LLaMA-13B相关模型,目前支持数据并行+张量并行+ZeRO step0 环境安装 git clone git@github.com:IDEA-CCNL/Fengshenb...
-
在 Apple Silicon Mac 上部署 StableDiffusion 的分步指南,释放 Apple Silicon 芯片及其神经引擎的全部潜力
任何使用AI模型生成图像的服务都在涌现。这些服务中的大多数都提供基于积分的定价系统,您可以在其中购买积分以用于服务,并且每项服务都有自己的每张图片积分等级。另一种选择是直接在您自己的机器上部署文本到图像模型,这样可以避免任何使用成本,除了操作机器的成本。事...
-
又是阿里,通义灵码免费平替GitHub Copilot
毫无疑问,人工智能已经在影响着我们日常生活的方方面面,同样的在软件开发领域,AI正在改变我们的开发方式。在软件开发领域,尽管有许多强大的AI编码工具,但国产,免费,使用门槛低,用起来顺手,效率又高的AI辅助编程工具并不多,国外的大多使用门槛高,需要科学上网...
-
国内AI大模型的封神榜&死亡笔记;奥特曼首次公开谈宫斗;我有PDF翻译秘诀, 8种!2023年中国AIGC产业全景报告;GitHub Copilot官方入门课 | ShowMeAI日报
?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦! ? Heygen 注销中国公司主体,探索出海新范式 https://www.heygen.com/ HeyGen 是什么? 简单来说,H...
-
打造「专属arXiv」!德国高校顶级视觉团队推出「论文定制化」推荐系统,免费开放
10毫秒生成一张图像,1分钟6000张图像,这是什么概念? 下图中,就可以深刻感受到AI的超能力。 图片 甚至,当你在二次元小姐姐图片生成的提示中,不断加入新的元素,各种风格的图片更迭也是瞬间闪过。 图片 如此惊人的图片实时生成速度,便是来自UC伯克利、...
-
AI绘画:快速上手stable diffusion
点击↑上方↑蓝色“编了个程”关注我~ 这是Yasin的第 89 篇原创文章 mj vs sd 最近随着Chat GPT的大火,AI绘画也火了起来。尤其是midjourney(以下简称mj),能够通过文本关键词生成AI图片,还能...
-
单张4090,1秒100张二次元小姐姐!UC伯克利等新模型霸榜Github,吞吐量提升近60倍
10毫秒生成一张图像,1分钟6000张图像,这是什么概念? 下图中,就可以深刻感受到AI的超能力。 甚至,当你在二次元小姐姐图片生成的提示中,不断加入新的元素,各种风格的图片更迭也是瞬间闪过。 如此惊人的图片实时生成速度,便是来自UC伯克利、日本筑波大学...