-
LLaMA-Factory 8卡4090 deepspeed zero3 微调Qwen14B-chat
环境安装 推荐使用docker,Ubuntu20.04https://www.modelscope.cn/docs/%E7%8E%AF%E5%A2%83%E5%AE%89%E8%A3%85 docker pull registry.cn-beijin...
-
MACBOOK PRO M2 MAX 安装Stable Diffusion及文生图实例
以前偶尔会使用Midjourney生成一些图片,现在使用的头像就是当时花钱在Midjourney上生成的。前段时间从某鱼上拍了一台性价比还不错的macbook,想着不如自己部署Stable Diffusion(以下简称SD)尝试一下。 网上有很多教程,但...
-
Stable diffusion(二)
SD colab安装 https://colab.research.google.com/github/TheLastBen/fast-stable-diffusion/blob/main/fast_stable_diffusion_AUTOMATIC...
-
集成使用 GitHub Copilot 提升 IDEA 开发效率
集成使用 GitHub Copilot 提升 IDEA 开发效率 在现代软件开发中,集成开发环境(IDE)如IntelliJ IDEA已经成为开发人员不可或缺的工具。它们提供了代码编辑、调试、版本控制等一系列功能,极大地提高了开发效率。而GitHub C...
-
Whisper实现语音识别转文本
#教程 主要参考开源免费离线语音识别神器whisper如何安装,OpenAI开源模型Whisper——音频转文字 Whisper是一个开源的自动语音识别系统,它在网络上收集了680,000小时的多语种和多任务监督数据进行训练,使得它可以将多种语言的音频...
-
发现 AI 宝藏:你不能错过的AI产品推荐
hi, 大家好, 我是徐小夕, 一名前端资深玩家. 今天暂时不分享前端技术, 带大家聊聊AI和AIGC产品。 这两年AI非常火, 国内也涌现出很多AI相关的产品. 作为一名非AI专业人才,怎么去做AI产品呢? 这个也是我一直探索的课题. 好在很多AI项...
-
图技术在 LLM 下的应用:知识图谱驱动的大语言模型 Llama Index
LLM 如火如荼地发展了大半年,各类大模型和相关框架也逐步成型,可被大家应用到业务实际中。在这个过程中,我们可能会遇到一类问题是:现有的哪些数据,如何更好地与 LLM 对接上。像是大家都在用的知识图谱,现在的图谱该如何借助大模型,发挥更大的价值呢? 在本...
-
史上AI绘画最全资料合集
stable-cascade 使用教程 MJ+SORA+副业教程(推荐) 米粒网 Magic Animate 地址: https://www.youtube.com/watch?v=RDH5lyurock SDXL Turbo...
-
问题排查太烦心,试试GPT的超能力
当你使用 Kubernetes 时,迟早会遇到集群中的问题,需要进行调试和修复,以便你的 Pod 和服务能够按预期运行。无论你是刚刚开始使用 Kubernetes 还是正在处理大规模且更复杂的环境,调试集群内进程并不总是那么简单,而且可能会成为一项耗时且...
-
运行StableDiffusionInpaintPipeline的Example时报错:OSError: Cannot load model runwayml/stable-diffusion-...
项目地址: https://huggingface.co/docs/diffusers/api/pipelines/stable_diffusion/inpainthttps://huggingface.co/docs/diffusers/api/pip...
-
Stable Diffusion ———LDM、SD 1.0, 1.5, 2.0、SDXL、SDXL-Turbo等版本之间关系现原理详解
一、简介 2021年5月,OpenAI发表了《扩散模型超越GANs》的文章,标志着扩散模型(Diffusion Models,DM)在图像生成领域开始超越传统的GAN模型,进一步推动了DM的应用。 然而,早期的DM直接作用于像素空间,这意味着要优化一...
-
探索Kubernetes与AI的结合:PyTorch训练任务在k8s上调度实践
概述 Kubernetes的核心优势在于其能够提供一个可扩展、灵活且高度可配置的平台,使得应用程序的部署、扩展和管理变得前所未有的简单。通用计算能力方面的应用已经相对成熟,云原生化的应用程序、数据库和其他服务可以轻松部署在Kubernetes环境中,实现...
-
GenAI在软件开发方面的早期回报
GenAI已经对IT的多个领域产生了影响,尤其是在软件开发领域。 早期用例包括代码生成和文档编制、测试用例生成和测试自动化,以及代码优化和重构等。 尽管如此,软件开发的GenAI仍处于初级阶段,因此技术领导者和软件团队可以预期在道路上会遇到颠簸,但早期...
-
【个人开发】llama2部署实践(三)——python部署llama服务(基于GPU加速)
1.python环境准备 注:llama-cpp-python安装一定要带上前面的参数安装,如果仅用pip install装,启动服务时并没将模型加载到GPU里面。 # CMAKE_ARGS="-DLLAMA_METAL=on" FORCE_CMAK...
-
webassembly002 whisper.wasm wasm_eval 与js代码交互 EMSCRIPTEN_BINDINGS,Module
# build using Emscripten git clone https://github.com/ggerganov/whisper.cpp cd whisper.cpp mkdir build-em && cd build-em...
-
首个AI软件工程师震撼硅谷!手握10块IOI金牌,他们铁了心砸掉程序员饭碗
一觉醒来,程序员怕是真要失业了。 首个AI软件工程师一亮相,直接引爆整个科技圈。只需一句指令,它可端到端地处理整个开发项目。 在SWE-bench基准测试中,它无需人类帮助,可解决13.86%的问题。 相比之下,GPT-4只能处理1.74%的问题,且都需...
-
3DGStream:快速训练,200 FPS实时渲染逼真场景!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 从多视角视频构建动态场景的照片逼真的自由视角视频(FVV)仍然是一项具有挑战性的工作。尽管当前的神经渲染技术取得了显著的进步,但这些方法通常需要完整的视频序列来进行离线训练,并且无法实时渲染。为了解决...
-
首个AI软件工程师震撼硅谷!手握十块IOI金牌,他们铁了心砸掉程序员饭碗
一觉醒来,程序员怕是真要失业了。 首个AI软件工程师一亮相,直接引爆整个科技圈。只需一句指令,它可端到端地处理整个开发项目。 在SWE-bench基准测试中,它无需人类帮助,可解决13.86%的问题。 相比之下,GPT-4只能处理1.74%的问题,且都...
-
安装秋葉aaaki大佬的Stable-Diffusion-WebUI(一)
Stable-Diffusion-webui安装配置 前言 一、准备工作 二、下载Stable Diffusion启动器 三、安装WebUI 四、启动WebUI启动器 前言 随着人工智能技术的飞速发展,文本到图像生成已经成为一...
-
LLM将成历史?开源bGPT或颠覆深度学习范式:直接模拟二进制,开启模拟数字世界新纪元!
微软亚洲研究院推出的最新成果bGPT,这种基于字节的Transformer模型,为我们探索数字世界开辟了新的大门。 与传统的基于词表的语言模型不同,bGPT的独特之处在于其对原始二进制数据的直接处理能力,不受特定格式或任务的限制,其目标是全面模拟数字世界...
-
颜水成/程明明新作!Sora核心组件DiT训练提速10倍,Masked Diffusion Transformer V2开源
DiT作为效果惊艳的Sora的核心技术之一,利用Difffusion Transfomer 将生成模型扩展到更大的模型规模,从而实现高质量的图像生成。 然而,更大的模型规模导致训练成本飙升。 为此,来自Sea AI Lab、南开大学、昆仑万维2050...
-
仅需格式转换提升9%数学推理能力,上交开源新对齐方法ReAlign
大模型对齐新方法,让数学推理能力直接提升9%。 上海交通大学生成式人工智能实验室(GAIR Lab)新成果ReAlign,现已开源。 随着以ChatGPT为代表的语言大模型的快速发展,研究人员意识到训练数据的质量才是大模型对齐的关键。 然而,目前主流的...
-
全球首个AI程序员诞生,码农饭碗一夜被砸!10块IOI金牌华人团队震撼打造,996写代码训练模型
全球首位AI软件工程师Devin诞生了,它掌握全栈技能,云端部署、底层代码、改bug、训练和微调AI模型都不在话下。最可怕的是,它完全不怕996,老黄的预言是彻底成真了! 就在刚刚,世界上第一位AI程序员Devin诞生。 一家叫Cognition的10人初...
-
【AI实战】从零开始搭建中文 LLaMA-33B 语言模型 Chinese-LLaMA-Alpaca-33B
【AI实战】从零开始搭建中文 LLaMA-33B 语言模型 Chinese-LLaMA-Alpaca-33B 简介 环境配置 环境搭建 依赖安装 代码及模型权重拉取 拉取 Chinese-LLaMA-Alpaca 拉取 llama-30b...
-
浙大&中科院让Agent学会自我进化,玩德州扑克心机尽显
基于大模型的Agent,已经成为了大型的博弈游戏的高级玩家,而且玩的还是德州扑克、21点这种非完美信息博弈。 来自浙江大学、中科院软件所等机构的研究人员提出了新的Agent进化策略,从而打造了一款会玩德州扑克的“狡猾”智能体Agent-Pro。 通过不断...
-
OpenAI官宣开源Transformer Debugger!不用写代码,人人可以破解LLM黑箱
AGI真的越来越近了! 为了确保人类不被AI杀死,在解密神经网络/Transfomer黑箱这一方面,OpenAI从未停下脚步。 去年5月,OpenAI团队发布了一个令人震惊的发现:GPT-4竟可以解释GPT-2的三十万神经元! 网友纷纷惊呼,智慧原来是这...
-
仅一行命令本地 CPU 环境快速上手 Google 开源大模型 Gemma
Google Gemma 是什么? 2月底 Google 发布的 Gemma 相比自家的 Gemini 更加轻量级,不仅可以在笔记本电脑上运行,而且还免费可商用,支持中文,相比其他开源在各个方面都占了上风。科技巨头出品、领先地位、全面对外开放、免费可商用...
-
构建本地运行的LLM语音助理
译者 | 朱先忠 审校 | 重楼 引言 我不得不承认,我最初对大型语言模型(LLM)生成实际有效的代码片段的能力持怀疑态度。我抱着最坏的打算尝试了一下,结果我感到很惊喜。就像与聊天机器人的任何互动一样,问题的格式很重要;但随着时间的推移,你会知道如何...
-
Midjourney
知数云 | 数字化服务的智慧之选 Midjourney Quick Start Guide Midjourney是一款AI制图工具,只要输入关键字,透过AI算法就能生成相对应的图片。 使用Spring接口与Midjourney官方API交互涉及几个步...
-
如何只用两个Python函数在几分钟内创建完整的计算机视觉应用程序
译者 | 李睿 审校 | 重楼 本文首先概述典型的计算机视觉应用程序的要求。然后,介绍Pipeless这一为嵌入式计算机视觉提供无服务器开发体验的开源框架。最后,提供一个详细的步骤指南,介绍如何创建和执行一个简单的对象检测应用程序,该应用程序只需采用几...
-
LimSim++:多模态大模型在自动驾驶中的新舞台
本文经自动驾驶之心公众号授权转载,转载请联系出处。 论文名称:LimSim++: A Closed-Loop Platform for Deploying Multimodal LLMs in Autonomous Driving 项目主页:https:...
-
Stable-diffusion复现笔记
一、引言 目前正在学习有关扩撒模型的相关知识,最近复现了Stable-diffuison,此文主要是想记录一下整体的复现过程以及我在复现过程中出现的一些奇怪的问题以及我的处理方法。这里我的复现主要是针对官网文档实现的,并没有用到webui版本,如果是想体...
-
PHP爬虫利器:Snoopy的详细解析与应用
在当今这个大数据和信息的时代,数据的抓取、分析与应用显得尤为重要。为了实现高效的数据抓取,许多程序员和语言社区开发了各式各样的爬虫工具和库。在PHP的世界里,Snoopy就是一个颇受欢迎的网络爬虫工具。它以其简单易用和灵活多变的特点,在众多PHP爬虫中脱颖...
-
自然语言编程系列(二):自然语言处理(NLP)、编程语言处理(PPL)和GitHub Copilot X
编程语言处理的核心是计算机如何理解和执行预定义的人工语言(编程语言),而自然语言处理则是研究如何使计算机理解并生成非正式、多样化的自然语言。GPT-4.0作为自然语言处理技术的最新迭代,其编程语言处理能力相较于前代模型有了显著提升。Copil...
-
用Vision Pro实时训练机器狗!MIT博士生开源项目火了
Vision Pro又现火爆新玩法,这回还和具身智能联动了~ 就像这样,MIT小哥利用Vision Pro的手部追踪功能,成功实现了对机器狗的实时控制。 不仅开门这样的动作能精准get: 也几乎没什么延时。 Demo一出,不仅网友们大赞鹅妹子嘤,各...
-
不依赖token,字节级模型来了!直接处理二进制数据
最新GPT,不预测token了。 微软亚研院等发布bGPT,仍旧基于Transformer,但是模型预测的是下一个字节(byte)。 通过直接处理原生二进制数据,bGPT将所有输入内容都视为字节序列,从而可以不受限于任何特定的格式或任务。 能预测CPU...
-
清华系2B模型杀出支持离线本地化部署,可以个人电脑或者手机上部署的多模态大模型,超越 Mistral-7B、LLaMA-13B
清华系2B模型杀出支持离线本地化部署,可以个人电脑或者手机上部署的多模态大模型,超越 Mistral-7B、LLaMA-13B。 2 月 1 日,面壁智能与清华大学自然语言处理实验室共同开源了系列端侧语言大模型 MiniCPM,主体语言模型 Mini...
-
不依赖Token,字节级模型来了!直接处理二进制数据
最新GPT,不预测token了。 微软亚研院等发布bGPT,仍旧基于Transformer,但是模型预测的是下一个字节(byte)。 通过直接处理原生二进制数据,bGPT将所有输入内容都视为字节序列,从而可以不受限于任何特定的格式或任务。 能预测CPU...
-
DALL·E 2 文生图模型实践指南
前言:本篇博客记录使用dalle2模型进行推断时借鉴的相关资料和DEBUG流程。 相关博客:超详细!DALL · E 文生图模型实践指南 目录 1. 环境搭建和预训练模型准备 环境搭建 预训练模型下载 2. 代码 3. B...
-
AIwechat-Vercel:无需服务器即可将AI功能集成到公众号中
AIwechat-Vercel是一款创新的微信公众号插件,它利用Vercel的Serverless Functions提供后端服务,使得用户无需自己管理服务器,只需一个可以绑定到Vercel的域名(无需备案),即可实现将AI功能集成到微信公众号中。 项目...
-
最新综述!扩散模型与图像编辑的爱恨情仇
本文经自动驾驶之心公众号授权转载,转载请联系出处。 针对图像编辑中的扩散模型,中科院联合Adobe和苹果公司的研究人员发布了一篇重磅综述。 全文长达26页,共1.5万余词,涵盖297篇文献,全面研究了图像编辑的各种前沿方法。 同时,作者还提出了全新的be...
-
本地开启stable diffusion web-ui体验AIGC文生图,图生图
目录 准备工作 主机电脑配置检查 安装以下软件 Python Git 下载stable-diffusion-webui仓库 根据显卡属性安装CUDA 2.下载stable diffusion的训练模型 启动 问题处理 模型加载问题...
-
4秒惊艳!Stable Cascade AI绘画神器,设计师和普通用户的无限创意新选择
近日,一款AI绘画模型Stable Cascade发布。 只需输入一段描述文字,即可在4秒钟内获得令人惊艳的图像。 无论你是设计师、艺术家,还是普通用户,都能轻松上手,释放无限创意。 Stable Cascade不仅在使用上极具便捷性,还拥有开放的源...
-
Stable Diffusion 插件AnimateDiff
AnimateDiff简介 该插件主要用来制作动图,并不能用来生成比较长的视频,我体验着和pika差不多,效果上照着商用还有不小的距离。在githup的网址中有论文地址和许多示例。 githup:GitHub - guoyww/AnimateDiff:...
-
AI绘画专栏之 终于来了!4步 webui使用Stableforge实现SVD文生视频
以前我们分享的SVD不管是文生视频还是长视频还是图生视频,都是在Comfyui中实现的,但是大多数的用户还是在webui中使用的,那么forge它来了,A111点赞的实现SVD的整合方式。 与原始 WebUI(用于 1024px 的 SDXL 推理)相比...
-
GPU部署AI绘画实践(腾讯云部署)
GPU部署AI绘画实践 背景 AI绘画模型(以StableDiffusion为首)自去年推出后快速迭代。近期,市面上又出现了一批效果惊艳的新突破。 本文将演示如何使用 GPU云服务器,快速部署 AI 绘画模型。从创建机器到完成部署...
-
【Docker】部署 copilot-gpt4-service,将 Github Copilot 转换为 GPT-4 模型进行对话。
引言 利用 copilot-gpt4-service 服务,将 Github Copilot 转换为 ChatGPT,将使得你可以通过 ChatGPT-Next-Web 或者其他第三方客户端,使用 Github Copilot 的 GPT-4 模型进行...
-
AI绘画与虚拟人生成实践(三):让虚拟形象动起来!照片生成说话的视频
书接上回,本篇的目的是结合上篇生成虚拟的女生形象,以及上一篇生成的关于介绍AI绘画领域的脚本,让生成的虚拟形象来念这段文案。先进入正题说明怎么来生成想要的动态视频。 1. Yanderify项目 Yanderify 教程 来实际手把手操作一下这个项...
-
Linux环境搭建Jenkins(详细图文)
目录 简介Jenkins 特点 一、环境准备 1.jdk环境准备 2.maven环境准备 3.git环境准备 二、安装部署Jenkins(采用war包方式) 1.下载Jenkins 2.启动war包 1)将下载好的Jenkins的w...
-
VSCode安装GitHub Copilot插件方法
VSCode安装GitHub Copilot插件的步骤及注意事项如下: 安装步骤: 确保系统要求: 确保你正在使用的Visual Studio Code版本是最新的,且支持GitHub Copilot。同时,Copilot需要你的操作系统是...