-
【小沐学AI】Python实现语音识别(faster-whisper)
文章目录 1、简介 1.1 CTranslate2 1.2 Intel MKL 1.3 cuDNN 1.4 Transformer 2、下载和安装 2.1 命令行 2.2 代码 3、模型下载 3.1 在线测试 3.1.1 tiny...
-
【机器学习】FFmpeg+Whisper:二阶段法视频理解(video-to-text)大模型实战
目录 一、引言 二、FFmpeg工具介绍 2.1 什么是FFmpeg 2.2 FFmpeg核心原理 2.3 FFmpeg使用示例 三、FFmpeg+Whisper二阶段法视频理解实战 3.1 FFmpeg安装 3.2 Whisper模型下载...
-
掌握Midjourney视觉艺术的关键提示词指南
在数字艺术的海洋中,Midjourney以其独特的图像生成能力脱颖而出,为艺术家和创意工作者提供了前所未有的创造自由。要真正掌握这一工具,理解并有效使用各种提示词至关重要。本文将深入探索Midjourney中的“风格关键词”、“场景关键词”、“视觉关键词”...
-
Stable Diffusion 3上线:登顶最强开源AI绘画模型,笔电手机都能跑丨大量实测
万众瞩目的Stable Diffusion 3终于正式开源了! 目前开源的是20亿参数的版本,据悉之后还会开源40亿和80亿的“大杯”与“超大杯”。 最近母公司Stability AI的坏消息连连,据传账面现金都不够支付算力服务器的租赁费。 欠债一亿...
-
Stable Diffusion涂鸦生建筑效果图教程
一、演示内容: 1、SD的photopea插件涂鸦发送之controlnet, 2、用scribble+shuffle预处理, 3、zaha的lora, 4、提示词描述 所有的AI设计工具,模型和插件,都已经整理好了,文末扫码即可免费获取噢~...
-
AI绘画人物(头像)设计提示词大全
1、 年龄性别 age sex 中文 英文 中文 英文 幼年,男 Childhood, male 少年,女 Adolescence, female 幼年,女 Childhood, female 青年,男 Youth, male 少年,男...
-
Whisper.cpp 0基础搭建音频文件转文字(Windows下C++)
介绍 whisper.cpp是一个开源项目,它是对OpenAI的Whisper模型的C/C++移植实现。 OpenAI的Whisper是一个自动语音识别(ASR)系统,经过大量多语言和多任务的监督数据训练,能够进行多语言语音识别、语音翻译和语言识别等任...
-
在阿里云上用LLaMA-Factory微调大模型
相信很多小伙伴都想自己手搓大模型,所以有大佬做了LLaMA-Factory,但是有工具还不行,还得有环境,说实话,我现在每天除了上班就是带孩子,连游戏都没得打,所以自己连个有GPU的电脑都没[苦笑]。 基于以上前提条件,唯一方法只得通过云服务来帮我们微调...
-
vscode激活GitHub Copilot报错,登录不了github
Timed out waiting for authentication provider to register 是github身份验证被禁用了 打开文件-->首选项-->配置文件(默认)--显示配置内容 启用之后重新登录就...
-
AET生态新纪元:数字人AIGC平台发布会在香港成功举办
香港,3月28日——在人工智能技术与数字经济迅速发展的今天,AET生态系统迎来了历史性的一刻,成功举办了AET数字人AIGC平台的发布会。这一重要事件不仅吸引了来自科技、金融、教育等多个领域的精英人士,更展示了AET对推动全球数字经济发展的坚定承诺和远见。...
-
stable diffusion超详细局部重绘教程!
【小新课堂:什么是蒙版?】 *蒙版:重绘区域,相当于蒙在原图上的一张新画纸。 在SD中,与蒙版有关的参数主要有: ①蒙版(边缘)模糊:设置重绘区域和原图的融合程度,类似PS中的选区羽化,数值较小,边缘越锐利,数值一般默认即可 【图像较大的话,也...
-
android集成百度文心一言实现对话功能,实战项目讲解,人人都能拥有一款ai应用
大家好,今天给大家讲解下如何实现一个基于百度文心一言的app功能,app内部同时集成了讯飞的语音识别。本文适用于有android基础的小伙伴阅读,文章末尾放上本项目用到的全部实例代码,在使用前请务必看完本文章。 先来给大家看看效果。 百度文心一...
-
【AIGC】基于大模型+知识库的Code Review实践
目录 一、背景描述 二、技术原理 三、基于大模型与知识库的Code Review实践 1、选择合适的大模型与知识库 2、集成大模型与知识库到Code Review流程 3、结合人工审查 4、持续优化与改进 四、技术细节 1、gitlab配...
-
掌握 GitHub Copilot:6个代码自动补全的必备技巧前言
GitHub Copilot 是一款由人工智能驱动的编码助手,它能够根据上下文提供代码建议,极大地加快了开发过程。在之前介绍如何激活 Copilot 的文章之后,本文将深入探讨六个关键技巧,以高效利用 GitHub Copilot。 1. 快捷键使用...
-
AI厂商拿Robots协议当草纸,互联网秩序“礼乐崩坏”
就在一众AI大模型厂商还在为盈利发愁时,英伟达靠卖算力已成功登顶全球市值第一公司的宝座,再次证明了当淘金热汹涌时候、只有卖铁铲的最赚钱。但训练大模型不仅要算力、还要有数据,以至于Reddit、X等内容平台纷纷做起了数据买卖这个生意。只不过,如今这个生意也越...
-
Llama3-Tutorial(Llama 3 超级课堂) 学习笔记
课程资料 五一 Llama 3 超级课堂 | 第二节 Llama 3 微调个人小助手认知(XTuner版)_哔哩哔哩_bilibili SmartFlowAI/Llama3-Tutorial: Llama3-Tutorial(XT...
-
每日AIGC最新进展(20):基于树的长视频理解VideoTree、IBM研究院提出AI生成图片生成检测、蚂蚁集团提出AI生成视频检测工具、CMU提出大型视频-语言模型
Diffusion Models专栏文章汇总:入门与实战 VideoTree: Adaptive Tree-based Video Representation for LLM Reasoning on Long Videos 本文介绍了一种名...
-
Figma也开始卷AI了,设计师又要完蛋了?
作为一个曾经干了快10年的老设计狗,现在听到最多的就是: 设计师要完蛋啦~ 今天是视觉完蛋了,明天是原画完蛋了,后天是平面完蛋了。 反正听那意思,管你是个啥,但凡粘个设计两字,在AI时代,那你就都得完蛋。 不过在这反反复复听了一年多的完蛋的历史中,啥设计分...
-
百度文心一言 java 支持流式输出,Springboot+ sse的demo
参考:GitHub - mmciel/wenxin-api-java: 百度文心一言Java库,支持问答和对话,支持流式输出和同步输出。提供SpringBoot调用样例。提供拓展能力。 1、依赖 <dependency> <group...
-
让AI听话的一种办法(Stable Diffusion进阶篇:SVD 3)
动态内容在上一篇笔记里学会了参数以及文生图生视频的操作,可能还是会有小伙伴觉得进行一些参数的改动或者就目前的产出结果还不到自己的预期。 例如像是动作幅度太小,眼睛不够有神等,而也是SVD的一个缺点,它所产出的动态内容某种程度上是不可控的。 就现阶段...
-
这可能是最强AI文生图工具:Stable Diffusion 3 超详细测试
最近文生图领域最重要的消息,就是Stable Diffusion 3的推出。 目前,有两种使用Stable Diffusion 3的方法,一种是通过API调用,这需要在Stability AI开发者平台申请API Keys: Stability AI开...
-
stable-diffusion-webui出现NansException: A tensor with all NaNs was produced in Unet
环境:秋叶大佬的stable-diffusion-webui启动器 操作系统:windows11 问题描述,当我更新了webui的版本以及更新了一些插件后跑xl或者批量处理图生图时出现如下错误: NansException: A tensor with...
-
【CS.AI】AI引领编程新时代:深度探索GitHub Copilot
文章目录 引言 0. TOP TAKEAWAYS 重要要点 1. Copilot的基本功能 2. 技术原理 3. 优势与局限 优势 局限 4. 使用体验 4.1 初次使用 4.2 在 JetBrains 全家桶中使用 GitHub C...
-
Stable Diffusion 3: Research Paper
Stable Diffusion 3: Research Paper 1. 核心理念 扩展模型 (Stable Diffusion 在與 DALL·E 3、Midjourney v6 和 Ideogram v1这些图像生成系统相比,在书写效果以及...
-
Midjourney如何集成到自己(个人/企业)的平台(三-完结)
前两篇文章写如何注册和配置 Midjourney如何集成到自己(个人/企业 的平台(一) Midjourney如何集成到自己(个人/企业 的平台(二) 这篇文章是完结篇,也是代码篇,本文章内容描述开发语言为Java,使用框架为SpringBoot,废...
-
GitHub Copilot 登录账号激活,已经在IntellJ IDEA使用
GitHub Copilot 想必大家都是熟悉的,一款AI代码辅助神器,相信对编程界的诸位并不陌生。 今日特此分享一项便捷的工具,助您轻松激活GitHub Copilot,尽享智能编码之便利! GitHub Copilot 是由 GitHub 和 Op...
-
Apache Flink类型及序列化研读&生产应用|得物技术
一、背景 序列化是指将数据从内存中的对象序列化为字节流,以便在网络中传输或持久化存储。序列化在Apache Flink中非常重要,因为它涉及到数据传输和状态管理等关键部分。Apache Flink以其独特的方式来处理数据类型以及序列化,这种方式包括它自身...
-
[Stable Diffusion/LDM] High-Resolution Image Synthesis with Latent Diffusion Models
这篇讲解很详细,可以参考:https://zhuanlan.zhihu.com/p/634573765 附上苏神的讲解:生成扩散模型漫谈(二十二):信噪比与大图生成(上) - 科学空间|Scientific Spaces...
-
AIGC专栏11——EasyAnimateV2结构详解与Lora训练 最大支持768x768 144帧视频生成
AIGC专栏11——EasyAnimateV2结构详解与Lora训练 最大支持768x768 144帧视频生成 学习前言 源码下载地址 EasyAnimate V2简介 技术储备 Diffusion Transformer (DiT Mo...
-
llama factory 是如何加载数据集 通过对数据集加载的代码的理解编写自定义数据集训练代码
第一层从训练代码追踪到以下代码 def get_dataset( tokenizer: "PreTrainedTokenizer", model_args: "ModelArguments", data_args: "DataAr...
-
增强大型语言模型(LLM)可访问性:深入探究在单块AMD GPU上通过QLoRA微调Llama 2的过程
Enhancing LLM Accessibility: A Deep Dive into QLoRA Through Fine-tuning Llama 2 on a single AMD GPU — ROCm Blogs 基于之前的博客《使用Lo...
-
Midjourney保姆级注册教程
先看一下Midjourney社区图库中展示的作品。 可以看到不管是设计质量还是设计风格的多样性,AI绘画作品都让人惊叹。 而这些高质量的作品输出,你只要掌握一些关键词的描述方法,就能做到不错的AIGC绘画输出了。 接下来,我们开始Midj...
-
深入浅出解析Stable Diffusion中U-Net的核心知识与价值 | 【算法兵器谱】
Rocky Ding 公众号:WeThinkIn 写在前面 【算法兵器谱】栏目专注分享AI行业中的前沿/经典/必备的模型&论文,并对具备划时代意义的模型&论文进行全方位系统的解析...
-
AI写代码! 神器copilot在线安装(IDEA)
!!!正在学编程、算法的请千万不要依赖此插件,否则你可能甚至无法手写出一个for循环 GitHub Copilot 插件对IDEA最低版本要求是2021.2,建议直接用2023.3,一次到位反正后续要升级的。 打开 IntelliJ IDEA扩展商店,...
-
LlamaFactory-Ollama-Langchain大模型训练-部署一条龙
前言 近些日子,大模型火的一塌糊涂,那么现在就有义务要学习一套好用的、从 dataset --> train --> deploy 的一整套流程,好拿来装逼。话不多说,进入正题 Train 框架 目前好用的框架太多,如BELLE, C...
-
挑战Midjourney,融合近百个SD大模型的通用模型AlbedoBase XL
在SDXL的通用模型中,DreamShaperXL和juggernautXL这2款大模型一直都深受广大AI绘画者的喜爱,不可否认,这2款通用模型在很多方面表现都相当出色。 今天再给大家介绍一款基于SDXL的通用大模型:AlbedoBase XL,作者的目...
-
【进阶篇】Midjourney如何最大限度精准控图,做到收放自如?
和朋友们一起玩MJ也已经快两个月了,从一开始的惊喜,到现在的平淡,大家都开始思考这个到底我们应该怎么用?而不是仅仅是为了满足自己对MJ本身的好奇心,以及生出一张美图时的那种喜悦感。 目前大家最多的疑问就是,怎样更精准的控制图片输出,然后又怎样让图片更富有...
-
AI日报:腾讯发布新视频神器MOFA-Video;直播卖货大模型Streamer-Sales来了;机器人Alter3会自拍了
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、腾讯开源了新视频控制方式 MO...
-
AI绘画Stable Diffusion【真人模型】:SD1.5人像模型新高度,超级逼真的AI真人模型
大家好,我是程序员晓晓 今天和大家分享一个基于SD1.5基础模型训练的人像大模型AWPortrait。该模型在真人写实摄影方面效果超级逼真,能够模拟在真实摄影中的光影效果、皮肤纹理质感、甚至是人物的表情和妆容。 目前最新的版本是V1.4,在V1.3版本...
-
Stable Diffusion提示词篇
【视觉描述】 正面面对 straight - on 侧边视角 from side 高位视角 from above 背后视角 from behind 背后焦点 back focus 低位视角 from below 侧下 from the Side below...
-
用AI制作历史解说视频:GPT + MidJourney + PiKa + FunSound + 剪映
1. 项目介绍 最近某站看到一个看到利用AI创作视频解说,成品画面很酷炫。对此以初学者视角进行复现,创意来源:用AI制作历史解说视频 2. 开始创作 我们参照原作者展示的内容,对古代人物屈原来生成解说视频。 2.1 故事脚本+分镜 【由GP...
-
如何让Stable Diffusion在不同场景保持人物形象的一致性
我们知道Stable Diffusion生成图像的随机性导致很难控制生成同样的人物形象或动作。这种问题会出现在绘本创作,小说配图等场景中,因为在这些场景,人物的衣着打扮、人物动作、表情都不一样,但是要求始终是同一个人。这个基本要求很重要,如果你仔细看过 幼...
-
Midjourney-功能汇总**
出图 1. 出图的三种方式 1.1 纯文本提示词 1.2 垫图出图 2. 如何批量下载所出的图 3. /setting 设置 3.1 MJ版本出图(v1-v6) 3.2 Raw 照片写实 3.3 Stylize 画面艺术程度 --s {0...
-
养猪大户必备!教你用ModelBox开发一个AI数猪应用
本文分享自华为云社区《ModelBox-视频应用开发:AI智能数猪【玩转华为云】》,作者: 阳光大猫。 一、准备环境 ModelBox端云协同AI开发套件(Windows)环境准备【ModelArts+ModelBox 端云协同AI应用开发实训课程...
-
【AI知识】Stable diffusion常用提示词分享
模型(Model) majicmixRealistic_v7 majicmixRealistic(麦橘写实)是融合了多种展现日常生活人物形象的写实风格模型,人物的外观更加接近现实生活,对于光影、皮肤、人物动态均有较好的表现,非常适合出美女图片。 L...
-
llama.cpp 编译安装@Ubuntu
在Kylin 和Ubuntu编译llama.cpp ,具体参考:llama模型c语言推理@FreeBSD-CSDN博客 下载代码并编译: git clone https://github.com/ggerganov/llama.cpp cd llama...
-
建筑类AIGC图像微调模型(LoRA)训练经验介绍
前言 AIGC大模型正广泛应用于各行业,包括建筑设计。运用这些大模型,设计师可以在设计早期阶段进行方案探索和优化,提高设计效率和满足实际需求。然而,要充分发挥大模型的优势,需要进行微调以适应特定设计任务。这是一项技术挑战,也是创新机会。 AIGC大...
-
GitHub Copilot 支持 IntelliJ IDEA啦,插件装起来!
别以为TJ君说的是天方夜谭,就在前不久的 GitHub Universe 2021开发者大会上,GitHub官方正式宣布了一款名为 Copilot工具的更新。 说起Copilot这个名字,相信一直关注GitHub的小伙伴马上脑海中会浮现出今年早些时候看到...
-
Stable Diffusion文生图-图生图-ControINet插件-线稿上色-生产全套表情包-3D Openpose-局部重绘-换衣服,换姿势人设三视图一键生成教程大全
Stable Diffusion 一、**文生图入门与提示词基础** 采样工具介绍 1.提示词权重语法 2.负面提示词 3.参数设置 二、提示词六要素 1685612692298.png 三、通用反向提示词 四、随机种子使用示例 获取随机...
-
使用llama.cpp实现LLM大模型的格式转换、量化、推理、部署
使用llama.cpp实现LLM大模型的格式转换、量化、推理、部署 概述 llama.cpp的主要目标是能够在各种硬件上实现LLM推理,只需最少的设置,并提供最先进的性能。提供1.5位、2位、3位、4位、5位、6位和8位整数量化,以加快推理速...