-
NVIDIA将发近年最重要科技财报!市场期待能否戳破AI泡沫论
快科技8月25日消息,美东时间8月28日,半导体巨头NVIDIA将公布其2025财年第二财季业绩,市场普遍预期这将是近年来科技界最重要的一份财报。 虽然多位分析师都给出了乐观预期,但不可否认的是,投资AI是场回报率难达预期的泡沫”疑虑仍难消解。 如果NVI...
-
关于Stable diffusion的各种模型,看这篇就可以了!
前言 这篇文章主要是帮大家梳理下Stable diffusion里面的各种模型,模型在Stable diffusion中占据着至关重要的地位,不仅决定了出图的风格,也决定了出图质量的好坏。 但在第一次接触SD的时候,我就被里面的模型搞到头大,不仅有多...
-
标题:微调Whisper模型,打造超高效语音识别利器!
标题:微调Whisper模型,打造超高效语音识别利器! Whisper-FinetuneFine-tune the Whisper speech recognition model to support training without timesta...
-
超精细CG杰作:8K壁纸级官方艺术插画,展现极致美丽与细节的汉服女孩
极致精美的数字艺术杰作:8K壁纸级别的官方插画,展现超高清细节与和谐统一的美感,女孩的精致面容与眼神在光影下熠熠生辉,汉服主题下的超高分辨率作品,文件巨大,细节丰富,令人惊叹。 正向提示词 bestquality,masterpiece,illust...
-
Cursor AI 与 GitHub C0pilot:哪个更适合程序员?
近年来,由 AI 驱动的编码助手在帮助开发者编写、审查或理解代码方面取得了巨大进展。在这个领域中,Cursor AI 和 GitHub C0pilt 是两个非常受欢迎的工具。选择哪一个更适合自己,取决于个人需求和偏好,因为这两款工具各有优缺点。本文将比较它...
-
Nvidia 和 Mistral AI 的超精确小语言模型适用于笔记本电脑和 PC
Nvidia 和 Mistral AI 发布了一款新型的小型语言模型,据称该模型在小体积下依然具有「最先进」的准确性。该模型名为 Mistral-NemMo-Minitron 8B,是 NeMo 12B 的迷你版本,参数量从 120 亿缩减到了 80 亿。...
-
最强终端部署的多模态MiniCPM-V模型部署分享(不看后悔)
MiniCPM-V模型是一个强大的端侧多模态大语言模型,专为高效的终端部署而设计。 目前该模型有MiniCPM-V 1.0、MiniCPM-V 2.0和MiniCPM-Llama3-V 2.5版本。 MiniCPM-V 1.0模型:该模型系列第一个版本...
-
卢伟冰:目前AI手机只是有AI功能 小米澎湃OS2.0才是真正的AI手机
快科技8月23日消息,AI手机成为当下热门题材,各大厂商都号称最新推出的智能手机带AI功能。 对于AI手机”,卢伟冰分享了自己的观点:到目前发布的号称AI手机的都是AI Feature手机,也就是用AI的技术做了一些AI功能。 在卢伟冰看来,真正的AI手机...
-
马斯克的 Grok AI 聊天机器人因惊人的深度伪造特朗普和泰勒·斯威夫特而迅速走红
埃隆·马斯克的 Grok AI 聊天机器人正在互联网上泛滥,生成了从唐纳德·特朗普到马斯克本人的「深度伪造」图像——生成的图片有的完全荒诞到极其令人不安等。 自上周发布以来,Grok 的用户不断生成假冒的特朗普图像,如抢劫便利店或驾驶飞机飞向双子塔的画面...
-
SD绘画 | 人脸修复插件ADetailer:拒绝脸崩,轻松解决多人故事场景脸部崩坏,Stable Diffusion 修脸大法教程
大家好,我是程序员晓晓 在使用AI绘画工具 Stable Diffusion 进行人像出图时,你是不是经常会遇到多人或单人的脸部崩坏情况。那今天就给大家分享一下,如何通过 ADetailer 这款SD插件,对人物的脸部进行修复。 首先我们构造一个多人的...
-
快速体验LoRA微调Llama3-8B模型以及海光DCU推理加速(曙光超算互联网平台国产异构加速卡)
序言 本文以 LLaMA-Factory 为例,在超算互联网平台SCNet上使用异构加速卡AI 显存64GB PCIE,对 Llama3-8B-Instruct 模型进行 LoRA 微调、合并和推理。 一、参考资料 github仓库代码:LLaM...
-
Stable Diffusion学习指南【ControlNet下篇】- 超全面控图类型&模型拆解
(注:文末扫码获取AI工具安装包和AI学习资料) 以下是正文部分 在上一篇里我已经为大家介绍了关于ControlNet的基本功能、安装和使用技巧,相信大家对这款神级插件已经有了基本认识,今天我会为大家更详细的介绍14种官方控图模型的差异和使用技巧,以及...
-
探索法律智能的新高度:Lawyer LLaMA 项目深度解析
探索法律智能的新高度:Lawyer LLaMA 项目深度解析 lawyer-llama中文法律LLaMA (LLaMA for Chinese legel domain 项目地址:https://gitcode.com/gh_mirrors/la/la...
-
Datawhale X 魔搭 AI夏令营 - AIGC方向(task01笔记)
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言 一、基础知识 二、实现步骤 1.克隆存储库: 2. 安装环境,然后重启kernel 3. 调整prompt 总结 前言 赛题介绍...
-
深度解析|AI绘画中SD1.5、SDXL、Checkpoint、Lora 的含义与原理
大家好,我是程序员晓晓 自接触AI绘画以来,我发现很多朋友对一些基础词汇理解地很模糊,然后在搭建ComfyUI 工作流或者使用SD WebUI进行出图时,只能知其然,不知其所以然的感觉,也不知搭选哪个模型,很多时候都是照猫画虎地模仿,很难受。而且,很多时...
-
Llama改进之——分组查询注意力
引言 今天介绍LLAMA2模型引入的关于注意力的改进——分组查询注意力(Grouped-query attention,GQA 1。 Transformer中的多头注意力在解码阶段来说是一个性能瓶颈。多查询注意力2通过共享单个key和value头,同...
-
WhisperX 安装与使用指南
WhisperX 安装与使用指南 whisperXm-bain/whisperX: 是一个用于实现语音识别和语音合成的 JavaScript 库。适合在需要进行语音识别和语音合成的网页中使用。特点是提供了一种简单、易用的 API,支持多种语音识别和语音...
-
AI写作,让创意飞起来:五款超实用AI写作工具推荐
在现实生活中,除了专业的文字工作者,各行各业都避免不了需要写一些东西,比如策划案、论文、公文、讲话稿、总结计划……等等。而随着科技的进步,数字化时代的深入发展,AI已经成为日常工作中必不可少的工具了,很多人都会借助AI来创作自己需要的文字稿。 自从GPT...
-
【AI绘画】分享个人 AI 绘画心得:Stable diffusion 入门引导教程
大家好,我是设计师子衿。 最近网络上已经有许多朋友都开始自己动手AI绘画,但是又不知道如何入手。在这里我稍微给大家引导入门。 一、AI绘图电脑配置 搞AI绘图,首先是要看自己的电脑配置,如果是配置太低的电脑就不建议玩AI绘图了。 Stable Di...
-
基础模型在亚马逊的BEDROCK测试
前 言 通过 Amazon Bedrock,开发者可以轻松使用多种最新领先基础模型(FM)进行构建。本实验中,您将了解和体验到在 Amazon Bedrock 中模型的基础使用方法,以便您快速构建强大安全的大语言模型(LLM)应用,其中包括:...
-
介绍 Whisper 模型
介绍 Whisper 模型 Whisper 是一个通用的语音识别模型。它在大规模多样化的音频数据集上进行训练,并且能够执行多任务处理,包括多语言语音识别、语音翻译和语言识别。 核心方法 Whisper 使用的是 Transformer 序列到序列...
-
AI日报:Captions推出AI视频API套件;国产人形机器人成养老新希望;百度已有18%搜索结果由AI生成
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、Captions公司发布AI视...
-
使用Python和Pillow创建照片马赛克应用
在这篇博客中,我们将探讨如何使用Python创建一个简单而有趣的桌面应用程序。我们的目标是构建一个应用,允许用户选择一张照片,然后在照片的右下角添加马赛克效果。这个项目将展示如何结合使用wxPython来创建图形用户界面(GUI 和Pillow库来处理图像...
-
「深度探索:AIGC——从文本到视觉的奇迹之旅」
文章目录 1. 探讨AIGC技术的发展现状和未来趋势 1.1 引言 1.1.1 定义AIGC 1.1.2 重要性与应用领域 1.1.3 文章目的 2. AIGC技术的发展历程 2.1 起源与早期阶段 2.2 技术突破 2.2.1 深...
-
Stable Diffusion | Gradio界面设计及webUI API调用
本文基于webUI API编写了类似于webUI的Gradio交互式界面,支持文生图/图生图(SD1.x,SD2.x,SDXL),Embedding,Lora,X/Y/Z Plot,ADetailer、ControlNet,超分放大(Extras),图片信...
-
OpenAI反对美国SB-1047法案,会杀死开源大模型!
OpenAI向美国加州参议员Scott Wiener写了一封反对SB1047法案的信。 SB1047是美国加州在今年2月7日拟定的一项针对开源大模型的法案,其中有非常多不合理的条款,例如,如果有人微调了Meta最新发布的Llama-3.1模型,去开发一些恶...
-
阿里开源语音大模型CosyVoice:3秒还原声音,从部署到克隆的完整指南
前言 很久之前就想给大家介绍声音克隆开源项目GPT-SoVITS ,但是看到视频教程过于复杂了,最近又出现了一个剪辑《人民的名义》的短视频非常搞笑。 我就找到了一款最新更加强大的声音克隆项目CosyVoice。CosyVoice 是阿里通义实验室在七...
-
Ebsynth Utility 最新出错解决方法,避坑、非整合包玩法安装教程
项目背景,最近BOSS让我追热点,做点AI相关的奥运视频热点。 打开了SD,插件什么的都齐备,但是一执行第一步就跳过,生成了文件夹,但是内容是空的。 前后折磨了快三天了,终于条理清晰的找到了病灶的根源。 谨以此文记录流程,以便日后自己再次需要,也...
-
Xinference安装及部署大模型
1. Xinference 介绍 Xorbits Inference (Xinference 是一个开源平台,用于简化各种 AI 模型的运行和集成。借助 Xinference,您可以使用任何开源 LLM、嵌入模型和多模态模型在云端或本地环境中运行推理...
-
华为昇腾Ascend系列 之 01 什么是昇腾芯片?AIGC浪潮已至,进一步推动对芯片和算力的需求,主流 GPGPU/ASIC 产品性能对比(Ascend 910、Ascend 910B)
什么是昇腾Ascend 910、Ascend 910B 昇腾 310 和 910 处理器为华为AI 算力领域核心产品,910 单卡 Int8 算力大致可达 0.6 P,最大功耗为 300W,已可对标国际主流 GPU。且昇腾计算产业在硬件方面坚持“硬件开...
-
Datawhale X 魔搭 AI夏令营 AIGC方向 Task02
参考教程:Docshttps://datawhaler.feishu.cn/wiki/KxI2wIeAJiRQWhkRt9dcqlNVnFR?from=from_copylink 精读baseline 代码整理 使用通义千问辅助理解baseline代...
-
开源模型应用落地-qwen2-7b-instruct-LoRA微调&模型合并-LLaMA-Factory-单机多卡-RTX 4090双卡(六)
一、前言 本篇文章将使用LLaMA-Factory去合并微调后的模型权重,通过阅读本文,您将能够更好地掌握这些关键技术,理解其中的关键技术要点,并应用于自己的项目中。 二、术语介绍 2.1. LoRA微调 LoRA (Low-Ra...
-
如何高效微调多模态Transformers模型:从入门到实践指南
多模态大模型(Multimodal Large Models)是能够处理多种类型数据(如文本、图像、音频等)的机器学习模型。transformers 是当前多模态大模型中的一种重要架构。 目录 Transformers简介 多模态Transforme...
-
Datawhale X 魔塔 AI夏令营 AIGC方向Task1
小白学习笔记,如有错误请各位大佬指正 一、跑通baseline教程 Datawhale 教程链接Datawhale 二、baseline代码分析 1.安装库 !pip install simple-aesthetics-predictor !p...
-
作者管理软件-纲要设计
声明:本软件还在持续开发周期,在示例演示过程所截取图片以及实际界面可能与最终成品存在差异,但业务功能和实现目标基本不会有太大变化,请结合最新应用程序来进行辅助写作。 主界面 板块设计: 1:【作品选择器】:可通过【开始】->【自定义过滤器】...
-
Whisper Burn 开源项目教程
Whisper Burn 开源项目教程 whisper-burnA Rust implementation of OpenAI's Whisper model using the burn framework项目地址:https://gitcode.c...
-
AI绘画工具有哪些你知道吗?推荐14款AI绘画软件
前言 AI绘画,也称为人工智能绘画或机器生成艺术,是指使用人工智能算法来创作视觉艺术作品的过程。 AI绘画软件是实现这一过程的工具,它们通常利用深度学习技术,分析大量的艺术作品来学习艺术风格和构图,来生成新的图像或模仿特定艺术家的风格。 一、...
-
【AI绘画】Midjourney前置指令/settings设置详解
文章目录 💯Midjourney前置指令/settings设置详解 💯Use the default model(AI绘画所使用的大模型) Midjourney Model(Midjourney 模型) Niji Model(Niji模型)...
-
防止内容被抓取训练AI:百度百科屏蔽谷歌/必应等搜索引擎
快科技8月22日消息,据报道,近日百度百科开始屏蔽谷歌和必应等大多数搜索引擎,预计是为了阻止这些搜索引擎和其他爬虫,未经授权抓取百度百科的内容用于训练AI。 百度百科的robots.txt文件显示,目前仅有百度搜索、搜狗搜索、中国搜索(Chinaso)、Y...
-
【Stable Diffusion】最强模型——Flux推荐和下载
前言 Flux是一个由黑森林实验室(Black Forest Lab)推出的模型,开发人员由Stable Diffusion前离职人员构成。做到了很多SD和MJ都做不到或者很难做到的事情。其特点主要如下: 参数规模大****:官方号称模型有12B...
-
码住这款图片处理神器!一键搞定图片尺寸修改,效率翻倍!
Hey,设计界的小伙伴们!你是否还在为不同平台的图片尺寸要求而烦恼?证件照、产品图、社交媒体配图...尺寸不一,手动修改简直让人头大。别急,今天我要分享一个超给力的免费工具—千鹿设计助手,让你的图片处理工作变得轻松又高效! 功能优势: 1. 一键批量改...
-
Datawhale Al夏令营 AIGC方向 task2
1、代码解读 1.1、安装 Data-Juicer 和 DiffSynth-Studio # 安装 Data-Juicer 和 DiffSynth-Studio !pip install simple-aesthetics-predictor # 安...
-
AIGC:开启智能创作新时代
一、AIGC 的兴起与发展 AIGC 的兴起与发展 AIGC 的兴起是多种因素共同作用的结果。从技术层面看,深度学习算法的不断优化,如 Transformer 架构的出现,使得模型能够处理更复杂的数据和任务,为 AIGC 的发展提供了强大的技术支撑。预...
-
Datawhale 魔搭 AI夏令营 第四期 AIGC方向 Tesk2 可图Kolors-LoRA模型进阶学习
AI生图的能力与局限 AI生图的原理 AI利用 深度学习技术来训练神经网络,训练过程中,神经网络会学习到真实图像中的纹理、结构、颜色等特征,并将这些特征应用于生成新的图像。从而生成具有高保真度的图像。训练后,通过输入关键提示词来让模型...
-
本地部署,Whisper: 开源语音识别模型
目录 简介 特点 应用 使用方法 总结 GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak SupervisionRobust Speech Reco...
-
Zed AI有哪些功能免费吗?人工智能代码生成怎么使用方法详细教程指南
Zed AI 是什么? Zed AI是一个集成到编程工作流中的插件,通过与大型语言模型(LLMs)的直接对话,增强了代码生成、转换和分析的能力。它提供了多种交互方式,包括助手面板、斜杠命令、内联助手和提示库,以提高开发效率。Zed AI还支持多种LLMs提...
-
一文搞定大模型备案
《生成式人工智能服务安全基本要求》背景 1.1.基本要求对应的流程和介绍 "生成式人工智能服务安全基本要求"是针对"生成式人工智能(大语言模型)上线备案"流程制定的标准,这一流程也被称作"大模型上线备案"。这是继"生成合成(深度合成)类算法备案"之...
-
AIGC学习笔记
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 前言 提示:这里可以添加本文要记录的大概内容: 记录一下学习AIGC,参考链接: 爆火的AIGC到底是什么 提示:以下是本篇文章正文内容,下面案例可供参考 一、stab...
-
Python虚拟环境:使用venv隔离项目依赖
前言 在开发Python项目时,管理项目的依赖关系是一个常见的挑战。不同项目可能需要不同版本的库,如果不加以管理,很容易导致依赖冲突和环境混乱。幸运的是,Python提供了虚拟环境(virtual environment)的解决方案,帮助我们隔离项目依...
-
即刻体验 Llama3.1就在Amazon Bedrock!
引言 在人工智能的浪潮中,大型语言模型(LLMs)不断推动着技术边界的扩展。Meta 最新推出的 Llama 3.1 模型系列,以其卓越的性能和广泛的应用前景,引起了业界的广泛关注。现在,激动人心的消息来了——Llama3.1 已经在 Amazon Be...