-
AI绘画之Midjourney——提示词结构揭秘
大家好 今天分享的内容:Midjourney(以下简称MJ)提示词结构。 还没有注册MJ的,如果不能用MJ可以用国内的MEWX AI。 MJ的提示词不像直接跟大模型对话的提示词,结构需要那么复杂,主要是分清需要的各个部分,一般是由句子和短语组成,然后...
-
在本地跑一个AI模型(5) - Stable Diffusion
在之前的文章中,我们使用ollama在本地运行了大语言模型,它可以与你聊天,帮助你理解和生成文本内容。使用coqui-tts在本地运行了文本转语音模型,它可以将大语言模型生成的文字转换成语音,让你的应用更有趣。今天我们将要介绍Stable Diffusio...
-
ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了
如果说现在什么事能引发全球打工人们同时间大暴走,那应该就是昨夜经历的:AI聊天机器人集体宕机。 美西时间午夜 12 点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。 本以为像平时一样多刷几次就能恢复...
-
Stable Diffusion高级教程 - 图生图(img2img)模式
前言 现在终于可以介绍 Stable Diffusion 除了文生图 (txt2img 之外最重要的功能:图生图 (img2img 。顾名思义,除了根据正向和反向提示词之外,还需要基于一张图片生成图。这个模式下功能很多我们挨个说 img2img 图...
-
真实对比kimi、通义千问、文心一言的写代码能力,到底谁强?
🤖AI改变生活:最近都在说月之暗面的kimi的各项能力吊打国内其他大模型,今天我们真实感受下 kimi、通义千问、文心一言的根据需求写代码的能力。 测评结果让人震惊! kimi kimi编程过程 我们先看一下热捧的月之暗面的kimi模型。...
-
DreamPose: Fashion Image-to-Video Synthesis via Stable Diffusion
UW&UCB&Google&NVIDIA ICCV23 https://github.com/johannakarras/DreamPose?tab=readme-ov-file 问题引入 输入参考图片...
-
Stable Diffusion简单食用方法
1.下载 1.1打开B站 哔哩哔哩 (゜-゜ つロ 干杯~-bilibili哔哩哔哩(bilibili.com 是国内知名的视频弹幕网站,这里有及时的动漫新番,活跃的ACG氛围,有创意的Up主。大家可以在这里找到许多欢乐。https://www.bil...
-
肝了三天,完成了AIGC工具网站大全,建议收藏再看
说是肝了三天,其实远远不止,前前后后,从资料搜集到最后整理成文,有近一个月了,大家看在整理不易的份上,给点个赞吧,不要光顾着收藏呀! 国内网站 AIGC 导航 https://www.aigc.cn 网站很全面,而且可以看出商业化也比...
-
速度秒掉GPT-4o、22B击败Llama 3 70B,Mistral AI开放首个代码模型
对标 OpenAI 的法国 AI 独角兽 Mistral AI 有了新动作:首个代码大模型 Codestral 诞生了。 作为一个专为代码生成任务设计的开放式生成 AI 模型,Codestral 通过共享指令和补全 API 端点帮助开发人员编写并与代码...
-
Kohya 训练器 Stable Diffusion工作流中训练LoRA模型方法
本文档是关于Stable Diffusion工作流中训练LoRA模型方法的文档 一.前置训练集准备 第一步: 准备训练集:准备训练模型时使用的训练集。注意:训练集应当能尽量涵盖训练对象的“多样化样本”。如角色立绘图,各个角度不同的图片。...
-
苹果青睐独立开发者:ChatGPT无缘年度设计奖入围名单
近日,苹果公司公布了其年度设计奖的入围名单,明确表彰独立应用程序和初创公司,而非大型科技公司,包括那些提供人工智能聊天机器人的公司。在当前AppStore模式受到立法者和监管机构质疑之际,苹果将目光投向了那些在其平台上表现突出的中小型应用程序制造商。 在今...
-
【AIGC调研系列】CogVLM2:第二代视觉大模型
CogVLM2是智谱AI推出的新一代多模态大模型,继承并优化了上一代模型的经典架构。CogVLM2采用了一个拥有50亿参数的强大视觉编码器,并创新性地在大语言模型中整合了一个70亿参数的视觉专家模块[1]。这一设计使得CogVLM2在视觉和语言理解方面实现...
-
AIGC系列之:DDPM原理解读(简单易懂版)
目录 DDPM基本原理 DDPM中的Unet模块 Unet模块介绍 Unet流程示意图 DownBlock和UpBlock MiddleBlock 文生图模型的一般公式 总结 本文部分内容参考文章:https://ju...
-
手把手教你用LoRA训练自己的Stable Diffusion模型
目录 写在前面 一、准备数据 二、数据打标签 三、执行训练 四、执行推理 1.LoRA推理 2.全参数推理 写在前面 Stable Diffusion大家已经很熟悉了,那么如何训练自己的sd模型呢,今天我就介绍一下用L...
-
CVPR 2024 | 图像超分、图像恢复汇总!用AIGC扩散模型diffusion来解决图像low-level任务的思路...
1、Arbitrary-Scale Image Generation and Upsampling using Latent Diffusion Model and Implicit Neural Decoder 超分辨率(SR)和图像生成是计算...
-
实战whisper第二天:直播语音转字幕(全部代码和详细部署步骤)
直播语音实时转字幕: 基于Whisper的实时直播语音转录或翻译是一项使用OpenAI的Whisper模型实现的技术,它能够实时将直播中的语音内容转录成文本,甚至翻译成另一种语言。这一过程大致分为三个步骤:捕获直播音频流、语音识别(转录)以及翻译(如...
-
AI绘画Stable Diffusion【Forge】:速度更快更好用的新Web UI工具Forge
大家好,我是程序员晓晓。 Stable Diffusion WebUI Forge 是一个基于 Stable Diffusion WebUI的平台,相当于是一个升级版本。“Forge”这个名字的灵感来自于“Minecraft Forge”。其旨在成为 S...
-
CVPR 2024 | 风格迁移和人像生成汇总!扩散模型diffusion用于经典AIGC方向
风格迁移 1、DEADiff: An Efficient Stylization Diffusion Model with Disentangled Representations 基于文本到图像扩散模型在迁移参考风格方面具有巨大潜力。然而,...
-
全网最全stable diffusion webui API调用示例,包含controlneth和segment anything的API(附json示例)
全网最全stable diffusion webui API调用示例,包含controlneth和segment anything的API(附json示例) 交流群 100419879 欢迎合作👏🏻 V : 864399407 GitHub:https...
-
LLMs之Llama3:Llama-3的简介、安装和使用方法、案例应用之详细攻略
LLMs之Llama3:Llama-3的简介、安装和使用方法、案例应用之详细攻略 导读:2024年4月18日,Meta 重磅推出了Meta Llama 3,本文章主要介绍了Meta推出的新的开源大语言模型Meta Llama 3。模型架构 Llam...
-
桌面版ChatGPT登台演讲,能视频通话还会实时读屏,GPT-4o demo再次惊艳:“能力还是被低估了”
GPT-4o桌面端最新Demo,与Sora的新作品一同亮相“欧洲AI春晚”VivaTech。 现场,OpenAI工作人员不仅展示了观众期待已久的“视频通话”,还试着让ChatGPT发表了演讲。 在视频聊天当中,即使给它的只有一幅抽象的简笔画,它也能立马...
-
马斯克谈AI未来:不工作也有高收入 但活着无聊
5月24日消息,当地时间周四,特斯拉首席执行官埃隆·马斯克(Elon Musk)通过视频连线参加在法国巴黎举行的VivaTech技术大会,分享了他对未来的一种反乌托邦观点。 当一位观众询问人工智能是否终将取代马斯克,并表达对人工智能夺走工作岗位的担...
-
AIGC-controlnet代码详细解读
hugging face 社区diffusers官方代码:stable_diffusion/controlnetcontrolnet.ipynb 原始代码的解读可以看看这个博主的:万字长文解读Stable Diffusion的核心插件—ControlNet...
-
Gabby World V2:融合AI和区块链技术的全新龙与地下城风格游戏问世
站长之家(ChinaZ.com)5月22日 消息:在全新的Gabby World V2游戏中,玩家将迎来一个融合了人工智能和区块链技术的独特体验。这款创新游戏以Dungeons & Dragons为灵感,为玩家提供了创建和探索故事的机会,打造了完全...
-
路径规划概述:基于采样、搜索、优化全搞定!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 1 决策控制与运动规划概述 目前决策控制方法可以分为三类:sequential planning、behavior-aware planning、和end-to-end planning。 seq...
-
首席信息官必须了解的关于人工智能基础设施的五件事
生成式人工智能有潜力改变行业并产生难以估量的投资回报率,但前提是首席信息官和其他IT领导者了解一些基本要素。 生成式人工智能吸引了所有人的注意力,这有着充分理由。但是,从潜力到盈利并非没有风险,例如,假设部署主流企业IT基础设施的既定流程将在复杂的人工...
-
开发者的LlamaIndex入门指南
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ LlamaIndex是一个专注于检索增强生成(RAG 的工具,可以协助您丰富大模型的数据提示。本文将用实例向您展示和介绍。 众所周知,...
-
瑜伽球上遛「狗」!入选英伟达十大项目之一的Eureka有了新突破
机器狗在瑜伽球上稳稳当当的行走,平衡力那是相当的好: 各种场景都能拿捏,不管是平坦的人行道、还是充满挑战的草坪都能 hold 住: 甚至是研究人员踢了一脚瑜伽球,机器狗也不会歪倒: 给气球放气机器狗也能保持平衡: 上述展示都是 1 倍速,没有经过...
-
Sora大片真相:人工特效参与,被指误导大众
啊?Sora火爆短片《气球人》,也“造假”了??? 背后艺术家团队的最新揭秘,可谓一石激起千层浪: 原来,视频画面并非完全由AI生成,其中有大量视觉效果需要人类后期实现。 be like: 这下网友不干了,合着大家伙儿跟OpenAI玩真心,OpenAI...
-
AI 计算创业公司FlexAI 获得3000万美元种子资金
AI 计算创业公司 FlexAI 近日宣布获得3000万美元的种子资金,正式走出隐形模式。该公司成立于去年,团队成员包括来自苹果、英特尔、英伟达和特斯拉的前员工。总部位于巴黎的 FlexAI 试图通过其按需云服务来颠覆基础设施市场。 图源备注:图片由AI...
-
量化、剪枝、蒸馏,这些大模型黑话到底说了些啥?
量化、剪枝、蒸馏,如果你经常关注大语言模型,一定会看到这几个词,单看这几个字,我们很难理解它们都干了些什么,但是这几个词对于现阶段的大语言模型发展特别重要。这篇文章就带大家来认识认识它们,理解其中的原理。 模型压缩 量化、剪枝、蒸馏,其实是通用的神经网络...
-
2023年AAAS Fellow名单出炉!信息计算领域:浙大教授、中科大校友当选
4月18日,世界上最大的综合性科学学会之一,同时也是Science期刊出版商的美国科学促进会(AAAS),官宣了2023年的AAAS Fellow名单。 来自24个领域的502名科学家、工程师和创新者,将获得这一科学界的终身荣誉。 新当选的Fellow绝...
-
如何利用Transformer有效关联激光雷达-毫米波雷达-视觉特征?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 笔者个人理解 自动驾驶的基础任务之一是三维目标检测,而现在许多方法都是基于多传感器融合的方法实现的。那为什么要进行多传感器融合?无论是激光雷达和相机融合,又或者是毫米波雷达和相机融合,其最主要的目的就是...
-
Parler-TTS官网体验入口 AI语音生成工具免费使用地址
Parler-TTS是一个由 Hugging Face 开发的轻量级文本转语音(TTS)模型,能够以给定说话者的风格(性别、音调、说话风格等)生成高质量、自然 sounding 的语音。它是基于 Dan Lyth 和 Simon King 发表的论文《Na...
-
AIGC之gradio系列学习教程(二)Components
简述: 让我们继续了解一下 Gradio 的一些主要功能。本指南旨在对构建演示时应注意的各种事项进行高级概述。 Components Gradio 包含 30 多个预构建组件(以及许多用户构建的自定义组件),只需一行代码即可在演示中用...
-
stable-diffusion-webui踩坑指南
过年刷资讯AI的信息铺天盖地,准备研究研究。最后选择从AI绘画的stable diffusion入手。本地安装了最新的Python(13.12.2)然后直接克隆GitHub - Stability-AI/stablediffusion: High-Reso...
-
ICCV 2023 | 最全AIGC梳理,5w字30个diffusion扩散模型方向,近百篇论文!
30个方向130篇!CVPR 2023最全AIGC论文 25个方向!CVPR 2022 GAN论文汇总 35个方向!ICCV 2021 最全GAN论文汇总 超110篇!CVPR 2021 最全GAN论文梳理 超100篇!CVPR 2...
-
马斯克造大模型,从特斯拉连挖高管
当全球首富埃隆・马斯克(Elon Musk)建立 xAI,准备与 OpenAI、谷歌竞争大模型时,他必须与众多科技巨头、初创公司争夺人才。 不过,他使用了一些取巧的办法:从自家的特斯拉挖来了几名优秀工程师。 该初创公司的网站显示,上个月,机器学习...
-
AIGC知识库一周精华
元宇宙、大语言模型和智能设计是当前人工智能领域的重要发展趋势。 元宇宙将虚拟和现实世界融合,开启了新的数字化交互时代。 大语言模型的应用和研究不断推进,提示工程和函数调用等工具不断涌现,为人们提供更高效的文本生成和处理能力。 智能设计领域...
-
GPT-5红队测试邮件曝光,最早6月发布?网友在线逼问Altman,数十亿美元超算26年启动
GPT-5已经开始红队测试了? 就在这几天,网上已经有多人晒出了OpenAI发给自己的红队录取通知书。 此前有传闻说,GPT-5将于今年6月发布。看起来,红队测试与模型发布的时间线十分吻合。 有网友直接晒出了自己收到OpenAI邮件邀请的截图。 这...
-
DALL·E 2(内含扩散模型介绍)【论文精读】Hierarchical Text-ConditionalImage Generation with CLIP Latents
1官方对模型的介绍 大家好,今天我们就一起来看一下两个月之前 OpenAI 刚放出来的一篇力作。DALL·E 2是 OpenAI 一系列文本图像生成工作的最新一篇。去年 1 月份他们先推出了Dolly,然后在年底的时候又推出了glide。...
-
开源!超越ZoeDepth! DepthFM:快速且精确的单目深度估计!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 0. 这篇文章干了啥? 提出了DepthFM:一个多功能且快速的最先进的生成式单目深度估计模型。除了传统的深度估计任务外,DepthFM还展示了在深度修复等下游任务中的最先进能力。DepthFM效率高...
-
Stable Diffusion下载安装,保姆级教程指南!
一、了解Stable Diffusion 1、Stable Diffusion(简称SD)是一种图像生成模型,主要用于生成以文本生成图像,图片生成图片,图片修复等,由慕尼黑路德维希马克西米利安大学CompVis 小组和Runway的研究人员提出,由...
-
全网最全Stable Diffusion原理说明!!简单明了 容易理解!!!
手把手教你入门绘图超强的AI绘画程序Stable Diffusion,用户只需要输入一段图片的文字描述,即可生成精美的绘画。下面是Stable Diffusion注册和使用的方法。给大家带来了全新Stable Diffusion保姆级教程资料包(文末可获取...
-
【Stable Diffusion初学者指南】模型指南
文章目录 微调模型 什么是微调? 人们为什么要制作Stable Diffusion模型? 模型是如何创建的? 流行的Stable Diffusion模型 Stable diffusion v1.4 Stable diffusion v1....
-
增强包容性:如何利用Edge ML支持具有特殊需求的个人
译者 | 李睿 审校 | 重楼 科技进步为具有特殊需要的人带来了新的解决方案。边缘机器学习(Edge ML 是一项开创性技术,它使机器学习算法更接近数据源,从而减少延迟,并提高实时处理能力。 本文讨论了Edge ML在解决具有特殊需求的个人所面临的独特...
-
Whisper.cpp: 一个轻量级、高效的C++事件系统
Whisper.cpp: 一个轻量级、高效的C++事件系统 项目地址:https://gitcode.com/ggerganov/whisper.cpp 在当今的软件开发中,事件驱动模型已经成为构建复杂应用程序的核心部分。Whisper.cpp是一...
-
52个AIGC视频生成算法模型介绍
基于Diffusion模型的AIGC生成算法日益火热,其中文生图,图生图等图像生成技术普遍成熟,很多算法从业者开始从事视频生成算法的研究和开发,原因是视频生成领域相对空白。 AIGC视频算法发展现状 从2023年开始,AIG...
-
生成式AI指南体验入口 awesome-generative-ai-guide项目地址入口
awesome-generative-ai-guide是一个集中存放生成式人工智能相关资源的中心,包括每月最新研究论文、面试题库、课程材料、代码笔记本等。内容定期更新,旨在让开发者及从业人员能够及时跟进最新进展,提高生产力。主要资源包括论文摘要、面试问题分...
-
AIGC时代,软件测试智能化到底会怎样?
AI技术在软件测试领域的应用比软件开发早。早在上个世纪七、八十年代,软件测试就开始应用采用遗传算法生成测试数据,到九十年代,其研究和应用逐渐增多,从单元测试、接口测试到GUI的系统测试, 提供自动化的测试用例生成、自动化的测试执行和评估等功能,取得了不少成...