-
【论文阅读笔记 + 思考 + 总结】MoMask: Generative Masked Modeling of 3D Human Motions
创新点: VQ-VAE ? Residual VQ-VAE,对每个 motion sequence 输出一组 base motion tokens 和 v 组 residual motion tokens bidirectional 的 Masked...
-
AIGC入门(二)从零开始搭建Diffusion!(下)
上篇。https://blog.csdn.net/alxws/article/details/140058117?spm=1001.2014.3001.5502四、前向加噪过程(ForwardProcess.py) 当我们的去噪器设计完成后,接下来,就...
-
Midjourney 参数列表--cref & --sref
角色迁移参数:--cref ---cref,Character Reference,角色参考参数,让mj生成的角色模仿你提供的图片角色的脸、发型、衣服等。 使用方法见下图,源自官方文档: 如果是淘宝、百度、谷歌等其他渠道找的图片,要上传到mj上,...
-
ComfyUl提示词技巧
ComfyUI prompt技巧 Prompt 输入不支持中文,建议使用翻译插件或者使用翻译软件来进行翻译。 翻译插件推荐:沙拉查词(opens in a new tab ?prompt 书写有什么技巧?要如何写AI绘图的prompt 在Comfy...
-
AIGC学习笔记
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 前言 提示:这里可以添加本文要记录的大概内容: 记录一下学习AIGC,参考链接: 爆火的AIGC到底是什么 提示:以下是本篇文章正文内容,下面案例可供参考 一、stab...
-
【SD教程】超详细AI绘画提示词语法讲解!
AI绘画提示词如何写?对于入门的小伙伴来说这是一个大问题,提示词写的好,才能有高质量的作品,那今天小元老师给大家详细讲解一下,建议点赞收藏! 一、SD提示词基础 AI绘画提示词基本规则 1、提示词(prompt)由多个词缀构成。 提示词分为正向提示...
-
【05】LLaMA-Factory微调大模型——初尝微调模型
上文【04】LLaMA-Factory微调大模型——数据准备介绍了如何准备指令监督微调数据,为后续的微调模型提供高质量、格式规范的数据支撑。本文将正式进入模型微调阶段,构建法律垂直应用大模型。 一、硬件依赖 LLaMA-Factory框架对硬件和软件的...
-
深度测评:SD3模型表现如何?实用教程助你玩转Stable Diffusion 3 ,最强SD3模型使用攻略,附ComfyUI实操SD3模型到底如何?StableDiffusion3全面评测!
深度测评:SD3模型表现如何?实用教程助你玩转Stable Diffusion 3 ,最强SD3模型使用攻略,附ComfyUI实操 SD3模型到底如何?StableDiffusion3全面评测!如何使用ComfyUI遍历题词 | 模型? 大家好...
-
百度文心一言API批量多线程写文章软件-key免费无限写
百度文心大模型的两款主力模型ENIRE Speed、ENIRE Lite全面免费,即刻生效。 百度文心大模型的两款主力模型 这意味着,大模型已进入免费时代! 据了解,这两款大模型发布于今年 3 月,支持 8K 和 128k 上下文长度。 ERNIE...
-
Ai绘画工具,Stable Diffusion提示词使用指南
哈喽,大家好,我是程序员晓晓 今天给大家分享的是Stable Diffusion提示词相关内容。 一、基本概述 1、提示词通常是在文生图和图生图的时候会使用到,就是这里的两个功能。 2、提示词由多个描述性词汇组成,由逗号隔开,结尾不需要加分隔符(注...
-
活久见!谁想的这种办法让大模型PK
“每个大模型看起来都差不多,只能谁便宜先用谁的。但用下来之后,不合适再换,又费钱又费力”,一位AI 招聘公司的创始人对光锥智能抱怨道。 2024年,大模型正在加速走向行业应用。但每一种大模型所擅长的领域都不一样,如何找到最适合自身业务场景的大模型,成为摆在...
-
过完618,我把用AI客服的店给拉黑了
陈杰最近快被AI客服搞疯了。 趁着618,陈杰买了两件衣服,但因为尺码不合适,其中一件需要退货。因为信用良好,平台自动同意了他7天无理由退货的申请,但快递员却始终没有上门取货。 眼看7天就要过去,陈杰联系了店铺的客服,想知道这种情况该如何处理。然而不管他发...
-
阿里图片编辑项目MimicBrush 可通过AI技术完美融合两张图片(附MimicBrush产品地址)
MimicBrush 是阿里巴巴推出的一款创新的图片编辑项目,它通过先进的AI技术,能够将一张图片的某一部分融合到另一张图片上。这项技术在电商商品展示、图片编辑和内容迁移等多个领域具有广泛的应用潜力。 核心特点: 模仿式编辑:用户可以直接从野外参考图像...
-
一上线就爆火出圈!中文语音AI天花板ChatTTS官网上线
还记得之前给大家推荐的中文语音AI天花板ChatTTS吗?这个可平替 GPT-4o的文本转语音项目一上线就爆火出圈,短短几天就在GitHub上斩获了16.9K的Star 量。 而现在,ChatTTS正式上线了官网,所有用户都可以直接在线体验了。 主要功能...
-
Ai绘画工具Stable Diffusion,最全提示词使用指南!建议收藏!
今天给大家分享的是Stable Diffusion提示词相关内容。 文章目录 一、基本概述 二、提示词顺序 三、提示词权重 四、连接词 五、分步渲染 六、调用Lora 七、提示词资源 八、常用提示词中英文对照表 写在最后 一、...
-
通过强化学习策略进行特征选择
特征选择是构建机器学习模型过程中的决定性步骤。为模型和我们想要完成的任务选择好的特征,可以提高性能。 如果我们处理的是高维数据集,那么选择特征就显得尤为重要。它使模型能够更快更好地学习。我们的想法是找到最优数量的特征和最有意义的特征。 在本文中,我们将...
-
超强!必会的十大机器学习算法
1.线性回归 线性回归是用于预测建模的最简单且使用最广泛的机器学习算法之一。 它是一种监督学习算法,用于根据一个或多个自变量预测因变量的值。 定义 线性回归的核心是根据观察到的数据拟合线性模型。 线性模型由以下方程表示: 其中 是因变量(我们想要预测...
-
机器学习:K均值算法
一、基础理论 1. 欧氏距离 想象你在北京,想要知道离上海有多远,则可以直接计算这个城市(两点)间直线的距离,这就是欧氏距离。 在二维平面上,在二维平面上有两个点A(x1, y1 和B(x2, y2 ,欧氏距离为: 图片 欧氏距离衡量的是两点间的真实物理...
-
研究发现 52% 的 ChatGPT 编程问题回答错误
在过去的几年里,计算机程序员纷纷转向诸如 OpenAI 的 ChatGPT 之类的聊天机器人来帮助他们编码,这对 Stack Overflow 等网站造成了打击,导致其去年不得不裁员近30% 的员工。然而,问题在于,普度大学的研究团队在计算机 - 人类交互...
-
150B token从头训练,普林斯顿Meta发布完全可微MoE架构Lory
不同于大多数模型使用字母缩略起名,论文作者在脚注中解释道,Lory是一种羽毛有彩虹颜色的鹦鹉,和「软MoE」的精神非常相似。 论文的作者团队也可以称之为「明星阵容」。 论文地址:https://arxiv.org/abs/2405.03133 主要作者...
-
西浦、利物浦大学提出:点云数据增强首个全面综述
本论文的第一作者朱钦峰是西交利物浦大学和利物浦大学联合培养的一年级在读博士,其导师为范磊副教授。他的主要研究方向为语义分割、多模态信息融合、3D视觉、高光谱图像和数据增强。 本文是对发表于模式识别领域顶刊Pattern Recognition 2024的...
-
Paper Digest | 基于原型学习的实体图谱预训练跨域推荐框架
可以看到,通过映射得到对应item相关的entity后,基于图谱推理流程,我们可以得到许多和映射得到的entity相关的高阶信息,如苹果这个公司有手机产品,而手机这类产品相关的公司有三星等,从而可以潜在的拉近和其他相关实体(如三星生产的手机等)间的关系。...
-
KAN核心团队震撼力作!MIT华人用AI首次发现物理学全新方程
就在刚刚,MIT物理学家用AI发现了物理学中的新方程。 论文地址:https://arxiv.org/abs/2405.04484 作者表示:这篇论文并没有解决价值数百万美元的核聚变问题,而是在更简单的设置中,引入一个有前途的概念验证。 偏微分方程(P...
-
SIGGRAPH'24 | 太逆天了!利用分层3D GS,实时渲染超大规模场景!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 近年来,新视角合成取得了重大进展,3D Gaussian splatting提供了出色的视觉质量、快速训练和实时渲染。然而,训练和渲染所需的资源不可避免地限制了可以以良好视觉质量表示的场景大小。本文引入...
-
五音不全但神曲很多?Suno AI助力博主街头随机采访创作情歌
随着AI技术的不断进步,海外博主“Alasdair Mann”利用AI音乐工具Suno AI为路人即兴创作音乐,让更多人体验到了AI的乐趣。这一创新的尝试不仅在社交媒体上引起了广泛关注,还为AI音乐创作潮流增添了新的活力。 在最近的一次街头采访中,“Ala...
-
闭环永动机!NeuroNCAP:彻底打通端到端闭环仿真链路,已开源!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 本文提出了一种用于测试自动驾驶(AD)软件系统的多功能基于NeRF的仿真器,其设计重点是传感器真实闭环评估和安全关键场景的创建。仿真器从真实世界的驾驶传感器数据序列中...
-
Gaussian-LIC:首个多传感器融合3DGS-SLAM系统(浙大&TUM)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 多传感器与3DGS的结合 NeRF-based SLAM的隐式神经表示法需要基于3D空间中的采样进行计算密集型的体积渲染,从而削弱了SLAM应用所必需的实时能力。3DGS以其快速的渲染速度和优越的视觉...
-
开箱黑盒LLM!谷歌大一统框架Patchscopes实战教程来了
虽然大型语言模型(LLM)在各种常见的自然语言处理任务中展现出了优异的性能,但随之而来的幻觉,也揭示了模型在真实性和透明度上仍然存在问题。 在模型生成错误回复内容时,如果能够「深入理解其背后运行机制」,或许可以解决模型的幻觉问题。 然而,随着深度神经网络...
-
AIGC实战——StyleGAN(Style-Based Generative Adversarial Network)
AIGC实战——StyleGAN 0. 前言 1. StyleGAN 1.1 映射网络 1.2 合成网络 1.3 自适应实例归一化层 1.4 风格混合 1.5 随机变化 2. StyleGAN 生成样本 3. StyleGAN2 3.1...
-
AI帮写会重复吗:一篇探讨AI写作助手是否会导致内容重复的文章
大家好,小发猫降重今天来聊聊AI帮写会重复吗:一篇探讨AI写作助手是否会导致内容重复的文章,希望能给大家提供一点参考。 以下是针对论文重复率高的情况,提供一些修改建议和技巧,可以借助此类工具: AI帮写会重复吗:一篇探讨AI写作助手是否会导致内容重...
-
Paper Digest | GPT-RE:基于大语言模型针对关系抽取的上下文学习
笔记整理:张廉臣,东南大学硕士,研究方向为自然语言处理、信息抽取 链接:https://arxiv.org/pdf/2305.02105.pdf 持...
-
恐怖谷!哥大华人开发「人脸机器人」,照镜子自主模仿人类表情超逼真
此前,人形机器人Ameca「大梦初醒」的神情,已让许多人感受到了真正的「恐惧」。 随着ChatGPT横空出世,得到加持的人形机器人虽擅长语言交流,但是在非语言交流,特别是面部表情,还差得很远。 未来,如果人类真的要生活在一个充满机器人的世界之中,机器...
-
Stable Diffusion之核心基础知识和网络结构解析
Stable Diffusion核心基础知识和网络结构解析 一. Stable Diffusion核心基础知识 1.1 Stable Diffusion模型工作流程 1. 文生图(txt2img 2. 图生图 3. 图像优化模块 1.2...
-
和 GPT-4 并列第一,LMSYS 基准测试显示 Claude-3 模型表现优异
3 月 28 日消息,根据 LMSYS Org 公布的最新基准测试报告,Claude-3 得分以微弱优势超越 GPT-4,成为该平台“最佳”大语言模型。 IT之家首先介绍下 LMSYS Org,该机构是由加州大学伯克利分校、加州大学圣地亚哥分校和卡内...
-
【AIGC】Stable Diffusion 的提示词入门
一、正向提示词和反向提示词 Stable Diffusion 中的提示词通常用于指导用户对生成的图像进行控制。这些提示词可以分为正向提示词(Positive Prompts)和反向提示词(Negative Prompts)两类,它们分别影响图像生成过程...
-
AI绘画 | 超现实主义混合的魔法
人们总是被美好的事物和新奇特的东西吸引,如果你已经被AI美女和帅哥产生了审美疲劳,今天我们的主题可能你更感兴趣。 大家都听过物种的起源,无非两种,神创论或者是达尔文的基于生物学和演化而来,但今天我们玩的是AI造物! 变异的鳄鱼 这个变异的鳄鱼,就...
-
【AIGC】Stable Diffusion的生成参数入门
Stable Diffusion 的生成参数是用来控制图像生成过程的重要设置,下面是一些常见的生成参数及其详解 1、采样器,关于采样器的选择参照作者的上一篇文章 2、采样步数(Sampling Steps)是指在生成图像时模型执行的总步数,每一步都包含了...
-
EfficientViT-SAM:精度不变原地起飞!
作者提出了EfficientViT-SAM,这是一系列加速的SAM模型。在保留SAM轻量级的提示编码器和 Mask 解码器的同时,作者用EfficientViT替换了沉重的图像编码器。在训练方面,首先从SAM-ViT-H图像编码器向EfficientV...
-
机器学习中的十种非线性降维技术对比总结
降维意味着我们在不丢失太多信息的情况下减少数据集中的特征数量,降维算法属于无监督学习的范畴,用未标记的数据训练算法。 尽管降维方法种类繁多,但它们都可以归为两大类:线性和非线性。 线性方法将数据从高维空间线性投影到低维空间(因此称为线性投影 。例子包括...
-
Stable Diffusion 30分钟打造AI 写真照片生成器|海马体照相馆这次真的要木得了
这次,海马体照相馆可能真的要木得了!! 前有妙鸭相机这种付费傻瓜式的 AI 写真程序,后有 Stable Diffusion 定制属于自己的 Lora 模型的围攻。 但今天要分享的确实一个叫 EasyPhoto 的 AI 写真照片生成器! 免费,使用...
-
零基础看懂免费开源的Stable Diffusion
文章目录 前言 Diffusion模型 推理过程 训练过程 Stable Diffusion模型 参考 前言 前面一篇文章主要讲了扩散模型的理论基础,还没看过上篇的小伙伴可以点击查看:DDPM理论基础。这篇我们主要讲一下一经推...
-
2023年的深度学习入门指南(19) - LLaMA 2源码解析
2023年的深度学习入门指南(19 - LLaMA 2源码解析 上一节我们学习了LLaMA 2的补全和聊天两种API的使用方法。本节我们来看看LLaMA 2的源码。 补全函数text_completion源码解析 上一节我们讲了LLaMA 2的...
-
【AI绘画】Stable Diffusion扩散模型 + Consistency一致性模型 小白必看!!!!!
手把手教你入门绘图超强的AI绘画,用户只需要输入一段图片的文字描述,即可生成精美的绘画。给大家带来了全新保姆级教程资料包 (文末可获取) 1 GAN到Stable Diffusion的改朝换代 2 从DDPM到Stable Diffusion发展史...
-
GPT-4/Gemini大翻车,做旅行攻略成功率≈0%!复旦OSU等华人团队:Agent不会复杂任务规划
AI智能体,是目前学界炙手可热的前沿话题,被众多专家视为大模型发展的下一个方向。 然而,最近复旦、俄亥俄州立大学、宾夕法尼亚州立大学、Meta AI的研究者们发现,AI智能体在现实世界的规划能力还很差。 他们对GPT-4 Turbo、Gemini Pro...
-
从0开始用 PyTorch 构建完整的 NeRF
本文经自动驾驶之心公众号授权转载,转载请联系出处。 在解释代码之前,首先对NeRF(神经辐射场)的原理与含义进行简单回顾。而NeRF论文中是这样解释NeRF算法流程的: “我们提出了一个当前最优的方法,应用于复杂场景下合成新视图的任务,具体的实现原理是...
-
南大周志华团队8年力作!「学件」系统解决机器学习复用难题,「模型融合」涌现科研新范式
HuggingFace是目前最火热的机器学习开源社区,汇集30万个不同的机器学习模型,有超过10万个应用可供用户访问和使用。 如果HuggingFace上这30万个模型,可以自由组合,共同完成新的学习任务,那会是一种什么样的画面? 其实在HuggingF...
-
链世界:一种简单而有效的人类行为Agent模型强化学习框架
强化学习是一种机器学习的方法,它通过让智能体(Agent)与环境交互,从而学习如何选择最优的行动来最大化累积的奖励。强化学习在许多领域都有广泛的应用,例如游戏、机器人、自动驾驶等。强化学习也可以用于干预人类的行为,帮助人类实现他们的长期目标,例如戒烟、减...
-
【AIGC】从零手写一个GPT
手写一个GPT 在GPT,确切的说是Transformer,出现之前,一个问题长久地困扰着人们——如何让两句内容不同、但语义相近的句子得到较为接近的表示。 比如我们有两句话 我喜欢你 吾中意你 它们作为句子内容并不一样,但是表达的含义却...
-
拳打Gen-2脚踢Pika,谷歌爆肝7个月祭出AI视频大模型,首提时空架构,时长史诗级延长
爆肝7个月,谷歌祭出了AI视频大模型Lumiere,直接改变了游戏规则!全新架构让视频时长和一致性全面飞升,时长直接碾压Gen-2和Pika。 AI视频赛道上,谷歌又再次放出王炸级更新! 这个名为Google Lumiere的模型,是个大规模视频扩散模...
-
拳打Gen-2脚踢Pika,谷歌爆肝7个月祭出AI视频大模型!首提时空架构,时长史诗级延长
AI视频赛道上,谷歌又再次放出王炸级更新! 这个名为Google Lumiere的模型,是个大规模视频扩散模型,彻底改变了AI视频的游戏规则。 跟其他模型不同,Lumiere凭借最先进的时空U-Net架构,在一次一致的通道中生成整个视频。 具体来说,现有...