数据集构建 - AIGC资讯

AIGC入门（二）从零开始搭建Diffusion！（下）

上篇。https://blog.csdn.net/alxws/article/details/140058117?spm=1001.2014.3001.5502四、前向加噪过程（ForwardProcess.py）当我们的去噪器设计完成后，接下来，就...

人工智能 2024-09-05 人工智能

1237阅读

Stable Diffusion模型训练：从数据准备到模型优化

Stable Diffusion模型训练：从数据准备到模型优化开篇引入：探索创意无限的Stable Diffusion 数据集构建秘籍：打造专属训练素材如何收集高质量图像数据？数据预处理小技巧：清洗与标注模型配置与训练实战：让创意流...

AIGC 2024-09-01 人工智能

1348阅读

Stable Diffusion的常用命令行介绍及示例

Stable Diffusion是一种基于扩散模型的深度学习技术，它特别适用于生成高质量的图像。通过命令行操作，用户可以灵活配置Stable Diffusion模型，以满足不同的图像生成需求。本文将详细介绍Stable Diffusion的常用命令行参数，...

AIGC 2024-08-02 人工智能

1413阅读

文献研读｜AIGC溯源场景及研究进展

前言：本文介绍关于AIGC生成阶段针对不同溯源场景的几篇相关工作。相关文章：针对文生图模型的AIGC检测论文研读，参见此篇文章。如下图所示，在AIGC生成阶段，有4种溯源场景： 1）生成模型溯源训练数据 2）微调模型溯源预训练模型 3）AI...

生成式AI 2024-07-04 人工智能

1387阅读

目标检测新SOTA，端侧实时识别，沈向洋罕见转发点赞

目标检测领域，迎来了新进展—— Grounding DINO 1.5，IDEA研究院团队出品，在端侧就可实现实时识别。这一进展获得AI大佬沈向洋转发，他一般都是一年一转的节奏。此次发布主要有两个版本：Pro和Edge。Pro版更强，Edge版更快。...

AIGC 2024-05-27 人工智能

841阅读

AI视频生成工具ID-Animator：可保持角色一致生成视频动画

近年来，生成具有指定身份的高保真人类视频引起了广泛关注。然而，现有技术在训练效率和身份保持之间往往难以取得平衡，要么需要繁琐的逐案微调，要么在视频生成过程中通常会丢失身份细节。研究提出了一种名为 ID-Animator 的零样本人类视频生成方法，可以在无需...

大数据 2024-04-25 人工智能

905阅读

大模型在复杂推理任务上潜力如何？多智能体互动框架ThinkThrice玩转剧本杀

剧本杀是一种广受欢迎的多角色扮演侦探游戏，要求玩家扮演不同的角色。通过阅读角色文本、理解各自的故事、搜集线索、以及逻辑推理，玩家们共同努力揭开谜团。游戏角色通常被分为平民和凶手两大类：平民的目标是找出隐藏在他们中间的凶手，而凶手则尽力隐藏自己的身份，避免...

人工智能 2024-03-11 人工智能

897阅读

为OpenAI解释一切的人离开了OpenAI

“即使OpenAI消失了，其他人也会继续朝着通用人工智能的方向前进。”洛根·基尔帕特里克（Logan Kilpatrick）在今年 2 月的一场播客中说到。这句话像是在说，如果几十年后OpenAI没有成为下一个谷歌或是微软，而是变成一家像当初Napste...

生成式AI 2024-03-06 人工智能

809阅读

ChatLaw：基于LLaMA微调的法律大模型

文章目录动机数据组成模型框架模型评估北大团队发布首个的中文法律大模型落地产品ChatLaw，为大众提供普惠法律服务。模型支持文件、语音输出，同时支持法律文书写作、法律建议、法律援助推荐。 github地址：https://g...

大数据 2024-02-05 人工智能

1575阅读

LLaMA模型指令微调字节跳动多模态视频大模型 Valley 论文详解

Valley: Video Assistant with Large Language model Enhanced abilitY 大家好，我是卷了又没卷，薛定谔的卷的AI算法工程师「陈城南」~ 担任某大厂的算法工程师，带来最新的前沿AI知识和工具...

大数据 2024-02-03 人工智能

1065阅读

更适合中文LMM体质的基准CMMMU来了：超过30个细分学科，12K专家级题目

近期，随着多模态大模型（LMM）的能力不断进步，评估 LMM 性能的需求也日益增长。与此同时，在中文环境下评估 LMM 的高级知识和推理能力的重要性更加突出。在这一背景下，M-A-P 开源社区、港科大、滑铁卢大学、零一万物等联合推出了面向中文大规模多...

AIGC 2024-01-29 人工智能

880阅读

鹅厂最新AI工具刷屏！杨幂寡姐多风格写真秒秒钟生成，LeCun点赞

大厂们在整活方面开始卷起来了！前脚字节阿里的工具火了，现在腾讯这个新照片生成应用PhotoMaker直接刷屏，瞧这阵仗…… 只需上传一张或以上照片，无需额外LoRA训练，就能快速可定制。任何人、任何风格，高保真那种。于是秒秒钟，LeCun化身钢铁侠...

AIGC 2024-01-16 人工智能

797阅读

超越BEVFusion！又快又好的极简BEV融合部署方案

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解在算法开发中，激光雷达-相机3D目标检测遇到了过度拟合问题，这是由于违反了一些基本规则。在数据集构建的数据标注方面，本文参考了理论补充，并认为回归任务预测不应涉及来自...

大数据 2024-01-16 人工智能

1080阅读

Stable Diffusion 文生图技术原理

图像生成模型简介图片生成领域来说，有四大主流生成模型：生成对抗模型（GAN）、变分自动编码器（VAE）、流模型（Flow based Model）、扩散模型（Diffusion Model）。从2022年开始，主要爆火的图片生成模型是Diffusi...

人工智能 2024-01-08 人工智能

1961阅读

高情商的NPC来了，刚伸出手，它就做好了要配合下一步动作的准备

在虚拟现实、增强现实、游戏和人机交互等领域，经常需要让虚拟人物和屏幕外的玩家互动。这种互动是即时的，要求虚拟人物根据操作者的动作进行动态调整。有些互动还涉及物体，比如和和虚拟人物一起搬动一把椅子，这就需要特别关注操作者手部的精确动作。智能、可交互的虚拟人...

AIGC 2024-01-03 人工智能

815阅读

解读Lawyer LLaMA，延申专业领域大模型微调：数据集构建，模型训练

解读Lawyer LLaMA，延申自己领域大模型微调：数据集构建，模型训练项目地址link 自己领域的大模型微调，实现思路大都和这篇文章是一样的，有的是基于LLaMA,或者有的是基于Chinese-LLaMA,或者是其他开源的大模型，本文基于自己训...

人工智能 2023-12-01 人工智能

1087阅读

GPT-4充当“规划师、审计师”，颠覆性双层文生图表模型

DALL-E3、Midjourney、Stable Diffusion等模型展现出了强大的创造能力，通过文本便能生成素描、朋克、3D、二次元等多种类型的高质量图片，但在生成科学图表（柱状、直方、箱线、树状等）方面却略显不足。这是因为模型在生成图表时会遗漏...

大数据 2023-11-20 人工智能

941阅读

抖音AI绘画变成真人软件

抖音AI绘画成人软件的发展可能包括以下几个方面：算法优化：随着深度学习算法的不断发展，未来该技术可能会通过改进模型架构、优化训练方式等手段，提高生成图像的质量和自然度。多样化的绘画风格：为了满足用户个性化的需求，未来的AI绘画成...

人工智能 2023-11-14 人工智能

1187阅读

语言作“纽带”，拳打脚踢各模态，超越Imagebind

北大联合腾讯打造了一个多模态15边形战士！以语言为中心，“拳打脚踢”视频、音频、深度、红外理解等各模态。具体来说，研究人员提出了一个叫做LanguageBind的多模态预训练框架。用语言作为与其它模态之间的纽带，冻结语言编码器，然后用对比学习方法...

生成式AI 2023-11-13 人工智能

838阅读

重磅 |《3D人脸数据采集标注要求及方法》技术规范发布！

目前，人脸识别已走进我们的生活，在机场安检、上班考勤、银行开户、网上支付等各个场合乎随处可见。现在主流的技术基于摄像头类型人脸识别有两种，基于2D人脸识别或基于3D人脸识别，这些都有实际商用的案例。但是由于3D图像还可以获取距离信息，对照片欺骗等具有更好的...

AIGC 2023-11-08 大数据

838阅读

ChatGPT、Llama-2等大模型，能推算出你的隐私数据！

ChatGPT等大语言模型的推理能力有多强大?通过你发过的帖子或部分隐私数据，就能推算出你的住址、年龄、性别、职业、收入等隐私数据。瑞士联邦理工学院通过搜集并手工标注了包含520个Reddit（知名论坛）用户的个人资料真实数据集PersonalReddi...

人工智能 2023-10-31 人工智能

851阅读

北大团队：诱导大模型“幻觉”只需一串乱码！大小羊驼全中招

北大团队最新研究发现：随机token都能诱发大模型出现幻觉！比如喂给大模型（Vicuna-7B）一段“乱码”，它就莫名其妙弄错了历史常识。或者是简单修改提示词，大模型也会掉入陷阱。 Baichuan2-7B、InternLM-7B、ChatGL...

AIGC 2023-10-30 人工智能

987阅读

RLHF与AlphaGo核心技术强强联合，UW/Meta让文本生成能力再上新台阶

在一项最新的研究中，来自 UW 和 Meta 的研究者提出了一种新的解码算法，将 AlphaGo 采用的蒙特卡洛树搜索算法（Monte-Carlo Tree Search, MCTS）应用到经过近端策略优化（Proximal Policy Optimiz...

人工智能 2023-10-27 人工智能

1001阅读