数据集第45页 - AIGC资讯

stable diffusion模型讲解

AI模型最新展现出的图像生成能力远远超出人们的预期，直接根据文字描述就能创造出具有惊人视觉效果的图像，其背后的运行机制显得十分神秘与神奇，但确实影响了人类创造艺术的方式。 AI模型最新展现出的图像生成能力远远超出人们的预期，直接根据文字描述就能创造出具有...

人工智能 2024-01-07 人工智能

924阅读

第二证券|ChatGPT被“玩坏”，美图大涨45%，AIGC赛道风口来了？

AIGC（人工智能主动生成内容）近期被ChatGPT带火了！近来明星人工智能公司OpenAI发布了全新的谈天机器人模型ChatGPT。该模型能够主动生成代码以及绘画、答复一系列问题、承认自己的错误、质疑不正确的假设，乃至回绝不合理的要求，且支撑中文。...

大数据 2024-01-07 人工智能

867阅读

AIGC实战——自回归模型(Autoregressive Model)

AIGC实战——自回归模型 0. 前言 1. 长短期记忆网络基本原理 2. Recipes 数据集 3. 处理文本数据 3.1 文本与图像数据处理的差异 3.2 文本数据处理步骤 4. 构建 LSTM 模型 4.1 模型架构 4.2 LS...

AIGC 2024-01-07 人工智能

2394阅读

对2024年大数据及其相关领域的预测

数据分析随着全渠道商务的发展，广告分析的格局即将发生巨变。线上和线下消费者互动之间的传统竖井正在瓦解，为真正的全渠道消费者铺平了道路。虽然实体/数字墙在消费者的旅程中正在倒塌，但消费者隐私仍使分析变得复杂，这种全渠道消费者的增长将要求重新调整营销衡量...

AIGC 2024-01-07 人工智能

897阅读

首创pix2emb范式！NUS清华联合发布NExT-Chat：对话/检测/分割全能多模态大模型

随着ChatGPT的爆红，多模态领域也涌现出一大批可以处理多种模态输入的对话模型，如LLaVA, BLIP-2等等。为了进一步扩展多模态大模型的区域理解能力，近期新加坡国立大学NExT++实验室和清华大学的研究人员联手打造了一个可以同时进行对话和检测、...

人工智能 2024-01-07 人工智能

893阅读

万字长文谈自动驾驶BEV感知

本文经自动驾驶之心公众号授权转载，转载请联系出处。 prologue 这有可能是更的最长的文章系列了，先说为什么，一方面是看到分割大模型对小模型的提升效果需要时间，另一方面是之前对自动驾驶的BEV算法做了很长时间的预研，自己也应该好好梳理一下了。（很...

生成式AI 2024-01-07 人工智能

1135阅读

超逼真！实时高质量渲染，用于动态城市场景建模的Street Gaussians

本文经自动驾驶之心公众号授权转载，转载请联系出处。不得不说，技术更新太快了，Nerf在学术界慢慢被替换下去了。Gaussians登场了，浙江大学的工作论文：Street Gaussians for Modeling Dynamic Urban Sc...

人工智能 2024-01-07 人工智能

913阅读

AIGC实战——生成对抗网络(Generative Adversarial Network, GAN)

AIGC实战——生成对抗网络 0. 前言 1. 生成对抗网络 1.1 生成对抗网络核心思想 1.2 深度卷积生成对抗网络 2. 数据集分析 3. 构...

人工智能 2024-01-06 人工智能

863阅读

2024年大数据展望：数据满足GenAI

去年初，谁能想到GenAI和ChatGPT会抢占先机? 一年前，我们预测数据、分析和AI提供商最终会抽出时间来简化和重新思考现代数据堆栈，这是一个我们已经接近和热爱了一段时间的话题。作为分布式企业中数据治理的解决方案，也有很多关于数据网格的讨论和担忧，...

AIGC 2024-01-06 人工智能

885阅读

只需1080ti，即可在遥感图像中对目标进行像素级定位！代码数据集已开源！

太长不看版这篇论文介绍了一项新的任务 —— 指向性遥感图像分割（RRSIS），以及一种新的方法 —— 旋转多尺度交互网络（RMSIN）。RRSIS 旨在根据文本描述实现遥感图像中目标对象的像素级定位。为了解决现有数据集规模和范围的限制，本文构建了一个新...

大数据 2024-01-06 人工智能

873阅读

攻克图像「文本生成」难题，碾压同级扩散模型！两代TextDiffuser架构深度解析

近年来，文本生成图像领域取得了显著进展，尤其是基于扩散（Diffusion）的图像生成模型在细节层面上展现出逼真的效果。然而，一个挑战仍然存在：如何将文本准确地融入图像。生活中存在大量的「含文本图像」，从广告海报到书籍封面，再到路牌指示，都包含了重要...

生成式AI 2024-01-06 人工智能

919阅读

模型A：幸亏有你，我才不得0分，模型B：俺也一样

琳琅满目的乐高积木，通过一块又一块的叠加，可以创造出各种栩栩如生的人物、景观等，不同的乐高作品相互组合，又能为爱好者带来新的创意。我们把思路打开一点，在大模型（LLM）爆发的当下，我们能不能像拼积木一样，把不同的模型搭建起来，而不会影响原来模型的功能，...

人工智能 2024-01-06 人工智能

780阅读

AI平台：OpenXLab浦源

OpenXLab浦源开放项目应用中心模型中心数据集中心文档中心搜索中文EN创建登录注册人工智能开源开放体系浦源内容平台应用中心探索多领域应用，体验丰富的社区生态AIGC语音计算机视觉自然语言处理多模态技术更多在这里...

生成式AI 2024-01-06 人工智能

1365阅读

《Cocos Creator游戏实战》AIGC之将草稿内容转为真实内容

目录前言训练AI 从识别结果中提取必要数据发送图片并生成最终代码总结与提高资源下载前言当创作灵感来的时候，我们可能会先把灵感记录在草稿上，之后再去实现它。比方说有一天，我突然来了游戏创作灵感，想着那可以先把一些简单的组件...

大数据 2024-01-06 人工智能

928阅读

当LLM学会左右互搏，基础模型或将迎来集体进化

金庸武侠小说中有一门武学绝技：左右互搏；乃是周伯通在桃花岛的地洞里苦练十余年所创武功，初期想法在于左手与右手打架，以自娱自乐。而这种想法不仅能用来练武功，也能用来训练机器学习模型，比如前些年风靡一时的生成对抗网络（GAN）。进入现今的大模型 (LLM ...

大数据 2024-01-06 人工智能

908阅读

一句话精准视频片段定位！清华新方法拿下SOTA｜已开源

只需一句话描述，就能在一大段视频中定位到对应片段！比如描述“一个人一边下楼梯一边喝水”，通过视频画面和脚步声的匹配，新方法一下子就能揪出对应起止时间戳：就连“大笑”这种语义难理解型的，也能准确定位：方法名为自适应双分支促进网络（ADPN），由清...

AIGC 2024-01-06 人工智能

890阅读

语言模型是如何感知时间的？「时间向量」了解一下

语言模型究竟是如何感知时间的？如何利用语言模型对时间的感知来更好地控制输出甚至了解我们的大脑？最近，来自华盛顿大学和艾伦人工智能研究所的一项研究提供了一些见解。他们的实验结果表明，时间变化在一定程度上被编码在微调模型的权重空间中，并且权重插值可以帮助自定...

人工智能 2024-01-06 人工智能

829阅读

无需文本标注，TF-T2V把AI量产视频的成本打下来了！华科阿里等联合打造

在过去短短两年内，随着诸如LAION-5B 等大规模图文数据集的开放，Stable Diffusion、DALL-E2、ControlNet、Composer ，效果惊人的图片生成方法层出不穷。图片生成领域可谓狂飙突进。然而，与图片生成相比，视频生成仍存...

生成式AI 2024-01-06 人工智能

825阅读

看见这张图没有，你就照着画：谷歌图像生成AI掌握多模态指令

用图2的风格画图1的猫猫并给它戴上一顶帽子。谷歌新设计的一种图像生成模型已经能做到这一点了!通过引入指令微调技术，多模态大模型可以根据文本指令描述的目标和多张参考图像准确生成新图像，效果堪比 PS 大神抓着你的手助你 P 图。在使用大型语言模型（LLM...

AIGC 2024-01-06 人工智能

836阅读

一个评测模型+10个问题，摸清盘古、通义千问、文心一言、ChatGPT的“家底”！...

‍数据智能产业创新服务媒体 ——聚焦数智 · 改变商业毫无疑问，全球已经在进行大模型的军备竞赛了，“有头有脸”的科技巨头都不会缺席。昨天阿里巴巴内测了通义千问，今天华为公布了盘古大模型的最新进展。不久前百度公布了文心一言...

生成式AI 2024-01-06 人工智能

969阅读

精调训练中文LLaMA模型实战教程，民间羊驼模型

羊驼实战系列索引博文1：本地部署中文LLaMA模型实战教程，民间羊驼模型博文2：本地训练中文LLaMA模型实战教程，民间羊驼模型博文3：精调训练中文LLaMA模型实战教程，民间羊驼模型（本博客）简介在学习完上篇【博文2：本地训练中文LLaM...

大数据 2024-01-06 人工智能

864阅读

AIGC困局与Web3破圈之道

最近一年，随着 AIGC（AI-Generated Content）技术的发展壮大，越来越多的人感受到了它的恐怖之处。AI 降低了创作门槛，使每个普通人都有机会展现自己的创造力，做出不输专业水平的作品。但是就在全民 AI 作图的进程中，艺术家好像与其站在...

大数据 2024-01-05 人工智能

856阅读

[Stable Diffusion进阶篇]使用Roop插件一键换脸

AI领域大神s0md3v，开源了一个用单图就可以进行视频换脸的项目Roop。你只需要一张所需脸部的图像，没有数据集，无需训练，10秒钟一键换脸。本文介绍ROOP本地部署的安装说明 1.安装ROOP插件方法1：在SD--扩展--从网址安...

大数据 2024-01-05 人工智能

1229阅读

Instruct-Imagen官网体验入口 AI多模态图像生成模型软件免费下载地址

Instruct-Imagen是一个多模态图像生成模型，专注于处理异构图像生成任务，并在未知任务中展现出良好的泛化能力。该模型通过引入多模态指令，利用自然语言整合不同模态（如文本、边缘、风格、主题等），标准化丰富的生成意图。它在预训练文本到图像扩散模型上进...

人工智能 2024-01-05 人工智能

898阅读

大模型入局传统算法，LLMZip基于LLaMA-7B实现1MB文本压缩率90%！

论文链接： https://arxiv.org/abs/2306.04050 随着以ChatGPT、GPT-4为代表的AI大模型逐渐爆火进入公众视野，各行各业都开始思考如何更好的使用和发展自己的大模型，有一些评论甚至认为大模型是以人工智能为标志的...

人工智能 2024-01-05 人工智能

989阅读

谷歌研究团队推新AI方法SynCLR:从合成图像和字幕中学习视觉表征

近期，Google Research和MIT CSAIL共同推出了一项名为SynCLR的新型人工智能方法，该方法旨在通过使用合成图像和字幕，实现对视觉表征的学习，摆脱对真实数据的依赖。 SynCLR的工作原理研究团队首先提出了一个三阶段的方法。首先，在...

大数据 2024-01-05 人工智能

821阅读

DiffusionLight:用AI绘制铬球精准评估照片光照环境

DiffusionLight 是一种使用生成的镀铬球来估计图像中的光照的方法。研究人员开发了一种简单但有效的技术来估计单个输入图像中的照明。他们使用在数十亿张标准图像上训练的扩散模型来渲染输入图像中的铬球并将其用作光探针。这种方法有多种应用，包括将虚拟...

人工智能 2024-01-05 人工智能

926阅读

aAMUSEd官网体验入口 AI自然语言处理工具软件免费下载地址

aAMUSEd是一个开源平台，提供各种自然语言处理（NLP）模型、数据集和工具。它包含一个基于MUSE的轻量级遮蔽图像模型（MIM），专用于文本到图像的生成。与潜在扩散（latent diffusion）方法相比，MIM需要更少的推理步骤，且更易于解释。此...

AIGC 2024-01-05 人工智能

826阅读

Github爆火AI语音克隆项目OpenVoice，精准进行声音复刻

最近，Github上的一个名为OpenVoice的AI语音克隆项目爆火，该项目由myshell-ai开源，仅开源了不到三周，就有了6.1k的star。 OpenVoice仅需参考说话者的短音频片段，即可复制其声音并生成多种语言的语音。这一技术不仅实现了对音...

人工智能 2024-01-05 人工智能

1340阅读

谷歌家务机器人单挑斯坦福炒虾机器人！端茶倒水逗猫，连甩三连弹开打

火爆全网的斯坦福炒虾机器人，一天之内人气暴涨。毕竟这样能炒菜能洗碗的全能机器人，谁不想带一个回家，把自己从家务中解放出来呢！据说，这个项目是斯坦福华人团队花了三个月的时间做出来的。今天，团队直接放出了更多细节。这个机器人的技能多种多样，令人眼...

人工智能 2024-01-05 人工智能

866阅读

Embedchain官网体验入口 AI应用开发框架软件免费下载地址

Embedchain是一个开源的 RAG (Retrieval-Augmented Generation 框架，旨在简化 AI 应用的创建和部署。它的设计原则是“常规但可配置”，适用于软件工程师和机器学习工程师。Embedchain 简化了 RAG 应用...

生成式AI 2024-01-05 人工智能

845阅读

突破Pytorch核心点，优化器！！

嗨，我是小壮！今儿咱们聊聊Pytorch中的优化器。优化器在深度学习中的选择直接影响模型的训练效果和速度。不同的优化器适用于不同的问题，其性能的差异可能导致模型更快、更稳定地收敛，或者在某些任务上表现更好。因此，选择合适的优化器是深度学习模型调优中...

人工智能 2024-01-05 人工智能

854阅读

谨慎采用人工智能的最佳实践

为了助力我们正确运用人工智能，以下提供几点建议，在实践使用人工智能时需谨记这些建议，以便您能够牢固掌舵，安全驾驭人工智能。译自Treading Carefully: Best Practices When Adopting AI，作者 Tim Bank...

大数据 2024-01-05 人工智能

880阅读

图解tinyBERT模型——BERT模型压缩精华

译者 | 朱先忠审校 | 重楼简介近年来，大型语言模型的发展突飞猛进。BERT成为最受欢迎和最有效的模型之一，可以高精度地解决各种自然语言处理（NLP）任务。继BERT模型之后，一组其他的模型也先后出现并各自展示出优秀的性能。不难看到一个明显趋势...

AIGC 2024-01-05 人工智能

1058阅读

Stable Diffusion 系列教程 - 3 模型下载和LORA模型的小白入门

首先，一个比较广泛的模型下载地址为：Civitai Models | Discover Free Stable Diffusion Models 黄框是一些过滤器，比如checkpoints可以理解为比如把1.5版本的SD模型拷贝一份后交叉识别新的画...

AIGC 2024-01-05 人工智能

2124阅读

pytorch快速训练ai作画模型的python代码

在 PyTorch 中训练 AI 作画模型的基本步骤如下: 准备数据集: 需要准备一个包含许多图像的数据集, 这些图像可以是手绘的或者是真实的图像. 定义模型: 选择一个适当的深度学习模型, 并使用 PyTorch 定义该模型. 例如...

人工智能 2024-01-05 人工智能

947阅读

人工智能生成内容（AIGC）总览记录（认知篇）！！！

文章目录一、AIGC 引入 1.1 AIGC 定义 1.2 AIGC 历史沿革（了解） 1.3 AIGC 技术演进二、AIGC 大模型 2.1 视觉大模型提升 AIGC 感知能力 2.2 语言大模型增强 AIGC 认知能力 2.3 多...

AIGC 2024-01-05 人工智能

1845阅读

斯坦福炒虾机器人爆火全网！华人团队成本22万元，能做满汉全席还会洗碗

今天，会做一大桌子菜的斯坦福机器人Mobile ALOHA刷屏全网。滑蛋虾仁、干贝烧鸡、蚝油生菜，色香味俱全，看着很诱人。就拿滑蛋虾仁这道菜来说，Mobile ALOHA在烧水的过程中先打上3颗鸡蛋，然后把虾仁放到水中焯熟，平底锅倒入鸡蛋液再加入...

AIGC 2024-01-04 人工智能

862阅读

Meta AI发布炸裂项目audio2photoreal 可将音频生成全身逼真的虚拟人物形象

Meta AI最近发布了一项引人注目的技术，他们成功地开发出一种能够从音频中生成逼真的虚拟人物形象的系统。这个系统能够根据多人对话中的语音生成与对话相对应的逼真面部表情、完整身体和手势动作。这些虚拟人物不仅在视觉上非常逼真，而且能够准确地反映出对话中的手...

人工智能 2024-01-04 人工智能

1006阅读

大模型中幻觉缓解技术的综合调查

大型语言模型（LLMs）是具有大量参数和数据的深度神经网络，能够在自然语言处理（NLP）领域实现多种任务，如文本理解和生成。近年来，随着计算能力和数据规模的提升，LLMs取得了令人瞩目的进展，如GPT-4、BART、T5等，展现了强大的泛化能力和创造力。...

人工智能 2024-01-04 人工智能

1278阅读

AIGC入门系列1：感性的认识扩散模型

1、序言大家好，欢迎来到AI手工星的频道，我是专注AI领域的手工星。AIGC已经成为AI又一个非常爆火的领域，并且与之前的AI模型不同，AIGC更适合普通人使用，我们不仅可以与chatgpt对话，也能通过绘画模型生成想要的图片。很多朋友都想去深入的了解...

人工智能 2024-01-04 人工智能

865阅读

VCoder官网体验入口 AI图像语义理解app软件免费下载地址

VCoder是一个适配器，通过辅助感知模式作为控制输入，来提高多模态大型语言模型在对象级视觉任务上的性能。VCoder LLaVA是基于LLaVA-1. 5 构建的，不对LLaVA-1. 5 的参数进行微调，因此在通用的问答基准测试中的性能与LLaVA-1...

AIGC 2024-01-04 人工智能

795阅读

微软研究人员推新AI方法，用合成数据改进高质量文本嵌入

微软公司的研究团队最近提出了一种独特且简单的方法，用于生成高质量的文本嵌入。这种新方法仅使用合成数据和极少的训练步骤（少于1，000步），就取得了令人瞩目的成果。相比于现有的方法，该方法不依赖于多阶段的预训练和有限的标记数据微调，避免了繁琐的训练流程和手动...

生成式AI 2024-01-04 人工智能

836阅读

李飞飞团队新作：AI透视眼，穿越障碍看清你，渲染遮挡人体有新突破了

AR/VR 、电影和医疗等领域都在广泛地应用视频渲染人类形象。由于单目摄像头的视频获取较为容易，因此从单目摄像头中渲染人体一直是研究的主要方式。Vid2Avatar、MonoHuman 和 NeuMan 等方法都取得了令人瞩目的成绩。尽管只有一个摄...

生成式AI 2024-01-04 人工智能

826阅读

让机器人感知你的「Here you are」，清华团队使用百万场景打造通用人机交接

来自清华大学交叉信息研究院的研究者提出了「GenH2R」框架，让机器人学习通用的基于视觉的人机交接策略（generalizable vision-based human-to-robot handover policies）。这种可泛化策略使得机器人能更...

人工智能 2024-01-04 人工智能

819阅读

[linux-sd-webui]api化之训练lora

lora的训练使用的文件是https://github.com/Akegarasu/lora-scripts lora训练是需要成对的文本图像对的，需要准备相应的训练数据。 1.训练数据准备使用deepbooru/blip生成训练数据，建筑类建议使...

AIGC 2024-01-04 人工智能

1038阅读

端到端的自动驾驶会取代Apollo、autoware这类框架吗？

本文经自动驾驶之心公众号授权转载，转载请联系出处。 Rethinking the Open-Loop Evaluation of End-to-End Autonomous Driving in nuScenes 作者单位：百度作者：共一 Jian...

人工智能 2024-01-04 人工智能

929阅读

人工智能利用深度学习技术增强高级驾驶辅助系统(ADAS)

译者 | 李睿审校 | 重楼人工智能和机器学习利用深度学习技术的优势，使高级驾驶辅助系统(ADAS 发生了重大变革。ADAS在很大程度上依赖深度学习来分析和解释从各种传感器获得的大量数据。摄像头、激光雷达(光探测和测距、雷达和超声波传感器都是传感器...

大数据 2024-01-04 人工智能

980阅读

Stable Diffusion (持续更新)

引言本文的目的为记录stable diffusion的风格迁移，采用diffusers example中的text_to_image和textual_inversion目录 2023.7.11 收集了6张水墨画风格的图片，采用textual_...

大数据 2024-01-04 人工智能

934阅读

AIGC | 数据驱动的室内场景智能灯光设计系统，效果媲美人类设计师

专题介绍 AIGC（人工智能创作内容）作为内容生产新范式，能够把创造和知识工作的边际成本降至零，以产生巨大的劳动生产率和经济价值。而元宇宙是一个需要海量内容数据的虚拟世界，也是AIGC的主战场。渲染引擎作为元宇宙最重要的基础设施，与AI关联的更多...

生成式AI 2024-01-04 人工智能

1107阅读