预训练第29页 - AIGC资讯

AIGC 能如何应用到游戏制作领域？

AIGC 能如何应用到游戏制作领域？（AI画作《太空歌剧院》） 2022年，Midjourney生成的一幅AI画作《太空歌剧院》横空出世，让AIGC火了一把。游戏中为何需要AIGC？传统游戏制作存在“质量、速度、成本”中只能有两个的不...

AIGC 2024-01-15 人工智能

1109阅读

即插即用，完美兼容：SD社区的图生视频插件I2V-Adapter来了

图像到视频生成（I2V）任务旨在将静态图像转化为动态视频，这是计算机视觉领域的一大挑战。其难点在于从单张图像中提取并生成时间维度的动态信息，同时确保图像内容的真实性和视觉上的连贯性。大多数现有的 I2V 方法依赖于复杂的模型架构和大量的训练数据来实现这一...

生成式AI 2024-01-15 人工智能

889阅读

AI看图猜位置，准确率超90%！斯坦福最新PIGEON模型：40%预测误差不到25公里

随手在网络上发布的一张照片，能暴露多少信息？外国的一位博主@rainbolt就长年接受这种「照片游戏」的挑战，网友提供照片，他来猜测照片的具体拍摄地，有些照片甚至还能猜到具体的航班细节。是不是细思极恐？但「照片挑战」也同样抚慰了很多人心中的遗憾，...

生成式AI 2024-01-15 人工智能

1029阅读

【计算机视觉 | 目标检测】术语理解9：AIGC的理解，对比学习，解码器，Mask解码器，耦合蒸馏，半耦合，图像编码器和组合解码器的耦合优化

文章目录一、AIGC的理解二、对比学习三、解码器四、Mask解码器五、耦合蒸馏六、半耦合七、图像编码器和组合解码器的耦合优化一、AIGC的理解 AIGC指的是使用人工智能技术自动生成的各类数字内容,包括文本、图像、...

AIGC 2024-01-14 人工智能

916阅读

LLMs之LLaMA-2：LLaMA-2的简介(技术细节)、安装、使用方法(开源-免费用于研究和商业用途)之详细攻略

LLMs之LLaMA-2：LLaMA-2的简介(技术细节、安装、使用方法(开源-免费用于研究和商业用途之详细攻略导读：2023年7月18日，Meta重磅发布Llama 2！这是一组预训练和微调的大型语言模型（LLM），规模从70亿到700亿个...

AIGC 2024-01-14 人工智能

1223阅读

实战AI大模型：AIGC及经典模型

今天，人工智能技术的快速发展和广泛应用已经引起了大众的关注和兴趣，它不仅成为技术发展的核心驱动力，更是推动着社会生活的全方位变革。特别是作为AI重要分支的深度学习，通过不断刷新的表现力已引领并定义了一场科技革命。大型深度学习模型（简称AI大模型）以其强大的...

大数据 2024-01-14 人工智能

1209阅读

Stable Diffusion的入门介绍和使用教程

Stable Diffusion是一个文本到图像的潜在扩散模型，由CompVis、Stability AI和LAION的研究人员和工程师创建。它使用来自LAION-5B数据库子集的512x512图像进行训练。使用这个模型，可以生成包括人脸在内的任何图...

AIGC 2024-01-14 人工智能

1075阅读

【AIGC专题】Stable Diffusion 从入门到企业级实战0403

一、前言本章是《Stable Diffusion 从入门到企业级实战》系列的第四部分能力进阶篇《Stable Diffusion ControlNet v1.1 图像精准控制》第03节，利用Stable Diffusion ControlNet Ca...

大数据 2024-01-14 人工智能

822阅读

Stable Diffusion-生式AI的新范式

! 扩散模型（Stable Diffusion 现在是生成图像的首选模型。由于扩散模型允许我们以提示( prompts 为条件生成图像，我们可以生成我们所选择的图像。在这些文本条件的扩散模型中，稳定扩散模型由于其开源性而最为著名。在这篇文章中，我们将...

人工智能 2024-01-14 人工智能

933阅读

《2024 AIGC 应用层十大趋势白皮书》：近屿智能OJAC带您一起探索AI未来

Look！?我们的大模型商业化落地产品 ?更多AI资讯请??关注 Free三天集训营助教在线为您火热答疑??‍? 近日国际知名咨询机构IDC发布《2024 AIGC 应用层十大趋势白皮书》的发布，无疑为我们展现了AIGC技术在未来几年的发展趋势和方...

大数据 2024-01-14 人工智能

894阅读

OpenAI的人工智能语音识别模型Whisper详解及使用

1 whisper介绍拥有ChatGPT语言模型的OpenAI公司，开源了 Whisper 自动语音识别系统，OpenAI 强调 Whisper 的语音识别能力已达到人类水准。 Whisper是一个通用的语音识别模型，...

生成式AI 2024-01-14 人工智能

3397阅读

大模型应用实践：AIGC探索之旅

随着OpenAI推出ChatGPT，AIGC迎来了前所未有的发展机遇。大模型技术已经不仅仅是技术趋势，而是深刻地塑造着我们交流、工作和思考的方式。本文介绍了笔者理解的大模型和AIGC的密切联系，从历史沿革到实际应用案例，再到面临的技术挑战和伦理监管问题...

AIGC 2024-01-14 人工智能

1350阅读

国内多所高校共建开源社区LAMM，加入多模态语言模型大家庭的时候到了

ChatGPT问世以来，大语言模型（LLM）实现了跳跃式发展，基于自然语言进行人机交互的AI范式得到广泛运用。然而，人类与世界的交互中不仅有文本，其他诸如图片、深度等模态也同样重要。然而，目前的多模态大语言模型（MLLM）研究大多数闭源，对高校和大多数研...

大数据 2024-01-14 人工智能

1026阅读

GauHuman开源：基于Gaussian Splatting，高质量3D人体快速重建和实时渲染框架

论文名称：GauHuman: Articulated Gaussian Splatting from Monocular Human Videos 论文下载地址：https://arxiv.org/abs/2312.02973 项目主页：https...

生成式AI 2024-01-14 人工智能

1098阅读

大模型相关技术综述

多模态大模型&大模型训练语料持续迭代已经开始整理多模态-视觉部分：主要分为一下几块多模态信息压缩模型（clip、vit、swiT）生成模型（vae、gan、flow、ddpm、sde... 其它多模态大模型（语音...

AIGC 2024-01-14 人工智能

1147阅读

大模型恋爱神器！16种MBTI自由定制，北大ChatLaw团队出品

北大团队新作，让大模型拥有个性! 而且还是自定义那种，16种MBTI都能选。图源备注：图片由AI生成，图片授权服务商Midjourney 这样一来，即便是同一个大模型，不同性格下的回答都不一样。比如提问:你周末喜欢干什么? 这样能干啥呢?北大的童...

大数据 2024-01-14 人工智能

926阅读

从GPT-4、文心一言再到Copilot，AIGC的长期价值被逐渐确立

@数科星球原创作者丨苑晶编辑丨十里香动荡和富有戏剧性的一周行将结束，在本周，百度发布文心一言、OpenAI发布GPT-4、微软发布Microsoft 365 Copilot。围绕科技圈，人们的话题从赞叹GPT-4的强大、百度的股价再...

大数据 2024-01-14 人工智能

825阅读

Llama 2- Open Foundation and Fine-Tuned Chat Models＜2＞

3.2 人类反馈强化学习（RLHF） RLHF 是一种模型训练过程，应用于微调的语言模型，以进一步使模型行为与人类偏好和指令遵循保持一致。我们收集代表根据经验采样的人类偏好的数据，人类注释者可以选择他们更喜欢的两个模型输出中的哪一个。这种人类反馈随后用...

大数据 2024-01-14 人工智能

1038阅读

AIGC: 关于ChatGPT这个智能工具带来的几点思考

ChatGPT的出现 2022年11月底，ChatGPT 上线，引爆 AI 圈和科技圈，2023年春节后, 人人都开始关注并讨论这项新技术它是 OpenAI 研发的智能聊天工具, 基于GPT语言模型，模拟人类的对话方式默认只能用文字进行交互，...

生成式AI 2024-01-14 人工智能

937阅读

打破信息差！一款让人惊艳的大模型3D可视化工具！

近日，一位来自新西兰的小哥Brendan Bycroft在技术圈掀起了一股热潮。他创作的一项名为大模型3D可视化的项目，不仅登上了Hacker News的榜首，而且其震撼的效果更是让人瞠目结舌。通过这个项目，你将在短短几秒钟内完全理解LLM（Large...

人工智能 2024-01-14 人工智能

941阅读

一文讲清大模型AI应用架构

本文转载自微信公众号「产品二姐」，作者产品二姐。转载本文请联系产品二姐公众号。如果说 2023 年是大模型大爆发的一年，这一年的机会主要给了大厂或者拿到大笔融资的创业者；那么 2024 年将是 AI 应用大爆发的一年，也意味着普通人有更多的机会加入这...

人工智能 2024-01-14 人工智能

1028阅读

训练Stable Diffusion(SD) Lora模型巨详细教程赛博丹炉/青龙脚本/秋叶云端使用教程主用赛博丹炉（道玄）巨小白巨啰嗦，全是干货和踩过的坑

前言试了很多的sd训练，尤其是sd的lora的训练，问题一大堆，现在写个博客汇总一下一、一些理论知识记录一些杂七杂八各种博客看到的训练经验。 1. 对于sd1.5训练出来2G左右大小就是有效模型，WebUI默认FP16。【AI绘画】模型...

大数据 2024-01-14 人工智能

5337阅读

大语言模型漏洞缓解指南

虽然大语言模型(LLM 应用正在全球快速普及，但企业对大语言模型的威胁态势仍然缺乏全面了解。面对大语言模型风险的不确定性，企业希望在保障其安全性的基础上加快应用脚步，用人工智能提升企业核心竞争力，这意味着企业的CISO面临着理解和应对新兴人工智能威胁...

大数据 2024-01-13 人工智能

951阅读

AIGC技术研究与应用 ---- 下一代人工智能：新范式！新生产力！（2.4 -大模型发展历程之多模态）

文章大纲什么是多模态为什么 Transformer 也是多模态模型的基础架构视觉 Transformer 和 Text Transformer 如何结合 - contrastive learning 对比学习 stable diffu...

生成式AI 2024-01-13 人工智能

1110阅读

AIGC：阿里开源大模型通义千问部署与实战

1 引言通义千问-7B（Qwen-7B）是阿里云研发的通义千问大模型系列的70亿参数规模的模型。Qwen-7B是基于Transformer的大语言模型, 在超大规模的预训练数据上进行训练得到。预训练数据类型多样，覆盖广泛，包括大量网络文本、专业书籍、代...

AIGC 2024-01-13 人工智能

1527阅读

为大模型恶补数学，上交开源MathPile语料库，95亿tokens，还可商用

在当前智能对话模型的发展中，强大的底层模型起着至关重要的作用。这些先进模型的预训练往往依赖于高质量且多样化的语料库，而如何构建这样的语料库，已成为行业中的一大挑战。在备受瞩目的 AI for Math 领域，由于高质量的数学语料相对稀缺，这限制了生成式...

AIGC 2024-01-13 人工智能

882阅读

Stable Diffusion - 超分辨率插件 StableSR v2 (768x768) 配置与使用

欢迎关注我的CSDN：https://spike.blog.csdn.net/ 本文地址：https://spike.blog.csdn.net/article/details/131582734 论文：Exploiting Diffusion...

AIGC 2024-01-13 人工智能

1243阅读

AIGC之论文笔记DALL-E

文章目录 Zero-Shot Text-to-Image Generation 一. 简介二. 方法 2.1. 第一阶段：Learning the visual codebook 2.1.1 回顾VQ-VAE 2.1.2...

生成式AI 2024-01-13 人工智能

951阅读

为什么人工智能如此需要资源？

截至2023年底，任何关于生成式人工智能需要多少能源的预测都是不准确的。头条新闻倾向于猜测“人工智能需要5倍、10倍、30倍的电力”和“足够运行10万个家庭的电力”等。与此同时，数据中心新闻等专业出版物的报道称，功率密度将上升到每机架50千瓦或100千...

人工智能 2024-01-13 人工智能

830阅读

再薅！Pika全球开放使用；字节版GPTs免费不限量；大模型应用知识地图；MoE深度好文；2024年AIGC发展轨迹；李飞飞最新自传 | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦！ ? 终于！AI视频生成平台 Pika 面向所有用户开放网页端 https://twitter.com/pika_labs Pika...

大数据 2024-01-13 人工智能

1025阅读

Stable Diffusion架构的3D分子生成模型 GeoLDM - 测评与代码解析

之前，向大家介绍过3D分子生成模型 GeoLDM。 GeoLDM按照Stable Diffusion架构，将3D分子生成的扩散过程运行在隐空间内，优化了基于扩散模型的分子生成。可能是打开Drug-AIGC的关键之作。让精确控制分子生成有了希望。...

大数据 2024-01-13 人工智能

1349阅读

LLMs模型速览（GPTs、LaMDA、GLM/ChatGLM、PaLM/Flan-PaLM、BLOOM、LLaMA、Alpaca）

文章目录一、 GPT系列 1.1 GPTs（OpenAI，2018——2020） 1.2 InstructGPT（2022-3） 1.2.1 算法 1.2.2 损失函数 1.3 ChatGPT（2022.11.30） 1.4 ChatG...

AIGC 2024-01-09 人工智能

1319阅读

蚂蚁营销推荐场景上的因果纠偏方法

一、因果纠偏的背景 1、偏差的产生推荐系统里根据收集的数据来训练推荐模型，给用户推荐一个合适的 item，当用户与这个 item 产生交互后，数据又会被收集用于继续训练模型，从而形成一个闭环。但是这个闭环当中可能会存在各种各样的影响因素，因此会产生误差...

生成式AI 2024-01-09 人工智能

866阅读

Textual Inversion: 一种精调Stable Diffusion模型的方法

引言最近的文本到图像Stable Diffusion （SD）模型已经证明了使用文本提示合成新颖场景的前所未有的能力。这些文本到图像的模型提供了通过自然语言指导创作的自由。然而，它们的使用受到用户描述特定或独特场景、艺术创作或新物理产品的能力的限制。...

生成式AI 2024-01-09 人工智能

1066阅读

AIGC在趣丸科技广告素材场景下赋能业务的探索实践

AIGC 兴起，在各行各业得到应用。广告作为用户增长的有效手段，经久不衰，日益增长的广告创意素材素材需求与设计师人工制作素材产能不足的矛盾问题凸显，AIGC 技术的应用能够在多模态素材上发挥作用，为广告投放业务赋能。趣丸科技资深研发工程师阮陈贵 ...

人工智能 2024-01-08 人工智能

1435阅读

Jetson Orin安装riva以及llamaspeak，使用 Riva ASR/TTS 与 Llama 进行实时交谈，大语言模型成功运行笔记

NVIDIA 的综合语音 AI 工具包 RIVA 可以处理这种情况。此外，RIVA 可以构建应用程序，在本地设备（如 NVIDIA Jetson）上处理所有这些内容。 RIVA 是一个综合性库，包括：自动语音识别（ASR）文本转语音合成（TT...

生成式AI 2024-01-08 人工智能

1272阅读

Stable Diffusion 文生图技术原理

图像生成模型简介图片生成领域来说，有四大主流生成模型：生成对抗模型（GAN）、变分自动编码器（VAE）、流模型（Flow based Model）、扩散模型（Diffusion Model）。从2022年开始，主要爆火的图片生成模型是Diffusi...

人工智能 2024-01-08 人工智能

1970阅读

13个优秀开源语音识别引擎

语音识别（ASR）在人机交互方面发挥着重要的作用，可用于：转录、翻译、听写、语音合成、关键字定位、语音日记、语言增强等场景。语音识别基本过程一般包括：分析音频、音频分解、格式转换、文本匹配，但实际的语音识别系统可能会更复杂，并且可能包括其他步骤和功能组件...

人工智能 2024-01-08 人工智能

1273阅读

在灾难推文分析场景上比较用 LoRA 微调 Roberta、Llama 2 和 Mistral 的过程及表现

引言自然语言处理 (NLP 领域的进展日新月异，你方唱罢我登场。因此，在实际场景中，针对特定的任务，我们经常需要对不同的语言模型进行比较，以寻找最适合的模型。本文主要比较 3 个模型: RoBERTa、Mistral-7B 及 Llama-2...

人工智能 2024-01-08 人工智能

1116阅读

400万token上下文、推理再加速46%！最新开源方案升级MIT成果，推理成本再降低

22倍加速还不够，再来提升46%，而且方法直接开源！这就是开源社区改进MIT爆火项目StreamingLLM的最新成果。 StreamingLLM可以在不牺牲生成效果、推理速度的前提下，实现多轮对话共400万个token，22.2倍推理速度提升。该项...

大数据 2024-01-08 人工智能

951阅读

大模型无限流式输入推理飙升46%！国产开源加速「全家桶」，打破多轮对话长度限制

在大型语言模型（LLM）的世界中，处理多轮对话一直是一个挑战。前不久麻省理工Guangxuan Xiao等人推出的StreamingLLM，能够在不牺牲推理速度和生成效果的前提下，可实现多轮对话总共400万个token的流式输入，22.2倍的推理速度提升...

人工智能 2024-01-08 人工智能

1142阅读

微软祭出代码大模型WaveCoder！四项代码任务两万个实例数据集，让LLM泛化能力飙升

用高质量数据集进行指令调优，能让大模型性能快速提升。对此，微软研究团队训练了一个CodeOcean数据集，包含了2万个指令实例的数据集，以及4个通用代码相关任务。与此同时，研究人员微调了一个代码大模型WaveCoder。论文地址：https://...

大数据 2024-01-08 人工智能

916阅读

吃了几个原作者才能生成这么逼真的效果？文生图涉嫌视觉「抄袭」

不久之前，《纽约时报》指控 OpenAI 涉嫌违规使用其内容用于人工智能开发的事件引起了社区极大的关注与讨论。 GPT-4 输出的许多回答中，几乎逐字逐句地抄袭了《纽约时报》的报道：图中红字是 GPT-4 与《纽约时报》报道重复的部分。对此，各个专...

人工智能 2024-01-08 人工智能

907阅读

百度文心一言，是中国版的ChatGPT吗？

百度文心一言，是中国版的ChatGPT吗？文心一言发布会网友评论：百度在让人失望这件事上，从来没让人失望过！技术原理一句没有，商业价值滔滔不绝。 ChatGPT？CheatGPT！难怪暴跌，还没看两眼就困了，没话可以直播咬打火机，股...

AIGC 2024-01-08 人工智能

847阅读

轻量级模型，重量级性能，TinyLlama、LiteLlama小模型火起来了

当大家都在研究大模型（LLM）参数规模达到百亿甚至千亿级别的同时，小巧且兼具高性能的小模型开始受到研究者的关注。小模型在边缘设备上有着广泛的应用，如智能手机、物联网设备和嵌入式系统，这些边缘设备通常具有有限的计算能力和存储空间，它们无法有效地运行大型语...

AIGC 2024-01-08 人工智能

873阅读

【 stable diffusion LORA模型训练最全最详细教程】

个人网站：https://tianfeng.space/ 文章目录一、前言二、朱尼酱的赛博丹炉 1.介绍 2.解压配置 3.使用训练准备首页设置上传素材查看进度三、秋叶的lora训练器 1.下载 2.预处理 3.参...

人工智能 2024-01-08 人工智能

1830阅读

英伟达推新AI语音识别模型Parakeet 号称优于Whisper

领先的开源对话 AI 工具包 NVIDIA NeMo宣布推出 Parakeet ASR 模型系列，这是一系列最先进的自动语音识别（ASR）模型，能够以出色的准确性转录英语口语。Parakeet ASR 模型与 Suno.ai 合作开发，是语音识别领域的一大...

人工智能 2024-01-08 人工智能

1016阅读

谷歌DeepMind最新研究：对抗性攻击对人类也有效，人类和AI都会把花瓶认成猫！

【新智元导读】神经网络由于自身的特点而容易受到对抗性攻击，然而，谷歌DeepMind的最新研究表明，我们人类的判断也会受到这种对抗性扰动的影响人类的神经网络（大脑）和人工神经网络(ANN 的关系是什么? 有位老师曾经这样比喻:就像是老鼠和米老鼠的关系。...

人工智能 2024-01-08 人工智能

793阅读

【好书推荐-第二期】《实战AI大模型》：带你走进大模型GPTs、AIGC的世界（李开复、周鸿祎、颜水成倾力推荐）

? 作者介绍：我是程序员洲洲，一个热爱写作的非著名程序员。CSDN全栈优质领域创作者、华为云博客社区云享专家、阿里云博客社区专家博主、前后端开发、人工智能研究生。公粽号：程序员洲洲。 ? 本文专栏：本文收录于洲洲的《送书福利》系列专栏，该专栏福利多多，只需...

生成式AI 2024-01-08 人工智能

1231阅读

AIGC 综述 2023：A History of Generative AI from GAN to ChatGPT

GAI：发展历史，核心技术，应用领域以及未来发展摘要 1、引言 1.1、主要贡献 1.2、组织结构 2、生成式AI的发展历史 2.1、NLP领域的发展 2.2、CV领域的发展 2.3、CV与NLP的融合 3、AIGC的核心技术基础...

人工智能 2024-01-08 人工智能

1493阅读