预训练第27页 - AIGC资讯

[NLP]LLaMA与LLamMA2解读

摘要 Meta最近提出了LLaMA(开放和高效的基础语言模型模型参数包括从7B到65B等多个版本。最值得注意的是，LLaMA-13B的性能优于GPT-3，而体积却小了10倍以上，LLaMA-65B与Chinchilla-70B和PaLM-540B具有竞...

人工智能 2024-01-20 人工智能

1691阅读

用通俗易懂的方式讲解大模型：一个强大的 LLM 微调工具 LLaMA Factory

LLM（大语言模型）微调一直都是老大难问题，不仅因为微调需要大量的计算资源，而且微调的方法也很多，要去尝试每种方法的效果，需要安装大量的第三方库和依赖，甚至要接入一些框架，可能在还没开始微调就已经因为环境配置而放弃了。今天我们来介绍一个可以帮助大家快速...

生成式AI 2024-01-20 人工智能

2532阅读

全网最全AI绘画Stable Diffusion关键技术解析

背景很多人觉得AI绘画不稳定，对于以后是否替代插画师，摄影工作者，设计师，表示存疑，作为AI从业者本文从AI绘画关键技术分析，明白以前生产者肯定会被淘汰，现在没有到达黄金期。技术一定会让更多人失业，而我们拥抱变化，增强自身。 AI绘画中Stab...

生成式AI 2024-01-20 人工智能

1004阅读

【多模态】14、Segment Anything | Meta 推出超强悍可分割一切的模型 SAM

文章目录一、Intruduction 二、Segment Anything Task 三、Segment Anything Model 四、Segment Anything Data Engine 五、Segment Anything Dat...

大数据 2024-01-20 人工智能

2163阅读

AIGC原理：扩散模型diffusion综述一：面向视觉计算的扩散模型研究进展

论文地址：State of the Art on Diffusion Models for Visual Computing ? 贴一幅SGM（Score-based Generative Model）的原因是宋飏博士将他2019年提出的SMLD模型和20...

AIGC 2024-01-20 人工智能

1950阅读

AIGC、ChatGPT、GPT系列？我的认识

AIGC（AI generated content），新型内容生产方式。AIGC是利用人工智能技术来生成内容，也就是，它可以用输入数据生成相同或不同类型的内容，比如输入文字、生成文字，输入文字、生成图像等。 GPT-3是生成型的预训练变换模型，是...

大数据 2024-01-20 人工智能

920阅读

AIGC周报｜30秒定制一个文生图模型；60美元让AI玩转《我的世界》；手机版“文生图”模型：2秒不到出一张图

AIGC（AI Generated Content）即人工智能生成内容。近期爆火的 AI 聊天机器人 ChatGPT，以及 Dall·E 2、Stable Diffusion 等文生图模型，都属于 AIGC 的典型案例，它们通过借鉴现有的、人类创造的内容来...

人工智能 2024-01-20 人工智能

900阅读

新AI框架 AboutMe：用网页中自我描述来记录英语预训练数据过滤器的效果

随着自然语言处理和自然语言生成的进步，大型语言模型（LLMs）在实际应用中得到了广泛使用。由于它们能够模仿人类行为，并具有通用性，这些模型已经涉足各个领域。虽然这些模型引起了相当大的关注，但它们代表了一组受限和偏向的人类观点和知识。预训练数据的组成是造成...

AIGC 2024-01-19 人工智能

881阅读

AI视野：百度推视频生成模型UniVG；下一代大模型Llama3正在训练；腾讯推视频模型VideoCrafter2；TikTok测试AI作曲功能

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ ???AI应用 1、百度推出视频生...

人工智能 2024-01-19 人工智能

929阅读

llama.cpp模型推理之界面篇

目录前言一、llama.cpp 目录结构二、llama.cpp 之 server 学习 1. 介绍 2. 编译部署 3. 启动服务 4、扩展或构建其他的 Web 前端 5、其他前言在《基于llama.cpp学习开源LL...

大数据 2024-01-19 人工智能

1889阅读

最近读的AIGC相关论文思路解读

AIGC之SD可控生成论文阅读记录提示：本博客是作者本人最近对AIGC领域相关论文调研后，临时记录所用，所有观点都是来自作者本人局限理解，以及个人思考，不代表对。如果你也正好看过相关文章，发现作者的想法和思路有问题，欢迎评论区留言指正！既然是论...

生成式AI 2024-01-19 人工智能

976阅读

四种通过LLM进行文本知识图谱的构建方法对比介绍

我们在以前的文章中已经介绍了使用大语言模型将非结构化文本转换为知识图谱。但是对于知识图谱的创建是一个很复杂的过程，比如需要对属性增加限制，创建符合特定主题/模式的图谱，并且有时文档非常大，无法作为单个提示处理，所以在切分后的提示中创建的图谱需要前后一致。...

生成式AI 2024-01-19 人工智能

1006阅读

20%的杨幂+80%的泰勒长什么样？小红书风格化AI来了，可兼容SD和ControlNet

不得不说，现在拍写真真是“简单到放肆”了。真人不用出镜，不用费心凹姿势、搞发型，只需一张本人图像，等待几秒钟，就能获得7种完全不同风格: 仔细看，造型/pose全都给你整得明明白白，并且原图直出修也不用修了。这搁以前，不得在写真馆耗上至少整整一天，把...

生成式AI 2024-01-19 人工智能

846阅读

WidthFormer：实时自动驾驶！助力基于Transformer的BEV方案量产

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&行业理解基于BEV的transformer方案今年量产的主要方案，transformer结构和CNN相比，特征提取能力更强，但需要较多的算力，这也是为什么许多车上都是1~2颗orin...

人工智能 2024-01-19 人工智能

1214阅读

常见大模型对比[ChatGPT（智能聊天机器人）、Newbing(必应)、Bard（巴德）、讯飞星火认知大模型（SparkDesk）、ChatGLM-6B]

目录 1 引言 2 选取常见的大模型作为对比项 2.1什么是大模型 2.2 常见大模型 3 相关的大模型介绍和功能 3.1 ChatGPT 3.1.1 ChatGPT的介绍 3.1.2 ChatGPT的原理 3.1.3 ChatGPT的特...

人工智能 2024-01-19 人工智能

1338阅读

AIGC必备知识点：你不可不知的CNN（卷积神经网络）-知识全解析！

Look！?我们的大模型商业化落地产品 ?更多AI资讯请??关注 Free三天集训营助教在线为您火热答疑??‍? 大家在谈论的卷积神经网络究竟是什么？(Convolutional Neural Network，CNN 是一类主要用于计算机视觉领域的...

人工智能 2024-01-19 人工智能

1128阅读

AI绘画与多模态原理解析：从CLIP到DALLE1/2、DALLE 3、Stable Diffusion、SDXL Turbo、LCM

前言终于开写本CV多模态系列的核心主题：stable diffusion相关的了，为何执着于想写这个stable diffusion呢，源于三点去年stable diffusion和midjourney很火的时候，就想写，因为经常被刷屏，但那会时...

生成式AI 2024-01-19 人工智能

3058阅读

开源 AI库Stable Diffusion 介绍

Stable Diffusion 是一个用于生成高质量 AI 绘画的 Python 库，以下是一些使用 Stable Diffusion 的基本步骤：安装 Stable Diffusion 库。您可以使用 pip 安装，命令如下： pip inst...

AIGC 2024-01-19 人工智能

1025阅读

免费商用 Meta 发布开源大语言模型 Llama 2

Meta 和微软深度合作，正式推出下一代开源大语言模型 Llama 2，并宣布免费提供给研究和商业使用。 Llama 2 论文地址：Llama 2: Open Foundation and Fine-Tuned Chat Models 据介...

大数据 2024-01-19 人工智能

1068阅读

AIGC系列之：ControlNet原理及论文解读

《Adding Conditional Control to Text-to-Image Diffusion Models》目录 1.背景介绍 2.原理详解 2.1 Controlnet 2.2 用于Stable Diffusion的Contr...

人工智能 2024-01-18 人工智能

1495阅读

字节跳动基础架构SRE-Copilot获得2023 CCF国际AIOps挑战赛冠军

近日，2023 CCF国际AIOps挑战赛决赛暨“大模型时代的AIOps”研讨会在北京成功举办，活动吸引了来自互联网、运营商、科研院所、高校、软硬件厂商等领域多名专家学者参与，为智能运维的前沿学术研究、落地生产实践打开了新思路。决赛中，从初赛两百多支...

生成式AI 2024-01-18 人工智能

1474阅读

国产开源模型标杆大升级，重点能力比肩ChatGPT！书生·浦语2.0发布，支持免费商用

1月17日，新一代大语言模型书⽣·浦语2.0（InternLM2）正式发布并开源。 2种参数规格、3种模型版本，共计6个模型，全部免费可商用。它支持200K超长上下文，可轻松读200页财报。200K文本全文范围关键信息召回准确率达95.62%。不...

生成式AI 2024-01-18 人工智能

943阅读

stable diffusion原理

1、Latent space 隐空间是压缩数据的一个表示。数据压缩的目的是学习数据中较重要的信息。以编码器-解码器网络为例，首先使用全卷积神经网(FCN 络学习图片特征，我们将特征提取中对数据的降维看作一种有损压缩。但是由于解码器需要重建(reconst...

生成式AI 2024-01-18 人工智能

847阅读

苹果AIM自回归视觉模型验证性能与模型规模有关

苹果公司的研究者通过自回归图像模型（AIM）验证了视觉模型“参数越多性能越强”的规律，进一步证明随着容量或预训练数据量的增加，模型能不断提升性能。AIM能有效利用大量未经整理的图像数据，训练方法和稳定性与最近的大型语言模型(LLM 类似。这一观察结果与之前...

人工智能 2024-01-18 人工智能

855阅读

LLaMA Pro: Progressive LLaMA with Block Expansion

Q: 这篇论文试图解决什么问题？ A: 这篇论文试图解决大型语言模型（LLMs）在特定领域（如编程、数学、生物医学或金融）能力不足的问题。尽管LLMs在多种现实世界任务中表现出色，但在某些特定领域仍然存在局限性，这阻碍了开发通用语言代理以应用于更广泛场景...

生成式AI 2024-01-18 人工智能

1081阅读

20%的杨幂+80%的泰勒长什么样？小红书风格化AI来了，可兼容SD和ControlNet

不得不说，现在拍写真真是“简单到放肆”了。真人不用出镜，不用费心凹姿势、搞发型，只需一张本人图像，等待几秒钟，就能获得7种完全不同风格：仔细看，造型/pose全都给你整得明明白白，并且原图直出修也不用修了。这搁以前，不得在写真馆耗上至少整整一天，...

生成式AI 2024-01-18 人工智能

875阅读

RoSA: 一种新的大模型参数高效微调方法

随着语言模型不断扩展到前所未有的规模，对下游任务的所有参数进行微调变得非常昂贵，PEFT方法已成为自然语言处理领域的研究热点。PEFT方法将微调限制在一小部分参数中，以很小的计算成本实现自然语言理解任务的最先进性能。 (RoSA 是一种新的PEFT技术...

AIGC 2024-01-18 人工智能

938阅读

AI图形设计工具Recraft完成1200万美元A轮融资，将构建自有基础模型

AI生成图像在世界各地引发争议，即便AI生成图像在选举中的使用在本周世界经济论坛上引起了关注，初创公司仍在推动为创作者提供的AI工具领域不断前行。 Recraft作为一款面向专业人士的AI图形设计生成器，已完成由硅谷Khosla Ventures领投的12...

人工智能 2024-01-18 人工智能

935阅读

20源代码模型的数据增强方法：克隆检测、缺陷检测和修复、代码摘要、代码搜索、代码补全、代码翻译、代码问答、问题分类、方法名称预测和类型预测对论文进行分组【网安AIGC专题11.15】

Data Augmentation Approaches for Source Code Models: A Survey 写在最前面对nlp领域其他方向的启发英文版：论文名片论文总结一个有意思的表 1.背景Background...

大数据 2024-01-18 人工智能

978阅读

昆仑天工SkyWork：更懂中文的AIGC开源模型

昆仑天工SkyWork系列AIGC开源模型，由奇点智源公司研发，在2022年12月发布，覆盖图像、文本、编程等多模态内容生成能力，包括绘画、文章续写、对话、中英翻译、推理、诗词对联、菜谱撰写、合同起草、代码补全等。昆仑天工SkyWork系列模型...

人工智能 2024-01-18 人工智能

1424阅读

马毅LeCun谢赛宁曝出多模态LLM重大缺陷！开创性研究显著增强视觉理解能力

Sam Altman在各种场合都提到，大语言模型的多模态能力，是未来AI技术能够造福人类的最亟待突破的领域。那么现在在多模态大模型的视觉功能能否达到与语言功能匹配的水平？当前多模态模型取得的进步很大程度上归功于大语言模型（LLM）的推理能力。但在视...

AIGC 2024-01-18 人工智能

1019阅读

几何纹理重建新SOTA！浙大提出SIFU：单图即可重建高质量3D人体模型

在AR、VR、3D打印、场景搭建以及电影制作等多个领域中，高质量的穿着衣服的人体3D模型非常重要。传统的方法创建这些模型不仅需要大量时间，还需要能够捕捉多视角照片的专业设备，此外还依赖于技术熟练的专业人员。与此相反，在日常生活中，我们最常见...

生成式AI 2024-01-18 人工智能

906阅读

ConvNet与Transformer谁更强？Meta评测4个领先视觉模型，LeCun转赞

如何根据特定需求选择视觉模型？ ConvNet/ViT、supervised/CLIP模型，在ImageNet之外的指标上如何相互比较？来自MABZUAI和Meta的研究人员发表的最新研究，在「非标准」指标上全面比较了常见的视觉模型。论文地址：ht...

生成式AI 2024-01-18 人工智能

859阅读

Stable-diffusion-webui 本地部署及使用

Stable-diffusion-webui 本地部署及使用本地部署stable-diffusion-webui(windows 1.安装conda； 2.创建conda env 和python 3.10.6； 3.更新pip； 4.安装...

人工智能 2024-01-18 人工智能

1257阅读

新一代注意力机制Lightning Attention-2：无限序列长度、恒定算力开销、更高建模精度

大语言模型序列长度的限制，极大地制约了其在人工智能领域的应用，比如多轮对话、长文本理解、多模态数据的处理与生成等。造成这一限制的根本原因在于当前大语言模型均采用的 Transformer 架构有着相对于序列长度的二次计算复杂度。这意味着随着序列长度的增加...

人工智能 2024-01-18 人工智能

962阅读

AIGC大模型必备知识——LLM ，你知道它是如何训练的吗？小白必读深度好文

Look！?我们的大模型商业化落地产品 ?更多AI资讯请??关注 Free三天集训营助教在线为您火热答疑??‍? 近年来，人工智能（AI）领域经历了令人瞩目的增长，尤其是自然语言处理（NLP）。你知道是什么推动了NLP领域的这种飞速发展吗？没错，那...

AIGC 2024-01-18 人工智能

1291阅读

三个臭皮匠顶个诸葛亮？可能是真的，已证实混合多个小模型性能比肩GPT3.5

在对话型人工智能（AI）研究中，存在趋势即朝着开发参数更多的模型方向发展，如 ChatGPT 等为代表的模型。尽管这些庞大的模型能够生成越来越好的对话响应，但它们同时也需要大量的计算资源和内存。本文研究探讨的问题是：一组小模型是否能够协同达到与单一大模型...

AIGC 2024-01-18 人工智能

855阅读

大模型时代下AIGC新浪潮

大模型时代下AIGC新浪潮文章目录大模型时代下AIGC新浪潮 1. **相关概念** 2. **迎接大模型时代** 3. **ChatGPT引爆AIGC产业** 4. **从产业链宏观看AIGC** 1. **上游：基础层**...

AIGC 2024-01-18 人工智能

981阅读

Stability AI发布全新代码模型Stable Code 3B，媲美70亿Code Llama，没GPU也能跑

今天，Stability AI发布了自家在2024年的第一个模型——Stable Code3B。顾名思义，Stable Code3B专注于代码能力，实际的表现也是非常亮眼。在仅仅3B参数的规模之下，达到了比肩Code Llama7B的效果。相...

生成式AI 2024-01-18 人工智能

928阅读

如何将知识图谱与AIGC结合？京东是这么做的

一、导言首先介绍一下京东在电商场景下 AIGC 方面的探索。这是一个商品营销文案自动生成的全景图，自下而上首先是商品的输入信息。输入信息是异构多源的，包括商品的商详页里的图片、文本、商品的标题以及商品的知识图谱。通用的知识图谱是三元组的形式，...

大数据 2024-01-18 人工智能

1096阅读

DiffIR: Efficient Diffusion Model for Image Restoration 利用扩散模型进行图像重建

一、主要贡献 •我们提出了DiffIR，一种强大、简单、高效的基于扩散模型的的图像修复方法。与图像生成不同的是，输入图像的大部分像素都是给定的。因此，我们利用DM强大的映射能力来估计一个紧凑的IPR（IR Prior Representation，图像修...

人工智能 2024-01-18 人工智能

1032阅读

一文读懂大型语言模型参数高效微调：Prefix Tuning与LLaMA-Adapter

芝士AI吃鱼在快速发展的人工智能领域中，高效、有效地使用大型语言模型变得日益重要，参数高效微调是这一追求的前沿技术，它允许研究人员和实践者在最小化计算和资源占用的同时，重复使用预训练模型。这还使我们能够在更广泛的硬件范围内训练...

AIGC 2024-01-18 人工智能

1243阅读

使用 Transformers 为多语种语音识别任务微调 Whisper 模型

本文提供了一个使用 Hugging Face ? Transformers 在任意多语种语音识别 (ASR 数据集上微调 Whisper 的分步指南。同时，我们还深入解释了 Whisper 模型、Common Voice 数据集以及微调等理论知识，...

AIGC 2024-01-18 人工智能

1214阅读

AIGC内容分享(十二)：AIGC探索之旅AIGC探索之旅

目录前言引言：AI时代，未来已来 AIGC简介与发展历程早期萌芽阶段（1950s－1990s）沉淀积累阶段（1990s－2010s）快速发展阶段（2010s至今）大模型与AIGC的关联大模型概述大模型的定义和特点典型大...

大数据 2024-01-18 人工智能

1030阅读

【Stable diffusion inpaiting】训练自己数据集

https://github.com/advimman/lama/tree/7dee0e4a3cf5f73f86a820674bf471454f52b74f prepare your data: 1 Create masks named as `[...

大数据 2024-01-18 人工智能

875阅读

得帆信息创始人-张桐，受邀出席 BV百度风投AIGC主题论坛

近日，得帆信息创始人兼CEO张桐，作为百度风投被投代表企业创始人受邀出席“向未来，共成长” BV百度风投AIGC主题论坛。与包括上海市徐汇区相关部门领导、百度集团相关事业部负责人及代表，以及来自国寿资本、中网投、麦顿投资的投资人、BV百度风投其...

人工智能 2024-01-18 人工智能

953阅读

七个值得关注的优秀大语言模型（LLM）

在LLM领域我们了解最多的很可能是OpenAI的ChatGPT，以及最近在多模态表现非常出色的Google Gemini，这些都是AI大模型的领头羊，代表着AI大模型发展的先进成果。然而，在大模型的实际应用中必须要综合考虑成本、信息安全等内容，因此，开源...

生成式AI 2024-01-17 人工智能

1830阅读

【Stable Diffusion XL】huggingface diffusers 官方教程解读

文章目录 01 Tutorial Deconstruct a basic pipeline Deconstruct the Stable Diffusion pipeline Autopipeline Train a diffusion mo...

AIGC 2024-01-17 人工智能

1491阅读

Stable Diffusion扩散模型 + Consistency一致性模型

1 GAN到Stable Diffusion的改朝换代 2 从DDPM到Stable Diffusion发展史 2.1 DDPM 扩散过程（正向）去噪过程（反向）总结优化目标理论推导代码解析 2.2 Stable Diffu...

人工智能 2024-01-17 人工智能

1413阅读

书生·浦语2.0体验入口 AI聊天InternLM2模型在线使用地址

「InternLM2」书生·浦语2.0是一款面向中文和英文的大型多语言预训练语言模型，标志着自然语言处理技术的新时代。它不仅在语言理解和生成方面有着出色的表现，还能够进行多模式推理和代码理解。这种基于Transformer架构的模型通过海量数据的预训练，在...

AIGC 2024-01-17 人工智能

989阅读