transformer 第22页

百度“文心一言”大模型(ERNIE)发布了，对标ChatGPT

大家好，我是微学AI，今天给大家介绍一下基于大语言模型的背景下，国内外的发展现状，以及百度的“文心一言”大模型。一、自然语言处理模型的发展自然语言处理(NLP 大模型的发展可以追溯到早期的简单的规则模型，再到后的机器学习，近十年崛起的神经网络和深度...

生成式AI 2024-01-26 人工智能

1087阅读

推翻Transformer奠基之作疑被拒收，ICLR评审遭质疑！网友大呼黑幕，LeCun自曝类似经历

去年12月，CMU和普林斯顿的2位研究者发布了Mamba架构，瞬间引起AI社区震动！结果，这篇被众人看好有望「颠覆Transformer霸权」的论文，今天竟曝出疑似被顶会拒收？！今早，康奈尔大学副教授Sasha Rush最先发现，这篇有望成为奠基之作...

AIGC 2024-01-26 人工智能

878阅读

AIGC时代智能绘画开启视觉新时代

大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客...

人工智能 2024-01-26 人工智能

931阅读

顶流Mamba竟遭ICLR拒稿，学者集体破防变小丑，LeCun都看不下去了

一项ICLR拒稿结果让AI研究者集体破防，纷纷刷起小丑符号。争议论文为Transformer架构挑战者Mamba，开创了大模型的一个新流派。发布两个月不到，后续研究MoE版本、多模态版本等都已跟上。但面对ICRL给出的结果，康奈尔副教授Alexand...

AIGC 2024-01-26 人工智能

811阅读

NeurIPS 2023精选回顾：大模型最火，清华ToT思维树上榜

近日，作为美国前十的科技博客，Latent Space对于刚刚过去的NeurIPS 2023大会进行了精选回顾总结。在NeurIPS会议总共接受的3586篇论文之中，除去6篇获奖论文，其他论文也同样优秀和具有潜力，甚至有可能预示着下一个AI领域的新突破...

大数据 2024-01-26 人工智能

920阅读

Mamba论文为什么没被ICLR接收？AI社区沸腾了

基于 Mamba 的创新正不断涌现，但原论文却被 ICLR 放到了「待定区」。 2023年，Transformer 在 AI 大模型领域的统治地位被撼动了。发起挑战的新架构名叫「Mamba」，它是一种选择性状态空间模型（ selective state s...

生成式AI 2024-01-26 人工智能

883阅读

stable diffusion在server上的部署测试

SD infinite canvas Automatic1111 vs InvokeAI Automatic1111 vs InvokeAI - pros and cons stablediffusion-infinity 该repo的问题是已...

人工智能 2024-01-26 人工智能

1117阅读

Camera or Lidar？如何实现鲁棒的3D目标检测？最新综述！

本文经自动驾驶之心公众号授权转载，转载请联系出处。 0. 写在前面&&个人理解自动驾驶系统依赖于先进的感知、决策和控制技术，通过使用各种传感器（如相机、激光雷达、雷达等）来感知周围环境，并利用算法和模型进行实时分析和决策。这使得车辆...

大数据 2024-01-26 人工智能

1035阅读

AI绘图-StableDiffusion安装

AI绘图-StableDiffusion安装前言：StableDiffusion是一个基于Latent Diffusion Models(潜在扩散模型，LDMs 的文图生成(text-to-image 模型。它主要用于根据文字的描述产生详细图像，能...

生成式AI 2024-01-26 人工智能

1081阅读

一文读懂Stable Diffusion 论文原理+代码超详细解读

背景 Stable diffusion是一个基于Latent Diffusion Models（LDMs）实现的的文图生成（text-to-image）模型。 2022年8月，游戏设计师Jason Allen凭借AI绘画作品《太空歌剧院（Théâtre...

AIGC 2024-01-26 人工智能

3372阅读

AIGC：文生图模型Stable Diffusion

1 Stable Diffusion介绍 Stable Diffusion 是由CompVis、Stability AI和LAION共同开发的一个文本转图像模型，它通过LAION-5B子集大量的 512x512 图文模型进行训练，我们只要简单的输入一段文...

生成式AI 2024-01-26 人工智能

1033阅读

【AIGC入门一】Transformers 模型结构详解及代码解析

Transformers 开启了NLP一个新时代，注意力模块目前各类大模型的重要结构。作为刚入门LLM的新手，怎么能不感受一下这个“变形金刚的魅力”呢？目录 Transformers ——Attention is all You Need 背景...

AIGC 2024-01-25 人工智能

1072阅读

ChatGPT 和文心一言的优缺点及需求和使用场景

ChatGPT和文心一言是两种不同的自然语言生成模型，它们有各自的优点和缺点。 ChatGPT（Generative Pre-trained Transformer）是由OpenAI开发的生成式AI模型，它在庞大的文本数据...

AIGC 2024-01-25 人工智能

1988阅读

FlashAttention2原理解析以及面向AIGC的加速实践

FlashAttention-2提出后，便得到了大量关注。本文将具体讲述FlashAttention-2的前世今生，包括FlashAttention1&2的原理解析、加速效果比较以及面向AIGC的加速实践，在这里将相关内容与大家分...

人工智能 2024-01-25 人工智能

1879阅读

轻创AI写作系统体验入口 AI智能写作辅助工具免费在线使用地址

轻创AI写作系统是一款领先的智能生成写作大纲的在线平台。它通过用户输入的论文关键词，快速生成包括标题、章节等在内的完整论文大纲。该系统操作简单，具有智能生成和节省时间等优势，适用于期刊论文、科普文章、毕业论文、商业报告等多种写作场景，能够高效辅助用户进行学...

生成式AI 2024-01-25 人工智能

1332阅读

AIGC-文生视频-学习之路

CFG AIGC神功_SD采样方法与CFG_大猫404-站酷ZCOOLAIGC神功_SD采样方法与CFG,成都设计爱好者,站酷网,中国设计师互动平台.爱卿们好！本喵又出现了~熟悉的封面有没有把你吸引进来呢？这次让我们继续来讲AIGC的内容哟，这是篇硬核科...

AIGC 2024-01-25 人工智能

1088阅读

GitHub Copilot 与 OpenAI ChatGPT 的区别及应用领域比较

GitHub Copilot 和 OpenAI ChatGPT 都是近年来颇受关注的人工智能项目，它们在不同领域中的应用继续引发热议。本文旨在分析和比较这两个项目的区别，从技术原理、应用场景、能力和限制、输出结果、能力与限制和发展前景等方面进行综合评估，帮...

AIGC 2024-01-25 人工智能

1483阅读

【日常聊聊】ChatGPT和文心一言哪个更好用

?个人博客：个人主页 ?个人专栏：日常聊聊 ⛳️ 功不唐捐，玉汝于成目录前言正文介绍哪个在文本生成上有优势结语我的其他博客前言随着人工智能技术的不断发展，自然语言处理领域也取得了显著的进步。...

大数据 2024-01-25 人工智能

957阅读

异常值检测方法比较——基于美国职业棒球联盟2023赛季击球数据

译者 | 朱先忠审校 | 重楼异常值检测是一种无监督的机器学习任务，用于识别给定数据集中的异常（即“异常观测”）。在大量现实世界中，当我们的可用数据集已经被异常“污染”时，异常值检测任务对于整个机器学习环节来说是非常有帮助的。当前，开源框架Sciki...

生成式AI 2024-01-25 人工智能

1002阅读

stable diffusion推理过程代码梳理

最近在看stable diffusion，想梳理一下代码流程，以便之后查阅从txt2img.py开始看 1.首先是对文本进行编码（1）调用的是 stable-diffusion/ldm/models/diffusion/ddpm.py的get...

人工智能 2024-01-25 人工智能

1088阅读

保姆级教程：从0到1搭建Stable Diffusion XL完整工作流进行AI绘画

Rocky Ding 公众号：WeThinkIn 写在前面【人人都是算法专家】栏目专注于分享Rocky在AI行业中对业务/竞赛/研究/产品维度的思考与感悟。欢迎大家一起交流学习? 大家好...

AIGC 2024-01-25 人工智能

1408阅读

AIGC场景应用展望研究报告

AIGC场景应用展望研究报告 AIGC介绍技术视角：AIGC产业技术新突破产业视角：AIGC的产业新变革典型企业案例随着人工智能技术的快速发展，AIGC(AI生成内容正在成为内容生产方式的新趋势。AIGC场景应用展望研...

AIGC 2024-01-25 人工智能

928阅读

Stable Diffusion 硬核生存指南：WebUI 中的 VAE

本文使用「署名 4.0 国际 (CC BY 4.0 」许可协议，欢迎转载、或重新修改使用，但需要注明来源。署名 4.0 国际 (CC BY 4.0 本文作者: 苏洋创建时间: 2023年07月30日统计字数: 11485字阅读时间: 23分钟...

AIGC 2024-01-25 人工智能

1296阅读

ChatGPT VS 文心一言：技术与应用的前瞻性比较

总述在当今的AI领域，自然语言处理技术日新月异，其中ChatGPT和文心一言是备受瞩目的两大模型。它们分别代表了不同的技术路线，并在实际应用中展现了各自的优势。本文将对ChatGPT和文心一言进行深入的比较分析，探讨它们的优缺点、适用...

生成式AI 2024-01-24 人工智能

1473阅读

Stable Diffusion - 扩展 SegmentAnything 和 GroundingDINO 实例分割算法插件的配置与使用

欢迎关注我的CSDN：https://spike.blog.csdn.net/ 本文地址：https://blog.csdn.net/caroline_wendy/article/details/131918652 Paper and GitHub：...

生成式AI 2024-01-24 人工智能

1805阅读

英伟达Jim Fan最新TED演讲上线：AI下一个前沿是「基础智能体」！

「AI的下一个前沿将是『基础智能体』（Foundation Agent）——一个掌握广泛技能，控制许多身体，并能够泛化到多个环境中的单一算法」。等了三个月，英伟达高级科学家Jim Fan在TED AI 2023上的演讲视频终于上线了。视频中，Jim...

人工智能 2024-01-24 人工智能

946阅读

【扩散模型】12、Stable Diffusion | 使用 Diffusers 库来看看 Stable Diffusion 的结构

文章目录一、什么是 Stable Diffusion 二、Diffusers 库三、微调、引导、条件生成 3.1 微调 3.2 引导 3.3 条件生成四、Stable Diffusion 4.1 以文本为条件生成 4.2 无分类器的...

大数据 2024-01-24 人工智能

2254阅读

大模型推理速度飙升3.6倍，「美杜莎」论文来了，贾扬清：最优雅加速推理方案之一

如你我所知，在大型语言模型（LLM）的运行逻辑中，随着规模大小的增加，语言生成的质量会随着提高。不过，这也导致了推理延迟的增加，从而对实际应用构成了重大挑战。从系统角度来看，LLM 推理主要受内存限制，主要延迟瓶颈源于加速器的内存带宽而非算术计算。这一...

人工智能 2024-01-24 人工智能

866阅读

首个通用双向Adapter多模态目标追踪方法BAT，入选AAAI 2024

目标跟踪是计算机视觉的一项基础视觉任务，由于计算机视觉的快速发展，单模态 (RGB 目标跟踪近年来取得了重大进展。考虑到单一成像传感器的局限性，我们需要引入多模态图像 (RGB、红外等来弥补这一缺陷，以实现复杂环境下全天候目标跟踪。然而，现有的多...

AIGC 2024-01-24 人工智能

899阅读

使用SPIN技术对LLM进行自我博弈微调训练

2024年是大型语言模型(llm 的快速发展的一年，对于大语言模型的训练一个重要的方法是对齐方法，它包括使用人类样本的监督微调(SFT 和依赖人类偏好的人类反馈强化学习(RLHF 。这些方法在llm中发挥了至关重要的作用，但是对齐方法对人工注释数据有的大...

生成式AI 2024-01-24 人工智能

899阅读

万字总结 | 2023大模型与自动驾驶论文走马观花

本文经自动驾驶之心公众号授权转载，转载请联系出处。 2023年已经匆匆过去大半，不知各位自动驾驶小伙伴今年的工作生活情况是否顺利呢？高阶ADAS方案量产了吗？新的文章和实验进展又是否顺利呢？今天给大家总结了2023年前后的一些自动驾驶结合大模型的开创性...

生成式AI 2024-01-24 人工智能

1203阅读

迈向分割的大一统！OMG-Seg：一个模型搞定所有分割任务

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者个人思考图像分割已经从单任务分割走到了语义分割、实例分割、全景分割三种分割任务的统一；大模型以及多模态的发展又带来了文本和图像统一，使得跨模态端到端成为可能；追求更高级、更全面...

生成式AI 2024-01-24 人工智能

1193阅读

ChatGPT vs. 文心一言：智能回复、语言准确性与知识库丰富度的综合比较

在当今快速发展的人工智能领域，ChatGPT和文心一言都是备受瞩目的AI助手。它们在智能回复、语言准确性和知识库丰富度等方面都有着独特的特点，但究竟哪个更为出色呢？本文将从多个维度对这两大AI助手进行比较。智能回复 ChatGPT： ChatGPT...

大数据 2024-01-24 人工智能

1111阅读

GPT与文心一言大模型的比较与展望

目录前言 1 GPT和文心一言简介 2 GPT和文心一言的技术原理和基础架构 3 GPT和文心一言的模型规模和参数数量 4 GPT和文心一言的语言理解表现 5 展望GPT和文心一言未来的发展 5.1 技术改进 5.2 应用扩展结语...

生成式AI 2024-01-24 人工智能

1195阅读

stable diffusion模型评价框架

GhostReview:全球第一套AI绘画ckpt评测框架代码 - 知乎大家好，我是_GhostInShell_，是全球AI绘画模型网站Civitai的All Time Highest Rated (全球历史最高评价第二名的GhostMix的作者。在上...

AIGC 2024-01-24 人工智能

1608阅读

LLM之RAG实战（十六）| 使用Llama-2、PgVector和LlamaIndex构建LLM Rag Pipeline

近年来，大型语言模型（LLM）取得了显著的进步，然而大模型缺点之一是幻觉问题，即“一本正经的胡说八道”。其中RAG（Retrieval Augmented Generation，检索增强生成）是解决幻觉比较有效的方法。本文，我们将深入研究使用...

生成式AI 2024-01-24 人工智能

1265阅读

2024年1月11日最热AI论文Top5：开源界Stable Diffusion杀手、Prompt-tuning、零和游戏博弈

本文整理了今日发表在ArXiv上的AI论文中最热门的 TOP5。以下内容由赛博马良-「AI论文解读达人」智能体生成，人工整理排版。「AI论文解读达人」智能体可提供每日最热论文推荐、AI论文解读等功能。如需查看其他热门论文，欢迎移步saibo...

人工智能 2024-01-23 人工智能

1024阅读

Chinese-llama-2部署踩坑记录

Chinese-llama-2部署踩坑记录 1. Chinese-LLaMA-Alpaca-2 A. 部署 a. inference_with_transformers_zh b. text generation webui_zh c. a...

生成式AI 2024-01-23 人工智能

984阅读

AIGC介绍篇

AIGC介绍篇 AIGC 最近横空出世，对社会产生了多冲击。AIGC 发展到现在，其实也就是最近几个月被 ChatGPT （22年11月推出的）带火的，ChatGPT 你可以理解为是所有 AIGC 的一个大脑，其他各种各样的 model 都是四肢，由 C...

大数据 2024-01-23 人工智能

940阅读

stable diffusion其他微调方法

textual inversion 发布时间：2022 目标：与DreamBooth一样，都是想要微调模型生成特定目标或风格的图像方法：通过在vocabulary中添加一个额外的embedding来学习输入的新特征。预训练模型的所有参数都...

人工智能 2024-01-23 人工智能

917阅读

2024年人工智能领域十大预测

2023年人工智能领域如果只能筛选一个关键词的话，恐怕非“大模型”莫属。大模型的发展在过去一年中，让各行各业发生了天翻地覆的变化，有企业因大模型而新生，有企业因大模型而消亡。企业的变迁跟技术迭代息息相关，而大模型就是新一代人工智能技术下的产物，大模型已经...

大数据 2024-01-23 人工智能

944阅读

[论文精读] 自条件图像生成 - 【恺明大神新作，AIGC 新基准】

论文导读: 论文背景: 2023年8月，AI大神何恺明在个人网站宣布，2024年将加入MIT担任教职，回归学术界。这篇论文是其官宣加盟MIT后首度与MIT师生合著的公开论文，论文一作本科毕业于清华姚班，二作为MIT电气工程与计算机科学系教授，今年的斯...

生成式AI 2024-01-23 人工智能

1035阅读

基于LLaMA-Factory用deepspeed多GPU训练大模型报错Caught signal 7 (Bus error: nonexistent physical address)

基于LLaMA-Factory，用4个V100的GPU，如下命令训练ChatGLM3： deepspeed --num_gpus 4 --master_port=9901 src/train_bash.py \ --deepspeed ds_co...

大数据 2024-01-23 人工智能

1206阅读

消灭「幻觉」！谷歌全新ASPIRE方法让LLM给自己打分，效果碾压10x体量模型

大模型的「幻觉」问题马上要有解了？威斯康星麦迪逊大学和谷歌的研究人员最近开发了一个名为ASPIRE的系统，可以让大模型对自己的输出给出评分。如果用户看到模型的生成的结果评分不高，就能意识到这个回复可能是幻觉。如果系统可以进一步筛选评分的结果进行输...

人工智能 2024-01-23 人工智能

918阅读

扩散模型实战（十）：Stable Diffusion文本条件生成图像大模型

推荐阅读列表：扩散模型实战（一）：基本原理介绍扩散模型实战（二）：扩散模型的发展扩散模型实战（三）：扩散模型的应用扩散模型实战（四）：从零构建扩散模型扩散模型实战（五）：采样过程扩散模型实战（六）：Diffusers DDPM初探...

人工智能 2024-01-23 人工智能

1513阅读

一个开源的大型语言模型LLaMA论文简单解读，LLaMA: Open and Efficient Foundation Language Models

一个开源的大型语言模型LLaMA论文解读，LLaMA: Open and Efficient Foundation Language Models 返回论文和资料目录 1.导读 LLaMA 是 Meta AI 发布的包含 7...

生成式AI 2024-01-23 人工智能

997阅读

AIGC神器CLIP：技术详解及应用示例

编者按：上一期，我们介绍了Diffusion模型的发展历程、核心原理及其对AIGC发展的推动作用。本期，我们将共同走进另一项AI重要突破——CLIP，著名的DALLE和Stable Diffusion均采用了CLIP哦。 Nikos Kafrit...

人工智能 2024-01-23 人工智能

1169阅读

【AIGC】AnimateDiff:无需定制化微调的动画化个性化的文生图模型

前言 Animatediff是一个有效的框架将文本到图像模型扩展到动画生成器中，无需针对特定模型进行调整。只要在大型视频数据集中学习到运动先验知识。AnimateDiff就可以插入到个性化的文生图模型中，与Civitai和Huggingface的文生图...

AIGC 2024-01-23 人工智能

1445阅读

世界顶尖多模态大模型开源！又是零一万物，又是李开复

领跑中英文两大权威榜单，李开复零一万物交出多模态大模型答卷! 距离其首款开源大模型Yi-34B和Yi-6B的发布，仅间隔不到三个月的时间。模型名为Yi Vision Language（Yi-VL），现已正式面向全球开源。同属Yi系列，同样具有两个版本...

生成式AI 2024-01-23 人工智能

868阅读

大模型 Dalle2 学习三部曲（一）Latent Diffusion Models学习

引言 Diffusion model大获成功，但是它的短板也很明显，需要大量的计算资源，并且推理速度比较慢。如何才能提升Diffusion model的计算效率。业界有各种各样的改进，无疑Latent Diffusion Models（潜在扩散模...

生成式AI 2024-01-23 人工智能

1010阅读