transformer 第20页

通义千问团队发布Qwen1.5 聊天模型性能大幅提升

在近期几个月的深入探索之后，通义千问团队终于迎来了其开源系列Qwen的下一个重要版本——Qwen1.5。 Qwen1.5的亮点之一是其丰富的模型系列，涵盖了从0.5B到72B的六种不同大小的基础和聊天模型。此外，团队还开源了包括Int4和Int8的GPTQ...

人工智能 2024-02-07 人工智能

945阅读

文心一言使用指南

文心一言快速入门指南，只要3步第一步：不要“学”，直接拿来用刚开始一个月，尽量让自己每天玩10次文心一言。把自己工作、生活中遇到的问题，随手记录下来，扔给文心一言，看看它有什么建议。大约大半个月后，会逐渐发现文心一言的迷人之处。这个时候...

大数据 2024-02-07 人工智能

1768阅读

吉他摇滚、电子音乐都能搞定，Meta开源音频生成新模型MAGNeT，非自回归7倍提速

在文本生成音频（或音乐）这个 AIGC 赛道，Meta 最近又有了新研究成果，而且开源了。前几日，在论文《Masked Audio Generation using a Single Non-Autoregressive Transformer》中，...

人工智能 2024-02-07 人工智能

844阅读

近屿智能引领行业前沿，精心打造AIGC大模型工程师和产品经理的进阶之路（附完整版学习路径图）

近屿智能，倾力打造了一套独特的AIGC大模型工程师和产品经理学习路径图。该路径图清晰地展示了从初学者到专家水平的技能进阶过程，为工程师和产品经理提供了明确的学习目标和成长路径。这套学习路径图适用于不同背景和经验的学习者，无论您是初涉AIGC领域的新...

AIGC 2024-02-07 人工智能

1335阅读

大语言模型之LlaMA系列- LlaMA 2及LLaMA2_chat(上)

LlaMA 2是一个经过预训练与微调的基于自回归的transformer的LLMs，参数从7B至70B。同期推出的Llama 2-Chat是Llama 2专门为对话领域微调的模型。在许多开放的基准测试中Llama 2-Chat优于其他开源的聊天模型，此外...

生成式AI 2024-02-07 人工智能

1506阅读

【AIGC扫盲】人工智能大模型快速入门

人工智能大模型的技术框架主要有以下几种： TensorFlow：这是一个由Google Brain团队开发的开源库，用于进行高性能数值计算，特别是用于训练和运行深度学习模型。TensorFlow提供了一种称为计算图的编程模型，它允许用户定义复杂的计算...

生成式AI 2024-02-07 人工智能

968阅读

语言模型大战：GPT、Bard与文心一言，谁才是王者？

如何对GPT-3.5、GPT-4、Bard、文心一言、通义千问的水平进行排序？在聊技术原理之前我们来先看看几个产品的团队背景一、团队背景 1.1、ChatGPT ChatGPT团队的成员大多具有计算机科学、人工智能、自然语言处理、机器学...

AIGC 2024-02-07 人工智能

985阅读

通义千问再开源，Qwen1.5带来六种体量模型，性能超越GPT3.5

赶在春节前，通义千问大模型（Qwen）的 1.5 版上线了。今天上午，新版本的消息引发了 AI 社区关注。新版大模型包括六个型号尺寸：0.5B、1.8B、4B、7B、14B 和 72B，其中最强版本的性能超越了 GPT 3.5、Mistral-Medi...

大数据 2024-02-06 人工智能

1320阅读

MedicalGPT：基于LLaMA-13B的中英医疗问答模型（LoRA）、实现包括二次预训练、有监督微调、奖励建模、强化学习训练[LLM:含Ziya-LLaMA]。

项目设计集合（人工智能方向）：助力新人快速实战掌握技能、自主完成项目设计升级，提升自身的硬实力（不仅限NLP、知识图谱、计算机视觉等领域）：汇总有意义的项目设计集合，助力新人快速实战掌握技能，助力用户更好利用 CSDN 平台，自主完成项目设计升级，提升自身...

生成式AI 2024-02-06 人工智能

1048阅读

从0开始用 PyTorch 构建完整的 NeRF

本文经自动驾驶之心公众号授权转载，转载请联系出处。在解释代码之前，首先对NeRF（神经辐射场）的原理与含义进行简单回顾。而NeRF论文中是这样解释NeRF算法流程的： “我们提出了一个当前最优的方法，应用于复杂场景下合成新视图的任务，具体的实现原理是...

生成式AI 2024-02-06 人工智能

1087阅读

LLaVA：GPT-4V(ision) 的开源替代品

LLaVA（大型语言和视觉助理）（链接：：https://llava-vl.github.io/）是一个很有前途的开源生成式人工智能模型，它复制了OpenAI GPT-4在图像转换方面的一些功能。用户可以将图像添加到LLaVA聊天对话中，允许讨论这些图像...

生成式AI 2024-02-06 人工智能

1093阅读

分享AIGC场景应用及泰迪AIGC大模型师资培训内容

什么是AIGC? AIGC是内容生产方式的进阶，实现内容和资产的再创造。AIGC（AI-Generated Content）本质上是一种内容生产方式，即人工智能自动生产内容，是基于深度学习技术，输入数据后由人工智能通过寻找规律并适当泛化从而生成内...

人工智能 2024-02-06 人工智能

882阅读

OS-AIGC通用生成式人工智能模型加密接入标准API协议-2023 Beta版

说明 OS-AIGC通用生成式人工智能模型加密接入标准API协议（Universal Language Model Encryption Access Standard API Protocol）国内的通用语言大模型的加密接入标准API协议。能够适配各种...

人工智能 2024-02-06 人工智能

1031阅读

chatgpt和文心一言哪个更好用

ChatGPT和文心一言都是近年来备受关注的人工智能语言模型。它们在智能回复、语言准确性、知识库丰富度等方面都有着较高的表现。然而，它们各自也有自己的特点和优势。在本文中，我们将从这几个方面对这两个模型进行比较，以帮助您更好地了解它们的特点和优劣。一、...

大数据 2024-02-06 人工智能

1093阅读

2023-12-12 AIGC-AI工具的基本工作原理

摘要: 2023-12-12 AIGC-AI工具的基本工作原理 AI工具的基本工作原理 AI工具的基本工作原理涉及到一系列复杂的技术和算法。这些原理可以根据不同类型的AI工具进行概括，包括机器学习、自然语言处理、图像识别等。以下是一些关键的A...

AIGC 2024-02-06 人工智能

1278阅读

Copilot在IDEA中的应用：提升编码效率的得力助手

Copilot在IDEA中的应用：提升编码效率的得力助手前言: 欢迎来到本篇博客，今天我们将深入探讨 GitHub Copilot 在 IntelliJ IDEA 中的应用。GitHub Copilot 是一款由 GitHub 与 OpenAI...

大数据 2024-02-05 人工智能

1174阅读

秒速出图！体验 TensorRT 加速 Stable Diffusion 图像创作

TensorRT 如何加速 Stable Diffusion？生成式 AI 图像内容生成技术近年来发展迅速，可以根据人类语言描述生成图片，在时尚、建筑、动漫、广告、游戏等领域有着广泛应用。 Stable Diffusion WebUI 是 Githu...

大数据 2024-02-05 人工智能

992阅读

两亿参数时序模型替代LLM？谷歌突破性研究被批「犯新手错误」

最近，谷歌的一篇论文在 X 等社交媒体平台上引发了一些争议。这篇论文的标题是「A decoder-only foundation model for time-series forecasting（用于时间序列预测的仅解码器基础模型）」。简而言之，...

人工智能 2024-02-05 人工智能

932阅读

美国博士小哥打败女友的AI男友！7页论文让LLM降智，训出「负分男友」成功挽回

女友爱上AI了，怎么破？一位自称来自Cranberry-Lemon大学应用心理机器学习系的Chad Broman博士最近表示，自己已经和女友Tiffany分手8个月了。虽然很享受单身的自由，但身边没有女友的日子，连玩快艇都少了很多滋味。他一直想找机...

大数据 2024-02-05 人工智能

800阅读

大模型系列——解读RAG

RAG 是2023年最流行的基于 LLM 的应用系统架构。有许多产品几乎完全建立在 RAG 之上，覆盖了结合网络搜索引擎和 LLM 的问答服务，到成千上万个数据聊天的应用程序。很多人将RAG和Agent 作为大模型应用的两种主流架构，但什么是RAG呢？R...

生成式AI 2024-02-05 人工智能

2228阅读

大模型真能解决一切吗？关于知识驱动自动驾驶的一些思考

本文经自动驾驶之心公众号授权转载，转载请联系出处。上个星期受邀在外面做了一次关于「知识驱动自动驾驶」的讲座，刚好借这个机会把之前我和团队的一些学术上的思考整理凝练了一下。感觉里面一些内容还是挺值得拿出来分享&讨论的，所以开这么个帖子把其中一些关...

AIGC 2024-02-05 人工智能

977阅读

Segment Anything论文翻译，SAM模型，SAM论文，SAM论文翻译；一个用于图像分割的新任务、模型和数据集；SA-1B数据集

【论文翻译】- Segment Anything / Model / SAM论文论文链接： https://arxiv.org/pdf/2304.02643.pdf https://ai.facebook.com/research/publica...

大数据 2024-02-05 人工智能

1511阅读

【多模态】13、Vision-Language 模型在视觉任务中的调研

文章目录一、简介二、基础知识 2.1 视觉任务的训练策略 2.2 VLM 基础 2.2.1 网络结构 2.2.2 预训练目标函数 2.2.3 评估和下游任务 2.3 数据集三、迁移学习 3.1 使用 prompt tunin...

生成式AI 2024-02-05 人工智能

1191阅读

【部署LLaMa到自己的Linux服务器】

部署LLaMa到自己的Linux服务器一、官方方法（知道就好，具体操作用不上这个） 1、Llama2 项目获取方法1：有git可以直接克隆到本地方法2：直接下载 2、LLama2 项目部署 3、申请Llama2许可 4、下载模型权重...

生成式AI 2024-02-04 人工智能

1519阅读

万事达卡推出反欺诈AI模型金融科技拥抱生成式AI

全球支付巨头万事达卡(MasterCard 日前表示，已构建自己的专有生成式AI模型，以帮助其信用卡网络中的数千家银行检测并根除欺诈交易。该公司表示，其开发的先进AI模型Decision Intelligence Pro将允许银行机构更好地实时评估网...

人工智能 2024-02-04 人工智能

880阅读

CES 2024的亮点仅仅聚焦AI深度赋能和产业创新吗？｜ DALL-E 3、Stable Diffusion等20+ 图像生成模型综述

随着科技飞速发展，CES（国际消费电子展）已然成为全球科技产业的风向标，每年的CES大会都是业界瞩目的盛事。回顾2024年CES大会，不难发现其亮点纷呈，其中以人工智能的深度赋能为最引人注目之处。AI技术的深入应用成为CES大会上的一大亮点，各大厂商纷纷展...

人工智能 2024-02-04 人工智能

1167阅读

不分割成token，直接从字节中高效学习，Mamba原来还能这样用

在定义语言模型时，通常会使用一种基本分词方法，把句子分为词（word）、子词（subword）或字符（character）。其中，子词分词法一直是最受欢迎的选择，因为它在训练效率和处理词汇表外单词的能力之间实现了自然的折中。然而，一些研究指出了子词分词法...

生成式AI 2024-02-04 人工智能

1119阅读

打破MoE训练效率与性能瓶颈，华为盘古稀疏大模型全新架构LocMoE出炉

2023 年 12 月，首个开源 MoE 大模型 Mixtral 8×7B 发布，在多种基准测试中，其表现近乎超越了 GPT-3.5 和 LLaMA 2 70B，而推理开销仅相当于 12B 左右的稠密模型。为进一步提升模型性能，稠密 LLM 常由于其参数...

生成式AI 2024-02-04 人工智能

915阅读

【AI绘画】stable diffusion原理解读，通俗易懂，直接喂到你嘴里！！！

手把手教你入门绘图超强的AI绘画，用户只需要输入一段图片的文字描述，即可生成精美的绘画。给大家带来了全新保姆级教程资料包（文末可获取）文章目录一、前言（可跳过）二、stable diffusion 1.clip 2...

AIGC 2024-02-04 人工智能

1118阅读

人工智能大时代——AIGC综述

生成式AI分类模型按照输入输出的数据类型分类，目前主要包括9类。有趣的是，在这些已发布大模型的背后，只有六个组织（OpenAI, Google, DeepMind, Meta, runway, Nvidia）参与部署了这些最先进的模型。...

生成式AI 2024-02-04 人工智能

1066阅读

史上首个100%开源大模型重磅登场！破纪录公开代码/权重/数据集/训练全过程，AMD都能训

多年来，语言模型一直是自然语言处理（NLP）技术的核心，考虑到模型背后的巨大商业价值，最大最先进的模型的技术细节都是不公开的。现在，真·完全开源的大模型来了！来自艾伦人工智能研究所、华盛顿大学、耶鲁大学、纽约大学和卡内基梅隆大学的研究人员，联合发表了...

人工智能 2024-02-04 人工智能

839阅读

详解“小而优”的大语言模型Zephyr 7B

Zephyr是Hugging Face发布的一系列大语言模型，使用蒸馏监督微调(dSFT 在更庞大的模型上进行训练，显著提高了任务准确性。 2023年是属于大语言模型(LLM 和开源的一年。许多初创公司和企业开放了模型和权重的源代码，以应对ChatGPT...

人工智能 2024-02-04 人工智能

930阅读

登Nature子刊，滑铁卢大学团队评论「量子计算机+大语言模型」当下与未来

模拟当今量子计算设备的一个关键挑战，是学习和编码量子比特之间发生的复杂关联的能力。基于机器学习语言模型的新兴技术已经显示出学习量子态的独特能力。近日，加拿大滑铁卢大学的研究人员在《Nature Computational Science》发表题为《La...

AIGC 2024-02-04 人工智能

922阅读

陶哲轩看了都直呼内行！谷歌等用LLM自动证明定理拿顶会杰出论文，上下文越全证得越好

Transformer的技能树是越来越厉害了。来自马萨诸塞大学、谷歌和伊利诺伊大学厄巴纳-香槟分校（UIUC）的研究人员发表了一篇论文，利用大语言模型自动生成定理的完整证明。论文地址：https://arxiv.org/pdf/2303.04910...

AIGC 2024-02-04 人工智能

977阅读

AIGC面经大全（持续更新）

目录 DDPM算法原理部分： DDIM算法原理部分：⾼阶采样⽅案：特征编码篇： Stable Diffusion篇： SDXL篇：⼤模型微调篇：控制模型篇：适配器篇： DDPM算法原理部分：简述DDP...

AIGC 2024-02-04 人工智能

1493阅读

Single-Head ViT；Faster Whisper；Transformer KF；Pick-and-Draw

本文首发于公众号：机器感知 Single-Head ViT；Faster Whisper；Transformer KF；Pick-and-Draw SHViT: Single-Head Vision Transformer with Memory Ef...

人工智能 2024-02-04 人工智能

869阅读

【AIGC-图片生成视频系列-3】AI视频随心而动：MotionCtrl的相机运动控制和物体运动控制

目录一. 项目简介二. 主要贡献三. 摘要四. 实现方法和管线五. 基于 LVDM [1] / VideoCrafter1 [2]的结果 (A 相机运动控制 (B 物体运动控制 (C 相机+物体运动控制 (D 与Vide...

AIGC 2024-02-04 人工智能

955阅读

聊一聊AIGC

“UGC不存在了”——借鉴自《三体》 ChatGPT 的横空出世将一个全新的概念推上风口——AIGC（ AI Generated Content）。 GC即创作内容（Generated Content），和传统的UGC、PGC，...

生成式AI 2024-02-04 人工智能

1359阅读

LLaMA、Baichuan、ChatGLM、Qwen、天工等大模型对比

12.10更新：Qwen技术报告核心解读 Baichuan Baichuan 2: Open Large-scale Language Models 数据处理：数据频率和质量，使用聚类和去重方法，基于LSH和dense embedding方...

大数据 2024-02-03 人工智能

2000阅读

AIGC的狂欢，代码安全的隐患。

大家好，这里是安势信息。小故事【小开】与【小A】本是一对兄弟，小开年纪大小A几岁。小开是个好哥哥，早早的担负起哥哥的责任，有什么好的都给了小A，比如什么GAN算法、Stable Diffusion，CLIP模型、Transformer等等，小A...

大数据 2024-02-03 人工智能

902阅读

快速入门ChatGPT和AIGC：底层原理、热门工具、行业现状【我们能做什么】

最近大家热议的ChatGPT和AI绘画工具的底层技术原理是什么？是如何发展到现在的？有哪些应用场景、热门工具？AIGC产业上下游有哪些公司？作为普通用户，我们还能接触哪些应用AI技术打造的商业解决方案？…… 我们查阅了AIGC相关相关的调研报告和各类资料...

AIGC 2024-02-03 人工智能

1387阅读

大模型也有小偷？为保护你的参数，上交大给大模型制作「人类可读指纹」

大模型的预训练需要耗费巨量的计算资源和数据，因而预训练模型的参数也正成为各大机构重点保护的核心竞争力和资产。然而，不同于传统的软件知识产权保护可以通过比对源代码来确认是否存在代码盗用，对预训练模型参数盗用的判断存在以下两方面的新问题： 1）预训练模型的...

生成式AI 2024-02-03 人工智能

930阅读

引言:ChatGPT与AIGC技术的发展与应用

1.背景介绍 1. 背景介绍自2012年的AlexNet成功地赢得了ImageNet Large Scale Visual Recognition Challenge(ILSVRC ，深度学习技术开始引以为奉。随着算法的不断发展和优化，深度...

人工智能 2024-02-03 人工智能

1027阅读

基于医疗领域数据微调LLaMA——ChatDoctor模型

文章目录 ChatDoctor简介数据构建和训练过程建立外部知识库 ChatDoctor相比ChatGPT有什么优势？ ChatDoctor的效果代码解读 train_lora.py文件解读微调实战下载仓库并进入目录创建con...

人工智能 2024-02-03 人工智能

1139阅读

从零开始：了解ChatGPT和AIGC基础

1.背景介绍 1. 背景介绍自2012年的AlexNet在ImageNet大赛中取得卓越成绩以来，深度学习技术已经成为人工智能领域的重要技术。随着算力的提升和模型的优化，深度学习技术已经取得了巨大的成功，应用于图像识别、自然语言处理、语音识...

AIGC 2024-02-02 人工智能

1065阅读

如何用Stable Diffusion生成高质量的图全网最全介绍！（附资料）

Stable Diffusion无疑是最近最火的AI绘画工具之一，所以本期给大家带来了全新Stable Diffusion 提示词资料包（文末可获取） Stable Diffusion Stable Diffusion是一个开源的图像生成AI系统,...

生成式AI 2024-02-02 人工智能

2073阅读

Phoncent博客，AI写作助手，助力文学创作

在当今信息爆炸的时代，写作已经成为了人们生活中不可或缺的一部分。然而，对于许多人来说，写作并不是一件轻松的事情。有时候，我们可能会遇到写作灵感枯竭、构思困难、内容不连贯等问题。但是，现在有了AI写作助手，这些问题将迎刃而解。 AI写作助手是一种创新的技...

人工智能 2024-02-02 人工智能

808阅读

BiTA：创新AI方法加速大型语言模型生成

近年来，基于transformer架构的大型语言模型（LLMs）已经崭露头角。Chat-GPT和LLaMA-2等模型展示了LLMs参数的迅速增加，从几十亿到数万亿。尽管LLMs是非常强大的生成器，但由于所有参数的计算负载，它们在推理延迟方面存在问题。因此，...

人工智能 2024-02-02 人工智能

921阅读

FaceChain-FACT怎么使用零成本AI人像生成工具使用方法教程指南

FaceChain-FACT是一款领先的零成本人像生成工具，无需用户训练LoRA模型，仅需用户提供一张照片即可生成定制人像。相比其他商业应用，我们的生成速度提升了 100 倍，支持秒级图像生成。我们集成了基于Transformer的人脸特征提取器，其结构类...

AIGC 2024-02-02 人工智能

964阅读

DALL-E 系列：AI绘画背后的惊人真相！！【1个离奇内幕、3个意想不到、5大秘密揭示】

DALL-E 系列：AI绘图原理，根据用户给出的描述，生成与描述相匹配的图像 DALL-E 1 dVAE Transformer DALL-E 2 CLIP 先验 prior decoder（image） DALL-E 3...

AIGC 2024-02-02 人工智能

1161阅读