预训练第16页 - AIGC资讯

【总结】在嵌入式设备上可以离线运行的LLM--Llama

文章目录 Llama 简介运用另一种：MLC-LLM 一个令人沮丧的结论在资源受限的嵌入式设备上无法运行LLM（大语言模型）。一丝曙光：tinyLlama-1.1b（10.1亿参数，需要至少2.98GB的RAM） Llam...

大数据 2024-04-10 人工智能

1306阅读

大模型在金融领域落地思路与实践

一、恒生电子的大模型应用实践 1. 大模型的发展趋势（1）大模型推动第三次信息化浪潮上图是恒生电子董事长刘曙峰先生经常引用的经典图，将金融领域的数字化推进分为三个阶段，恒生电子目前正处于 2.0 到 3.0 的过渡阶段。在迁徙的过程中，最重要的生产...

人工智能 2024-04-10 人工智能

1047阅读

低成本算法，大幅提升视觉分类鲁棒性！悉尼大学华人团队发布全新EdgeNet方法

在深度神经网络时代，深度神经网络（DNNs）在视觉分类任务中展现出了卓越的准确性。然而，它们对额外噪声，即对抗性攻击，表现出了脆弱性。先前的研究假设这种脆弱性可能源于高准确度的深度网络过度依赖于与纹理和背景等无关紧要且不鲁棒的特征。最近的AAAI 20...

生成式AI 2024-04-09 人工智能

872阅读

破解36年前魔咒！Meta推出反向训练大法消除大模型「逆转诅咒」

【新智元导读】大语言模型的「逆转诅咒」，被解开了。近日，来自Meta FAIR的研究人员推出了反向训练大法，让模型从反方向上学到了事实之间的逻辑，终于改进了这个困扰人们已久的问题。大语言模型的「逆转诅咒」，被解开了! 这个诅咒在去年9月首次被发现，一时间...

人工智能 2024-04-09 人工智能

880阅读

120亿Stable LM 2上线即开源！2万亿token训练，碾压Llama 2 70B

继16亿轻量级Stable LM 2推出之后，12B参数的版本在今天亮相了。见状，不少网友纷纷喊话：干的漂亮！但，Stable Diffusion 3啥时候出啊？总得来说，Stable LM 2 12B参数更多，性能更强。 120亿参数版本包含了...

AIGC 2024-04-09 人工智能

816阅读

深度学习与AIGC：未来的智能生活

1.背景介绍深度学习和人工智能生成(AIGC 是当今最热门的研究领域之一，它们在各个领域的应用都取得了显著的成果。深度学习是一种通过神经网络模拟人类大脑工作方式的机器学习方法，它已经在图像识别、自然语言处理、语音识别等领域取得了显著的成果。而人...

AIGC 2024-04-09 人工智能

1022阅读

破除36年前魔咒！Meta推出反向训练大法消除大模型「逆转诅咒」

大语言模型的「逆转诅咒」，被解开了！这个诅咒在去年9月首次被发现，一时间引起LeCun、Karpathy、马库斯等一众大佬的惊呼。因为风光无两、不可一世的大模型竟存在着“阿克琉斯之踵”：一个在「A是B」上训练的语言模型，并不能正确回答出「B是A」。...

人工智能 2024-04-09 人工智能

928阅读

近屿智能独家发布：AIGC大模型工程师和产品经理学习路径图，AI技术不再难懂！

随着人工智能技术的飞速发展，AI取代人工的现象在各个行业和领域变得日益普遍，不少人因此忧心忡忡，担心自己的前途受到AI的冲击。实际上，AI不会取代你的工作，会取代你的是懂AI的人，如何提升自己与他人的知识壁垒，如何学习AIGC？相信在刚刚过去2023这个A...

人工智能 2024-04-08 人工智能

1322阅读

抱抱脸Open了OpenAI的秘密武器，网易参与复现

OpenAI的秘密武器、ChatGPT背后功臣RLHF，被开源了。来自Hugging Face、加拿大蒙特利尔Mila研究所、网易伏羲AI Lab的研究人员从零开始复现了OpenAI的RLHF pipeline，罗列了25个关键实施细节。最终成功展示...

人工智能 2024-04-08 人工智能

838阅读

VAR官网体验入口自回归式AI视觉生成工具使用地址

VAR是一种新的视觉自回归建模方法，能够超越扩散模型，实现更高效的图像生成。它建立了视觉生成的幂律scaling laws，并具备零shots的泛化能力。VAR提供了一系列不同规模的预训练模型，供用户探索和使用。点击前往VAR官网体验入口谁可以从VA...

生成式AI 2024-04-08 人工智能

853阅读

《AI星河》VR技术助力孤独症干预与康复招募孤独症机构限时体验！

医学中，孤独症被定义为一种始于儿童早期，以社交与交流障碍、刻板行为和狭隘兴趣为核心症状的神经发育障碍性疾病。据统计，我国孤独症儿童的患病率约为1%，这意味着每100个孩子中可能就有1个患有孤独症，且男童患病比例远高于女童，约为4:1。其中14岁以下的儿童...

人工智能 2024-04-08 人工智能

801阅读

[NLP]使用Alpaca-Lora基于llama模型进行微调教程

Stanford Alpaca 是在 LLaMA 整个模型上微调，即对预训练模型中的所有参数都进行微调（full fine-tuning）。但该方法对于硬件成本要求仍然偏高且训练低效。 [NLP]理解大型语言模型高效微调(PEFT 因此， Alpac...

生成式AI 2024-04-08 人工智能

1129阅读

FouriScale官网体验入口高分辨率图像AI生成工具使用方法教程指南

FouriScale是一款可以从预训练的扩散模型生成高分辨率图像的工具。它通过创新的、无需训练的方法，结合膨胀技术和低通操作的方法，成功实现了灵活处理各种宽高比文本到图像生成。使用FouriScale作为指导，这个工具成功平衡了生成图像的结构完整性和保真度...

大数据 2024-04-08 人工智能

994阅读

为什么大型语言模型都在使用 SwiGLU 作为激活函数？

如果你一直在关注大型语言模型的架构，你可能会在最新的模型和研究论文中看到“SwiGLU”这个词。SwiGLU可以说是在大语言模型中最常用到的激活函数，我们本篇文章就来对他进行详细的介绍。SwiGLU其实是2020年谷歌提出的激活函数，它结合了SWISH和...

大数据 2024-04-08 人工智能

1213阅读

无需训练，这个新方法实现了生成图像尺寸、分辨率自由

近期，扩散模型凭借其出色的性能已超越 GAN 和自回归模型，成为生成式模型的主流选择。基于扩散模型的文本到图像生成模型（如 SD、SDXL、Midjourney 和 Imagen）展现了生成高质量图像的惊人能力。通常，这些模型在特定分辨率下进行训练，以确...

大数据 2024-04-08 人工智能

885阅读

谷歌AI研究人员提出噪声感知训练方法（NAT）用于布局感知语言模型

在文档处理中，特别是在视觉丰富的文档（VRDs）中，高效信息提取(IE 的需求变得越来越关键。VRDs，如发票、水电费单和保险报价，在业务工作流中随处可见，通常以不同的布局和格式呈现类似信息。自动从这些文档中提取相关数据可以显著减少解析所需的手动工作量。然...

生成式AI 2024-04-08 人工智能

820阅读

MiniGPT4-Video官网体验入口视频理解多模态AI大模型使用地址

MiniGPT4-Video是什么？ MiniGPT4-Video是为视频理解设计的多模态大模型，能处理时态视觉数据和文本数据，配标题、宣传语，适用于视频问答。点击前往MiniGPT4-Video官网体验入口 MiniGPT4-Video的主要特点...

生成式AI 2024-04-08 人工智能

973阅读

太全了！多模态深度学习的综述！

1.介绍我们对世界的体验是多模态的 —— 我们看到物体，听到声音，感觉到质地，闻到气味，尝到味道。模态是指某件事发生或经历的方式，当一个研究问题包含多个模态时，它就具有多模态的特征。为了让人工智能在理解我们周围的世界方面取得进展，它需要能够同时解释这些...

人工智能 2024-04-08 人工智能

1025阅读

大模型存储实践：性能、成本与多云

大模型应用领域的迅猛发展，也推动着基础技术领域持续探索和进步。文件存储服务在 AI 基础设施中成为不可或缺的重要部分。在过去 18 个月的时间里，JuiceFS 团队与 MiniMax，阶跃星辰，智谱 AI，面壁智能，零一万物等大模型团队展开了交流与合...

生成式AI 2024-04-07 人工智能

926阅读

揭秘AI幻觉：GPT-4V存在视觉编码漏洞，清华联合NUS提出LLaVA-UHD

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ GPT-4V 的推出引爆了多模态大模型的研究。GPT-4V 在包括多模态问答、推理、交互在内的多个领域都展现了出色的能力，成为如今最领先...

大数据 2024-04-07 人工智能

863阅读

斯坦福团队大模型Octopus v2火了：手机就能运行准确性超越GPT-4

近日，斯坦福大学研究人员发布的 Octopus v2模型引起了开发者社区的极大关注，其20亿参数的模型一夜下载量超过2k。这一模型可以在智能手机、汽车、个人电脑等端侧设备上运行，并在准确性和延迟方面表现超越了 GPT-4，同时将上下文长度减少了95%。...

生成式AI 2024-04-07 人工智能

1311阅读

ICCV 2023 | 最全AIGC梳理，5w字30个diffusion扩散模型方向，近百篇论文！

30个方向130篇！CVPR 2023最全AIGC论文 25个方向！CVPR 2022 GAN论文汇总 35个方向！ICCV 2021 最全GAN论文汇总超110篇！CVPR 2021 最全GAN论文梳理超100篇！CVPR 2...

大数据 2024-04-07 人工智能

1673阅读

谷歌DeepMind发布Gecko：专攻检索，与大7倍模型相抗衡

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 文本嵌入模型在自然语言处理中扮演着重要角色，为各种文本相关任务提供了强大的语义表示和计算能力。在语义表示上，文本嵌入模型将文本转换为高...

生成式AI 2024-04-07 人工智能

777阅读

斯坦福推可以在手机端跑的大模型 Octopusv2超越GPT-4一夜爆火

斯坦福大学的研究团队近日推出了一款名为Octopusv2的新型人工智能模型，这款模型以其在端侧设备上的强大运行能力而受到广泛关注。 Octopusv2是一款拥有20亿参数的开源语言模型，专为在Android设备上运行而设计，同时也适用于汽车、个人电脑等其他...

人工智能 2024-04-07 人工智能

1310阅读

[论文笔记]LLaMA: Open and Efficient Foundation Language Models

引言今天带来经典论文 LLaMA: Open and Efficient Foundation Language Models 的笔记，论文标题翻译过来就是 LLaMA:开放和高效的基础语言模型。 LLaMA提供了不可多得的大模型开发思路，为很多国...

AIGC 2024-04-07 人工智能

1469阅读

生成型人工智能优化框架研究

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 简介生成类似人类的文本和语音曾经只有在科幻小说中才成为可能。但是，GPT-3和PaLM等大型语言模型（LLM）的快速发展...

生成式AI 2024-04-07 人工智能

941阅读

小白也能微调大模型：LLaMA-Factory使用心得

大模型火了之后，相信不少人都在尝试将预训练大模型应用到自己的场景上，希望得到一个垂类专家，而不是通用大模型。目前的思路，一是RAG(retrieval augmented generation ，在模型的输入prompt中加入尽可能多的“目标领域”的相...

大数据 2024-04-07 人工智能

2643阅读

论文笔记：Llama 2: Open Foundation and Fine-Tuned Chat Models

导语 Llama 2 是之前广受欢迎的开源大型语言模型 LLaMA 的新版本，该模型已公开发布，可用于研究和商业用途。本文记录了阅读该论文的一些关键笔记。链接：https://arxiv.org/abs/2307.09288 1 引言大型语言...

人工智能 2024-04-07 人工智能

1063阅读

首个开源世界模型！百万级上下文，长视频理解吊打GPT-4，UC伯克利华人一作

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 首个开源「世界模型」来了！来自UC berkeley的研究人员发布并开源了LWM（LargeWorldModel）系列模型：论文...

AIGC 2024-04-07 人工智能

875阅读

【讲解下如何Stable Diffusion本地部署】

?博主：程序员不想YY啊 ?CSDN优质创作者，CSDN实力新星，CSDN博客专家 ?点赞?收藏⭐再看?养成习惯 ✨希望本文对您有所裨益，如有不足之处，欢迎在评论区提出指正，让我们共同学习、交流进步！目录 ?前言 ?前提条件 ?步骤...

生成式AI 2024-04-06 人工智能

972阅读

AIGC在广告创意上的实践

1 引言 1.1 背景随着抖音、小红书等新媒体的快速崛起，新媒体广告需求日益增大。而新媒体广告投放的图片和文案创意占用了运营工作者大量的精力和时间。文案、图片、视频广告创意制作难度大、效率低、成本高、周期长的问题日益凸显。如何快速的完成广告创意，...

AIGC 2024-04-06 人工智能

1102阅读

【AIGC调研系列】苹果MM1大模型与其他模型相比的优势和劣势

苹果MM1大模型与其他模型相比，具有以下优势和劣势：优势：多模态能力：MM1是基于大规模多模态预训练的，这意味着它能够处理和理解多种类型的数据（如文本、图像等），在上下文预测、多图像和思维链推理等方面表现出色[7][10]。少样本学习能力：...

大数据 2024-04-06 人工智能

1033阅读

LLaMA Factory+ModelScope实战——使用 Web UI 进行监督微调

LLaMA Factory+ModelScope实战——使用 Web UI 进行监督微调文章原始地址：https://onlyar.site/2024/01/14/NLP-LLaMA-Factory-web-tuning/ 引言大语...

大数据 2024-04-05 人工智能

970阅读

OpenAI发布全新微调API ：ChatGPT支持更详细可视化微调啦！

4月5日凌晨，OpenAI在官网宣布新增6个全新微调API功能，以扩展自定义模型，帮助企业、开发人员更好地构建特定领域、精细化的ChatGPT应用。这些功能包括:基于Epoch的检查点创建、Playground新功能、第三方集成、全面验证指标、超参数配置...

AIGC 2024-04-05 人工智能

1012阅读

文生图大模型三部曲：DDPM、LDM、SD 详细讲解！

1、引言跨模态大模型是指能够在不同感官模态(如视觉、语言、音频等之间进行信息转换的大规模语言模型。当前图文跨模态大模型主要有：文生图大模型：如 Stable Diffusion系列、DALL-E系列、Imagen等图文匹配大模型：如CLI...

生成式AI 2024-04-05 人工智能

2555阅读

llama-factory简介

llamafactory是什么，能干什么 LLaMA-Factory 是一个易于使用的大规模语言模型（Large Language Model, LLM）微调框架，它支持多种模型，包括 LLaMA、BLOOM、Mistral、Baichuan、Qwen ...

人工智能 2024-04-05 人工智能

1505阅读

AIGC批量图生成的一些思考

从技术到先进生产力，从先进装备到作战能力，中间隔了一道GAP。现在AI技术进展很快，开源的模型大部分是单点或者一个模块单元的突破。如何把这些技术整装成作战单元，为业务带来实际的价值是我们必须要解决的一个问题。消费侧技术点中文clip：这...

人工智能 2024-04-05 人工智能

1024阅读

【AI】在本地 Docker 环境中搭建使用 Hugging Face 托管的 Llama 模型

目录 Hugging Face 和 LLMs 简介利用 Docker 进行 ML 格式的类型请求 Llama 模型访问创建 Hugging Face 令牌设...

人工智能 2024-04-04 人工智能

1999阅读

Stable Diffusion中的Embeddings

什么是Embeddings？ Embeddings是一种数学技术，它允许我们将复杂的数据（如文本或图像）转换为数值向量。这些向量是高维空间中的点，可以捕捉数据的关键特征和属性。在文本处理中，例如，embeddings可以捕捉单词或短语...

AIGC 2024-04-04 人工智能

876阅读

AIGC学习笔记——DALL-E2详解+测试

它主要包括三个部分：CLIP，先验模块prior和img decoder。其中CLIP又包含text encoder和img encoder。（在看DALL·E2之前强烈建议先搞懂CLIP模型的训练和运作机制,之前发过CLIP博客）论文地址：https...

AIGC 2024-04-04 人工智能

1375阅读

Transformer引领AI百花齐放：从算法创新到产业应用，一文读懂人工智能的未来

一、引言近年来，人工智能技术取得了举世瞩目的成果，其中，自然语言处理（NLP）和计算机视觉等领域的研究尤为突出。在这些领域，一种名为Transformer的模型逐渐成为研究热点，以其为核心的创新成果层出不穷。本文将从Transformer的原理、应用和...

大数据 2024-04-03 人工智能

917阅读

【保姆级讲解如何Stable Diffusion本地部署】

?个人主页:程序员不想敲代码啊? ?CSDN优质创作者，CSDN实力新星，CSDN博客专家? ?点赞⭐评论⭐收藏 ?希望本文对您有所裨益，如有不足之处，欢迎在评论区提出指正，让我们共同学习、交流进步！ Stable Diffusion本地部...

AIGC 2024-04-03 人工智能

1281阅读

腾讯开源视频生成新工具，论文还没发先上代码的那种

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 先上代码再发论文，腾讯新开源文生视频工具火了。名为MuseV，主打基于视觉条件并行去噪的无限长度和高保真虚拟人视频生成。老规矩，先看...

人工智能 2024-04-03 人工智能

850阅读

大模型创业淘汰潮开始了：这是第一个估值 10 亿美元的祭品

风雨飘摇中的Stability AI还能走多远? 近期，AI 绘画神器 Stable Diffusion 背后的开发公司 Stability AI 发生一系列变动，包括 CEO Emad Mostaque 在内的多名核心高管、技术人员离职，公司面临现金流危...

AIGC 2024-04-02 人工智能

945阅读

llama笔记：官方示例解析 example_chat_completion.py

1 导入库 from typing import List, Optional ''' 从typing模块中导入List和Optional。 typing模块用于提供类型注解的支持，以帮助明确函数预期接收和返回的数据类型。 List用于指定列表...

AIGC 2024-04-02 人工智能

1164阅读

集体出走的Stability AI 发布全新代码大模型，3B以下性能最优，超越Code Llama和DeepSeek-Coder

Stability AI又有新动作！程序员又有危机了？ 3月26日，Stability AI推出了先进的代码语言模型Stable Code Instruct 3B，该模型是在Stable Code 3B的基础上进行指令调优的Code LM。 Stab...

AIGC 2024-04-02 人工智能

953阅读

全面综述！大模型到底微调个啥？或者说技术含量到底有多大？

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解大型模型代表了多个应用领域的突破性进展，能够在各种任务中取得显著成就。然而，它们前所未有的规模带来了巨大的计算成本。这些模型通常由数十亿个参数组成，需要大量的计算资源才...

AIGC 2024-04-01 人工智能

1612阅读

20款AI绘画生图软件的优缺点对比

以下是20款AI生图软件的对比。 DeepArt：优点：使用深度学习算法生成艺术风格的图像，效果独特。缺点：生成图像的时间可能较长，需要等待。 DALL-E：优点：由OpenAI开发的模型，能够根据文本描述生成图像。缺点：目前...

生成式AI 2024-04-01 人工智能

4772阅读

如何修改大模型的位置编码 --以LLama为例

最近在看RoPE相关内容，一些方法通过简单修改位置编码就可以无需训练支持更长的文本内容。由于一些模型，已经训练好了，但是怎么修改已经训练好的模型位置编码。查了以下相关代码，记录一下。原理这里就不细讲了，贴几个相关博客。十分钟读懂旋转编码（RoPE）Tran...

AIGC 2024-03-31 人工智能

1093阅读

微软、OpenAI投资1000亿美元，打造“Stargate”超级计算机

3月30日，著名科技媒体the information独家消息，微软、OpenAI正在开发一个数据中心项目，包含一台名为“Stargate”超级计算机将配备数百万个AI专用芯片，主要为OpenAI的研发、产品提供服务。据一位曾与OpenAI联合创始人兼首...

生成式AI 2024-03-31 人工智能

928阅读