预训练第7页 - AIGC资讯

LlaMa 2

目录 LlaMa 2 介绍： Llama 的诞生： Llama 2 的训练数据集是如何构建和选择的？ Llama 2 在自然语言处理（NLP）任务中的具体应用案例有哪些？ Llama 2 模型在商业应用中的表现如何，有哪些成功案例？ Ll...

大数据 2024-07-25 人工智能

836阅读

AI训AI惨遭投毒9次大崩溃，牛津剑桥等惊天发现登Nature封面！

9次迭代后，模型开始出现诡异乱码，直接原地崩溃!就在今天，牛津、剑桥等机构的一篇论文登上了Nature封面，称合成数据就像近亲繁殖，效果无异于投毒。有无破解之法?那就是——更多使用人类数据! 用AI生成的数据训练AI，模型会崩溃? 牛津、剑桥、帝国理工、多...

人工智能 2024-07-25 人工智能

1018阅读

【大语言模型LLMs】Llama系列简介

【大语言模型LLMs】Llama系列简介文章目录【大语言模型LLMs】Llama系列简介 1. LLaMa 1.1 引言 1.2 方法 1.2.1 预训练数据 1.2.2 架构 1.2.3 优化器 1.2.4 效率 2....

大数据 2024-07-24 人工智能

1327阅读

开源=最强大模型！Llama3.1发布，405B超越闭源GPT-4o，扎克伯格：分水岭时刻

刚刚，LIama3.1正式发布，登上大模型王座! 在150多个基准测试集中，405B版本的表现追平甚至超越了现有SOTA模型GPT-4o和Claude3.5Sonnet。也就是说，这次，最强开源模型即最强模型。在此之前，Llama3.1已经被多番曝光...

大数据 2024-07-24 人工智能

992阅读

一文看懂 LLaMA 2：原理与模型训练介绍

近年来，人工智能领域的进展使得自然语言处理（NLP）技术得到了显著提升。LLaMA 2 是一种先进的语言模型，它在处理语言生成和理解任务上表现出色。本文将介绍 LLaMA 2 的基本原理、模型结构以及训练方法，帮助你全面了解这一技术。 1. LLaMA...

大数据 2024-07-24 人工智能

1311阅读

探究AIGC的底层逻辑：从技术到应用的全面解析

目录探究AIGC的底层逻辑：从技术到应用的全面解析技术原理使用方法最佳实践和注意事项结论探究AIGC的底层逻辑：从技术到应用的全面解析在人工智能领域，AIGC（AI对话大师）是一种语言生成模型，由OpenAI开发并用于构建...

AIGC 2024-07-24 人工智能

890阅读

一文者懂LLaMA 2（原理、模型、训练）

引言 LLaMA（Large Language Model Meta AI）是Meta（前身为Facebook）开发的自然语言处理模型家族之一，LLaMA 2作为其最新版本，展示了在语言理解和生成方面的显著进步。本文将详细解读LLaMA 2的基本原理、...

生成式AI 2024-07-23 人工智能

990阅读

AIGC背后的技术基石：自然语言处理与机器学习

目录 AIGC背后的技术基石：自然语言处理与机器学习自然语言处理（NLP）机器学习 AIGC的应用 AIGC背后的技术基石：自然语言处理与机器学习自然语言处理（NLP）和机器学习是构建AI教学工具"风变科技"中的语言模型所依赖的重要...

AIGC 2024-07-23 人工智能

935阅读

首个超越GPT4o级开源模型！Llama 3.1泄密：4050亿参数，下载链接、模型卡都有了

Llama3.1终于现身了，不过出处却不是 Meta 官方。今日，Reddit 上新版 Llama 大模型泄露的消息遭到了疯传，除了基础模型，还包括8B、70B 和最大参数的405B 的基准测试结果。下图为 Llama3.1各版本与 OpenAI G...

生成式AI 2024-07-23 人工智能

839阅读

【05】LLaMA-Factory微调大模型——初尝微调模型

上文【04】LLaMA-Factory微调大模型——数据准备介绍了如何准备指令监督微调数据，为后续的微调模型提供高质量、格式规范的数据支撑。本文将正式进入模型微调阶段，构建法律垂直应用大模型。一、硬件依赖 LLaMA-Factory框架对硬件和软件的...

AIGC 2024-07-23 人工智能

1626阅读

快速微调 Whisper 模型：LoRA 加速版

快速微调 Whisper 模型：LoRA 加速版简述在当今的AI世界中，模型的大小和复杂性已成为性能的关键驱动力。然而，这也带来了新的挑战：如何在有限的资源下对大型模型进行有效且高效的微调？现在，借助开源项目——Faster Whisper Fine...

AIGC 2024-07-23 人工智能

1361阅读

视频大语言模型调研论文《Video-LLaMA: An Instruction-tuned Audio-Visual Language Model for Video Understanding》解读

本文是关于论文《Video-LLaMA: An Instruction-tuned Audio-Visual Language Model for Video Understanding》的简要介绍。Video-LLaMA是阿里达摩院的一个多模态大语言模型...

大数据 2024-07-22 人工智能

1086阅读

AIGC领域综述

AIGC领域综述 2023 1. A Survey of Large Language Models 2. A Complete Survey on Generative AI (AIGC : Is ChatGPT from GPT-4 to...

生成式AI 2024-07-22 人工智能

1122阅读

OpenAI掀小模型血战！苹果DCLM强势登场，碾压Mistral 7B全开源

【新智元导读】小模型时代来了?OpenAI带着GPT-4o mini首次入局小模型战场，Mistral AI、HuggingFace本周接连发布了小模型。如今，苹果也发布了70亿参数小模型DCLM，性能碾压Mistral-7B。小模型的战场，打起来了!...

生成式AI 2024-07-22 人工智能

957阅读

AIGC的行业发展

1. AIGC的行业发展 AIGC（Artificial Intelligence Generated Content，人工智能生成内容）是利用人工智能技术来自动生成内容的一种新型内容创作方式。它基于生成对抗网络(GAN 、大型预训练模型等技术，通过对已...

生成式AI 2024-07-22 人工智能

934阅读

Llama模型家族之拒绝抽样(Rejection Sampling)（九）强化学习之Rejection Sampling

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

大数据 2024-07-21 人工智能

1770阅读

【AIGC调研系列】VILA-1.5版本的视频理解功能如何

VILA-1.5版本的视频理解功能表现出色，具有显著的突破。这一版本不仅增强了视频理解能力，还提供了四种不同规模的模型供用户选择，以适应不同的应用需求和计算资源限制[1][2][3]。此外，VILA-1.5支持在笔记本等边缘设备上部署，这得益于其高效的模型...

AIGC 2024-07-20 人工智能

1640阅读

Stable Diffusion模型训练 — Embeddings（附Demo）

文本反演提到文本反演你可能会比较陌生，但它产出的模型类型Embeddings（词嵌入）一定是你出图过程里经常会使用到的，它是一种轻量、小巧的微调模型格式，文件名后缀一般为.pt（或.safetensor），每个Embeddings文件的大小在几KB到几...

大数据 2024-07-20 人工智能

1358阅读

AIGC是什么，与AI绘画有什么关系，一篇文章带你了解AI绘画的前世今生

在讲解AIGC和AI绘画之前，我们先看看什么是AI以及AI的历史。 AI历史发展轨迹什么是人工智能人工智能(Artificial intelligence，简称AI 亦称机器智能，指由人制造出来的机器所表现出来的智能。通常人工智能是指用普通计...

大数据 2024-07-20 人工智能

1170阅读

LLaMA-Factory：开源的低代码大模型训练框架

LLaMA-Factory 是一个由零隙智能（SeamLessAI）开源的低代码大模型训练框架，它集成了业界最广泛使用的微调方法和优化技术，并支持众多开源模型的微调和二次训练。一、功能特点支持多种开源模型：LLaMA-Factory支持包括...

大数据 2024-07-20 人工智能

2426阅读

GPT-4o mini特点功能介绍及使用教程指南 OpenAI最新模型免费体验地址入口

GPT-4o mini简介 GPT-4o mini是一款成本效益极高的小型智能模型，由OpenAI推出。它在多模态推理和文本智能方面超越了其他小型模型，并支持与GPT-4o相同的语言范围。该模型在数学推理和编码任务上表现出色，能够处理大量上下文信息，并支持...

生成式AI 2024-07-19 人工智能

1393阅读

（5-5-01）金融市场情绪分析：使用Llama 2 大模型实现财经信息的情感分析微调（1）

5.5 使用Llama 2 大模型实现财经信息的情感分析微调情感分析在金融和经济领域具有重要意义，可以帮助企业从市场洞察、风险管理和投资决策等方面获得有价值的信息。然而，在金融和经济文本方面的标注数据相对稀缺，因此需要使用自然语言处理技术和预训练模型...

人工智能 2024-07-19 人工智能

1535阅读

AIGC从入门到实战：关于企业和组织

作者：禅与计算机程序设计艺术 Artificial Intelligence (人工智能 G: Generation (生成 C: Content (内容背景介绍随着全球数字化转型的加速，企业与组织面临着前所未有的机遇与挑战。人工智能(A...

生成式AI 2024-07-19 人工智能

1319阅读

Llama - 微调

本文翻译整理自：https://llama.meta.com/docs/how-to-guides/fine-tuning 文章目录微调实验跟踪 Recipes PEFT LoRA torchtune Hugging Face PE...

AIGC 2024-07-19 人工智能

964阅读

用AIGC技术打造多样的室内装修风格

随着人工智能不断进步的创造能力，AI生成内容（AIGC）技术已经成为设计行业的一大助力。本文将详细介绍相关的技术原理和细节以及它们在室内装修设计中的应用案例，为读者揭示如何利用AIGC技术打造多样且个性化的室内装修风格。...

人工智能 2024-07-18 人工智能

1177阅读

每日AIGC最新进展(30)：阿卜杜拉国王大学提出旋转视角视频生成Vivid-ZOO、浙江大学提出4D场景编辑Instruct 4D-to-4D、西安交大提出3D重建大规模数据集OpenMateria

Diffusion Models专栏文章汇总：入门与实战 Vivid-ZOO: Multi-View Video Generation with Diffusion Model 本文提出了一种名为Vivid-ZOO的新型扩散模型，用于从文本...

AIGC 2024-07-18 人工智能

949阅读

AIGC各个应用场景下的模型选择

需要注意的是，下述模型可以在不同任务和领域中灵活应用，它们的归属也会根据模型的设计和主要应用领域而有所变化，并不绝对。自然语言处理模型模型层中自然语言理解(Natural LanguageUnderstanding，NLU 和自然语言生成(N...

生成式AI 2024-07-18 人工智能

1010阅读

AIGC从入门到实战：ChatGPT 简介：从 GPT1 到 GPT4 的发展历程和应用领域

AIGC从入门到实战：ChatGPT 简介：从 GPT1 到 GPT4 的发展历程和应用领域 1. 背景介绍 1.1 问题的由来自然语言处理(Natural Language Processing, NLP 是人工智能(Artificial...

生成式AI 2024-07-18 人工智能

909阅读

大模型学习笔记3【大模型】LLaMA学习笔记

文章目录学习内容 LLaMA LLaMA模型结构 LLaMA下载和使用好用的开源项目[Chinese-Alpaca](https://github.com/ymcui/Chinese-LLaMA-Alpaca Chinese-Alpaca...

人工智能 2024-07-18 人工智能

1036阅读

使用llama.cpp量化模型

文章目录概要整体实验流程技术细节小结概要大模型量化是指在保持模型性能尽可能不变的情况下，通过减少模型参数的位数来降低模型的计算和存储成本。本次实验环境为魔搭社区提供的免费GPU环境（24G），使用Llama.cpp进行...

AIGC 2024-07-17 人工智能

1501阅读

如何使用阿里云AMD CPU云服务器（g8a）和龙蜥容器镜像，并基于Stable Diffusion模型搭建个人版文生图服务

Stable Diffusion是文本到图像的潜在扩散模型，它可以根据文本提示词生成对应的图像。Stable Diffusion模型是扩散模型的变种，可以通过逐步对随机高斯噪声进行去噪以获得感兴趣的样本。与传统生成模型相比，Stable Diffusion...

大数据 2024-07-17 人工智能

1044阅读

LLaMA原理与代码实例讲解

LLaMA原理与代码实例讲解作者：禅与计算机程序设计艺术 / Zen and the Art of Computer Programming 关键词：大模型、LLaMA、Transformer、预训练、微调 1. 背景介绍 1.1 问题的由来...

AIGC 2024-07-17 人工智能

1126阅读

Stable Diffusion本地部署结合cpolar内网穿透实现远程制作AI文生图详细教程

文章目录前言 1. 本地部署Stable Diffusion Web UI 1.1 整合包安装 1.2 手动安装Stable Diffusion Web UI 2. 安装Cpolar内网穿透 3. 实现公网访问Stable Diffusi...

人工智能 2024-07-16 人工智能

995阅读

每日AIGC最新进展(35)：字节跳动提出人物肖像动画X-Portrait、字节跳动提出组合式视频编辑Edit3K、东华大学提出基于GCN的草图建模方法DC-gra2seq

Diffusion Models专栏文章汇总：入门与实战 X-Portrait: Expressive Portrait Animation with Hierarchical Motion Attention X-Portrait是由字节跳动...

人工智能 2024-07-16 人工智能

920阅读

Llama模型家族之使用 Supervised Fine-Tuning（SFT）微调预训练Llama 3 语言模型（七）使用 LoRA 微调 LLM 的实用技巧

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

生成式AI 2024-07-16 人工智能

1500阅读

【AIGC-图片生成视频系列-7】MoonShot：实现多模态条件下的可控视频生成和编辑

目录一. 贡献概述二. 方法详解编辑三. Zero-Shot主题定制视频生成四. 文本到视频生成五. 直接使用图像ControlNet 六. 图像动画比较七. 视频编辑八. 针对视频生成中多模态 Cross-Attn的消融实...

人工智能 2024-07-16 人工智能

1183阅读

基于MindSpore实现BERT对话情绪识别

本文分享自华为云社区《【昇思25天学习打卡营打卡指南-第二十四天】基于 MindSpore 实现 BERT 对话情绪识别》，作者：JeffDing。模型简介 BERT全称是来自变换器的双向编码器表征量（Bidirectional Encoder...

AIGC 2024-07-16 人工智能

895阅读

Diffusion【1】：SDSeg——基于Stable Diffusion的单步扩散分割！

文章目录前言 Abstract Introduction Methods Latent Estimation Concatenate Latent Fusion Trainable Vision Encoder Experiment D...

大数据 2024-07-16 人工智能

1180阅读

AIGC从入门到实战：让 AI 辅助短视频创作，掌握了流量密码，再也不怕石沉大海

AIGC from Basics to Practice: Leveraging AI for Video Creation to Unlock Traffic Secrets and Avoid Being Overlooked 作者：禅与计算机程序设...

人工智能 2024-07-16 人工智能

1159阅读

LLaMA-Factory在华为显卡上的实验记录

如何判断目前所选择的模型是否支持 LLaMA-Factory/src/llamafactory/data/template.py 在项目的这个地址中会有不同模型的支持模版。这里用目前我最常用的两个模型举例子一个是智谱的glm4-9B模型 _regi...

生成式AI 2024-07-15 人工智能

1508阅读

【人工智能】一文看懂 LLaMA 2：原理、模型与训练

LLaMA 2（Large Language Model for AI Modeling and Assistance）是近年来广受关注的大规模语言模型之一。它被广泛应用于自然语言处理（NLP）任务，如文本生成、机器翻译和问答系统。本文将深入介绍LLaMA...

大数据 2024-07-15 人工智能

1058阅读

6700万参数比肩万亿巨兽GPT-4！微软MIT等联手破解Transformer推理密码

「因果推理」绝对是当前GenAI热潮下的小众领域，但是它有一个大佬级的坚定支持者——Yann LeCun。他在推特上的日常操作之一，就是炮轰Sora等生成模型，并为自己坚信的因果推理领域摇旗呐喊。甚至，早在2019年VentureBeat的采访中，他...

人工智能 2024-07-15 人工智能

918阅读

引入 AI 技术后，数据库变成了什么样？

作为数据库技术发展趋势之一，AI 与数据库融合迸发无限潜力，推动着数据管理与分析进入一个全新的时代。当前，一些数据库厂商已经开始融合 AI 技术来增强其数据管理和处理能力，用于自动化的数据库调优、预测性维护、智能查询优化、模式识别以及更高级别的数据分析等方...

人工智能 2024-07-15 人工智能

924阅读

近屿OJAC带你解读：AIGC核心知识点LLM

近年来，人工智能（AI）领域经历了令人瞩目的增长，尤其是自然语言处理（NLP）。你知道是什么推动了NLP领域的这种飞速发展吗？没错，那就是大型语言模型LLM。这些模型可能会彻底改变我们与科技的互动方式！这些模型是如何工作的呢？它们为何如此流行？在本文中...

生成式AI 2024-07-14 人工智能

899阅读

LLAMA权重文件终于找到国内高速网盘链接了

LLaMA 7b 13b 65b大模型权重文件预训练文件国内镜像（百度网盘）（伸手党的福音！）众所周知，llama官网下载非常恶心，所以找了个链接。这样大家能高速下载。还挺快的。 LLaMA 7b 13b 65b大模型...

生成式AI 2024-07-14 人工智能

958阅读

突破AI性能瓶颈揭秘LLaMA-MoE模型的高效分配策略

获取本文论文原文PDF，请在公众号【AI论文解读】留言：论文解读本文介绍了一种名为“LLaMA-MoE”的方法，通过将现有的大型语言模型（LLMs）转化为混合专家网络（MoE），从而解决了训练MoE时遇到的数据饥饿和不稳定性问题。该方法基于著名的LLa...

AIGC 2024-07-13 人工智能

980阅读

如何“正确“使用Stable Diffusion？文本到图像扩散模型中记忆化实用分析（浙大）

论文链接：https://arxiv.org/pdf/2405.05846 它能被生成吗？文本到图像扩散模型中记忆化的实用分析过去几年见证了由扩散模型驱动的文本引导图像生成领域的重大进展。然而，已经显示出文本到图像扩散模型容易受到训练图像记忆的影响，引发...

人工智能 2024-07-13 人工智能

1117阅读

python 调用 llama

参考： https://blog.51cto.com/u_16175437/9317548 方法一：要在Python中调用Llama.ai模型来生成回答，你可以使用transformers库，它提供了调用不同的预训练模型的接口。以下是一个简单的例子，展...

大数据 2024-07-13 人工智能

943阅读

深入了解语音识别：Distil-Whisper

Distil-Whisper模型概述 1.1 Distil-Whisper的背景与意义随着语音识别技术的不断发展，模型的大小和计算复杂度成为了制约其广泛应用的重要因素。特别是在边缘设备和实时应用场景中，对模型的效率和性能提出了更高的要求。Dist...

生成式AI 2024-07-12 人工智能

2255阅读

调研分析：LLama大模型

1. 引言在当前的自然语言处理（NLP）研究中，大规模预训练模型如BERT、GPT-3和RoBERTa已经展示了其卓越的性能和广泛的应用。随着技术的发展，新的模型不断涌现，推动了NLP领域的持续进步。本文将聚焦于LLama模型，分析其结构、预训练策略、优...

AIGC 2024-07-12 人工智能

1166阅读