token 第4页 - AIGC资讯

大模型之二十七-语音识别Whisper实例浅析

Whisper简介 Whisper是OpenAI于2022年9月开源的一个多语种识别模型，目前支持99种语言，是目前性能最好的开源多语种识别ASR大模型，第一版版使用了68万小时标注好的语料预训练模型，而large-v3的标注数据超过了500万小时，其...

AIGC 2024-09-05 人工智能

1778阅读

AIGC初体验 Datawhale X 魔搭夏令营

跟DataWhale的步骤跑通baseline 环境安装 !pip install simple-aesthetics-predictor !pip install -v -e data-juicer !pip uninstall pytorch...

生成式AI 2024-09-05 人工智能

543阅读

如何在家用设备上运行 Llama 3.1 405B？搭建 AI 集群

在开放式 LLM 模型和封闭式 LLM 模型之间的竞争中，开放式模型的最大优势是您可以在本地运行它们。除了电力和硬件成本外，您无需依赖外部提供商或支付任何额外费用。但是，随着模型大小的增加，这种优势开始减弱。运行需要大量内存的大型模型并不容易。幸运的是，张...

AIGC 2024-09-04 人工智能

671阅读

【扩散模型（六）】Stable Diffusion 3 diffusers 源码详解1-推理代码-文本处理部分

系列文章目录【扩散模型（一）】中介绍了 Stable Diffusion 可以被理解为重建分支（reconstruction branch）和条件分支（condition branch）【扩散模型（二）】IP-Adapter 从条件分支的视角，快...

生成式AI 2024-09-04 人工智能

1150阅读

如何申请 Midjourney API ，看这篇文章就够了

如何申请 Midjourney API ，看这篇文章就够了 Midjourney 是一款非常强大的 AI 绘图工具，只要输入关键字，就能在短短一两分钟生成十分精美的图像。Midjourney 以其出色的绘图能力在业界独树一帜，如今，Midjourney...

生成式AI 2024-09-04 人工智能

574阅读

【实战】Llama3.1-部署与使用

大模型（LLM）狭义上指基于深度学习算法进行训练的自然语言处理（NLP）模型，主要应用于自然语言理解和生成等领域，广义上还包括机器视觉（CV）大模型、多模态大模型和科学计算大模型等。百模大战正值火热，开源 LLM 层出不穷。如今国内外已经涌现了众多优秀...

人工智能 2024-09-03 人工智能

854阅读

LLM之基于llama-index部署本地embedding与GLM-4模型并初步搭建RAG（其他大模型也可，附上ollma方式运行）

前言日常没空，留着以后写 llama-index简介官网：https://docs.llamaindex.ai/en/stable/ 简介也没空，以后再写注：先说明，随着官方的变动，代码也可能变动，大家运行不起来，可以进官网查查资料...

AIGC 2024-09-03 人工智能

2142阅读

Datewhale AI夏令营第四期 AIGC方向Task1笔记

①文生图基基础知识： ✔提示词：主体描述，细节描述，修饰词，艺术风格，艺术家 ✔Lora模型：实现对特定主题、风格或任务的精细化控制 ✔ComfyUI：模型微调、数据预处理、图像生成 ✔参考图控制：openp...

AIGC 2024-09-03 人工智能

559阅读

再融近5亿！清华系AI创业新势力，成最吸金“算力运营商”

一笔近5个亿新融资，投向AI大模型领域。量子位独家获悉，清华系AI创业公司无问芯穹完成了近5亿元A轮融资。加码的股东阵容很全、很豪华: 一口气新增15家股东，涵盖北京上海等地的国资/地方基金，顺为资本/达晨财智等市场化头部VC，还有券商直投和产业CVC。...

人工智能 2024-09-03 人工智能

578阅读

Llama 3.1 405B：4050亿参数史上最强开源大模型

01 。概述 Meta公司推出了其最大的开源人工智能模型——Llama 3.1 405B，拥有4050亿个参数，与GPT-4o和Claude 3.5 Sonnet相媲美。该模型在16000个Nvidia H100 GPU上训练而成，现已在云平台上可用，...

人工智能 2024-09-03 人工智能

731阅读

Stable-Diffusion1.5

SD1.5权重：https://huggingface.co/runwayml/stable-diffusion-v1-5/tree/main SDXL权重：https://huggingface.co/stabilityai/stable-diffus...

人工智能 2024-09-02 人工智能

852阅读

超有性价比深度学习卡特斯拉 P100，16G大显存，Stable Diffusion AI 绘画利器

超有性价比深度学习卡特斯拉 P100，16G大显存，Stable Diffusion AI 绘画利器在当今数字化创作的时代，AI 绘画技术正以惊人的速度发展，为艺术家和创作者们带来了全新的可能性。而要实现高效的 AI 绘画，一款性能卓越的显卡至关...

大数据 2024-09-02 人工智能

1909阅读

基于 Llama factory 微调 Llama3.1-70B-Chinese-Chat

本文旨在探讨基于Llama factory使用LoRA（Low-Rank Adaptation）技术对Llama3.1-70B-Chinese-Chat模型进行微调的过程，重点介绍在单机多卡和多机多卡两种分布式训练环境下的实现方法。 1.环境准备...

人工智能 2024-09-02 人工智能

807阅读

llama.cppllama.cpp 是一个C++库，用于简化LLM推理的设置。它使得在本地机器上运行Qwen成为可能。该库是一个纯C/C++实现，不依赖任何外部库，并且针对x86架构提供了AVX、

llama.cpp llama.cpp - Qwen llama.cpp 是一个C++库，用于简化LLM推理的设置。它使得在本地机器上运行Qwen成为可能。该库是一个纯C/C++实现，不依赖任何外部库，并且针对x86架构提供了AVX、AVX2和AVX5...

人工智能 2024-09-01 人工智能

1357阅读

Llama-X 开源项目指南

Llama-X 开源项目指南 Llama-XOpen Academic Research on Improving LLaMA to SOTA LLM项目地址:https://gitcode.com/gh_mirrors/ll/Llama-X 项目...

AIGC 2024-09-01 人工智能

639阅读

一文看懂llama2(原理&模型&训练）

一文看懂Llama2（原理&模型&训练）一、引言 Llama2是Meta（原Facebook AI）最新开源的大型语言模型，它基于Transformer架构进行了多项优化和改进，旨在提供更高效、更准确的自然语言处理能力。Llama2...

生成式AI 2024-09-01 人工智能

643阅读

WhisperX

文章目录一、关于 WhisperX 新闻 ? 二、设置⚙️ 1、创建Python3.10环境 2、安装PyTorch，例如Linux和Windows CUDA11.8： 3、安装此repo 4、Speaker Diarization 三、...

生成式AI 2024-08-31 人工智能

1139阅读

Chinese-Llama-2-7b 开源项目教程

Chinese-Llama-2-7b 开源项目教程 Chinese-Llama-2-7b开源社区第一个能下载、能运行的中文 LLaMA2 模型！项目地址:https://gitcode.com/gh_mirrors/ch/Chinese-Llama-2...

AIGC 2024-08-31 人工智能

842阅读

8G显存运行Llama 3.1 405B！

我正在接受挑战，在只有 8GB VRAM 的 GPU 上运行 Llama 3.1 405B 模型。 Llama 405B 模型有 820GB！这是 8GB VRAM 容量的 103 倍！显然，8GB VRAM 无法容纳它。那么我们如何让它工作呢？...

大数据 2024-08-31 人工智能

802阅读

【大模型理论篇】关于LLaMA 3.1 405B以及小模型的崛起

前不久，Meta开源了LLaMA 3.1 405B【1】，模型扩展了上下文长度至 128K，支持八种语言，效果非常惊艳，是首个在通用知识、可操控性、数学、工具使用和多语言翻译方面能够与最先进闭源 AI 模型媲美的公开可用模型，已经赶上截至目...

生成式AI 2024-08-31 人工智能

798阅读

【AI绘画】Midjourney前置指令/describe、/shorten详解

文章目录 ?前言 ?Midjourney前置指令/describe 使用方法 1️⃣2️⃣3️⃣4️⃣（选择对应提示词生成图片） ?（重新识别生成一组提示词） ?Imagine all（一次性生成所有提示词对应的图片）注意 ?Midjou...

AIGC 2024-08-31 人工智能

1136阅读

AIGC大模型产品经理高频面试大揭秘‼️

近期有十几个学生在面试大模型产品经理（薪资还可以，详情见下图），根据他们面试（包括1-4面）中出现高频大于3次的问题汇总如下，一共32道题目（有答案）。 29.讲讲T5和Bart的区别，讲讲Bart的DAE任务 T5（Text-to-Text Tr...

人工智能 2024-08-31 人工智能

745阅读

Meta AI新动向：Llama 4瞄准GPT-4，Agent技术或成研发重点

Meta的AI研发进展 Meta的AI科学家Thomas Scialom在最近的采访中透露了Llama系列大型语言模型的最新动态。Scialom谈到了Llama 3.1的研发思路，并展望了即将到来的Llama 4模型。他表示，Llama 3.1是在追求与...

AIGC 2024-08-31 人工智能

613阅读

Stable Diffusion的微调方法原理总结

目录 1、Textural Inversion（简易） 2、DreamBooth（完整） 3、LoRA（灵巧） 4、ControlNet（彻底） 5、其他 1、Textural Inversion（简易）不改变网络结构...

生成式AI 2024-08-31 人工智能

842阅读

论文分析｜高效长文本生成的技术与应用

Preface 前言目前大模型公司很多在追求长文a本，对算力需求极大，如何能够现实地处理该问题很重要。特别是随着Transformer模型尺寸和复杂性的增长，它们在训练期间的内存需求呈指数级增加。语言模型训练的瓶颈在于显存占用非常大，这需要创...

生成式AI 2024-08-30 人工智能

623阅读

全球3.5亿下载量破纪录！ Llama家族暴涨10倍，开源帝国掀AI革命

【新智元导读】诞生一年半，Llama家族早已稳坐开源界头把交椅。最新报告称，Llama全球下载量近3.5亿，是去年同期的10倍。而模型开源让每个人最深体会是，token价格一降再降。 Llama一举成为世界开源的领头羊。截至目前，Llama模型在开源平台...

人工智能 2024-08-30 人工智能

589阅读

The Llama 3 Herd of Models

本文是LLM系列文章，针对《The Llama 3 Herd of Models》的翻译。 LLama3模型摘要 1 引言 2 一般概述 3 预训练 3.1 预训练数据 3.1.1 网络数据管...

大数据 2024-08-30 人工智能

795阅读

阿里重磅开源Qwen2-VL：能理解超20分钟视频，媲美GPT-4o！

阿里巴巴开源了最新视觉多模态模型Qwen2-VL，根据测试数据显示，其72B模型在大部分指标超过了OpenAI的GPT-4o，Anthropic的Claude3.5-Sonnet等著名闭源模型，成为目前最强多模态模型之一。 Qwen2-VL支持中文、英文、...

生成式AI 2024-08-30 人工智能

830阅读

【开发心得】Dify部署ollama模型的坑[1]

本文接续上次的文章【开发心得】三步本地化部署llama3大模型_dify llama3-CSDN博客经过几次调试，目前部署终于稳定下来，由于算力问题产生的300 time out也逐渐减少了。因此，把后续在测试过程中碰到的一些坑和怎么爬出来，做一个记录...

人工智能 2024-08-30 人工智能

6208阅读

【AIGC】训练数据入库（Milvus）

之前的文章有写如何获取数据、如何补充数据，也有说如何对数据进行清洗、如何使用结构化数据进行训练。但好像没有说如何将训练数据“入库”。这里说的入库不是指 MySQL 数据库，而是指向量检索库 Milvus。众所周知，人工智能多用向量数据进行训练。数据先做...

生成式AI 2024-08-30 人工智能

690阅读

英伟达Blackwell称霸MLPerf！推理性能暴涨30倍，新一代「AI怪兽」诞生

【新智元导读】MLPerf Inference发布了最新测试结果，英伟达最新的Blackwell架构芯片上场与谷歌、AMD同场竞技，展现出明显的性能提升，甚至刷新了部分任务上的测试纪录。大语言模型（LLM）推理是一个全栈挑战。为了实现高吞吐量、低延迟的...

生成式AI 2024-08-29 人工智能

607阅读

NVIDIA把Llama-3的上下文长度扩展16倍，长上下文理解能力超越GPT-4

在 Llama-3.1 模型发布之前，开源模型与闭源模型的性能之间一直存在较大的差距，尤其是在长上下文理解能力上。大模型的上下文处理能力是指模型能够处理的输入和输出 Tokens 的总数。这个长度有一个限制，超过这个限制的内容会被模型忽略。一般而...

生成式AI 2024-08-29 人工智能

575阅读

VAD-LLaMA：基于大语言模型的视频异常检测和解释（Video Anomaly Detection and Explanation via Large Language Models）

文章目录问题方法整体架构 VE and Feature Extraction Long-Term Context (LTC Module Feature Adaptor LLaMA 训练流程图第一阶段：训练VADor 第二阶段...

大数据 2024-08-29 人工智能

763阅读

使用gradio部署微调后的模型

文章目录概要整体架构流程技术细节小结概要使用gradio部署微调后的模型整体架构流程 gradio前期学习，以下是一些常见的输入输出组件，有些即可输入也可输出 gr.Audio(sources=['mi...

AIGC 2024-08-29 人工智能

1443阅读

在LangChain中使用Llama.cpp：从安装到实践

在LangChain中使用Llama.cpp：从安装到实践引言 Llama.cpp是一个高效的C++库，用于在CPU上运行大型语言模型（LLMs）。本文将介绍如何在LangChain中集成和使用Llama.cpp，包括安装、设置以及使用LLM和嵌...

AIGC 2024-08-29 人工智能

1047阅读

全网最全RAG评估指南：全面解析RAG评估指标并提供代码示例

一、RAG痛点介绍最近我一直在关注和优化RAG（Retrieval-Augmented Generation）相关的内容，总结了一下RAG的痛点和最佳实践，然后重点会介绍如何评估RAG。二、RAG痛点优化认识了RAG的痛点，就知道如...

AIGC 2024-08-28 人工智能

1220阅读

LLaMA3技术报告解读

前言 LLaMA系列算法是Meta公司发布的开源大模型。近期Meta公司又发布了LLaMA 3.1系列的模型，在这一系列模型中参数量最大的高达405B，上下文窗口多达128K个token。同时对模型进行了广泛的实证评估，发现在很多任务中，LLaMA 3...

生成式AI 2024-08-28 人工智能

1093阅读

探索GitHub Copilot的深度洞见：Copilot Metrics Viewer全面解析

探索GitHub Copilot的深度洞见：Copilot Metrics Viewer全面解析 copilot-metrics-viewerTool to visualize the Copilot metrics provided via the...

AIGC 2024-08-27 人工智能

762阅读

Code Llama使用手册

Code Llama 是 Llama 2 的一系列最先进的开放访问版本，专门用于代码任务，我们很高兴发布与 Hugging Face 生态系统的集成！ Code Llama 已使用与 Llama 2 相同的宽松社区许可证发布，并且可用于商业用途。今天，...

人工智能 2024-08-27 人工智能

834阅读

Llama 3.1论文中文对照翻译

The Llama 3 Herd of Models 模型群 Llama 3 Llama Team, Al @ Meta 1...

生成式AI 2024-08-27 人工智能

833阅读

ChatGLM-6B入门

ChatGLM-6B ChatGLM-6B 一、介绍 ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型，基于 General Language Model (GLM 架构，具有 62 亿参数。结合模型量化技术，用户可以在消费级的显卡...

AIGC 2024-08-27 人工智能

583阅读

深度解读 Llama 3.1 技术报告：从405B参数到24000块H100集群

Meta在最近发布了他们的开源大模型Llama 3.1，引起了广泛的关注和讨论。随着热度逐渐退潮，Llama 3.1 的详细技术报告也公开了。这份报告揭示了很多关于Llama 3.1 的技术细节和实现原理。本文将从模型参数、基础设施、预训练、后训练等方面，...

大数据 2024-08-27 人工智能

921阅读

【从Qwen2,Apple Intelligence Foundation,Gemma 2,Llama 3.1看大模型的性能提升之路】

从早期的 GPT 模型到如今复杂的开放式 LLM，大型语言模型 (LLM 的发展已经取得了长足的进步。最初，LLM 训练过程仅侧重于预训练，但后来扩展到包括预训练和后训练。后训练通常包括监督指令微调和校准，这是由 ChatGPT 推广的。自 Chat...

人工智能 2024-08-26 人工智能

714阅读

解锁黑科技！百度AppBuilder助你秒变开发者，轻松实现文心一言

在数字化浪潮席卷全球的今天，人工智能（AI）和大模型技术正以前所未有的速度改变着我们的世界。从自然语言处理到图像识别，从智能推荐到自动化决策，大模型以其强大的数据处理能力和学习能力，正成为推动科技创新的核心动力。然而，对于许多开发者而言，如何高效、便捷...

大数据 2024-08-26 人工智能

866阅读

AI风险管理新利器：SAIF CHECK利用Meta Llama 3保障合规与安全

每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同...

大数据 2024-08-25 人工智能

644阅读

微调LLama 3.1——七月论文审稿GPT第5.5版：拿早期paper-review数据集微调LLama 3.1

前言为更好的理解本文，建议在阅读本文之前，先阅读以下两篇文章七月论文审稿GPT第2版：用一万多条paper-review数据微调LLaMA2 7B最终反超GPT4 提升大模型数据质量的三大要素：找到早期paper且基于GPT摘要出来7方面revi...

大数据 2024-08-25 人工智能

661阅读

大模型算法必学，万字长文Llama-1到Llama-3详细拆解

导读 Llama系列的大语言模型在多个自然语言处理任务中表现出色，包括文本分类、情感分析和生成式问答，本质是使用 Transformer 架构并结合预训练和微调技术。本文详细讲解Llama-1到Llama-3，值得读者点赞收藏！引言在AI领域...

AIGC 2024-08-25 人工智能

1012阅读

基于autodl与llama-factory部署llama3-8B开源大模型

一、注册与购买autodl实例注册了autodl账号以后，我们便可以在网站首页看到具体的实例信息，同时能够观察其具体的系统盘与数据盘以及缓存大小，对于我们即将微调的llama3开源大模型来说，通过资料的查询了解，我们只需要24G显存就可...

大数据 2024-08-25 人工智能

1056阅读

Llama 3.1深度解析：405B、70B及8B模型的多语言与长上下文处理能力

Llama 3.1 发布了！今天我们迎来了 Llama 家族的新成员 Llama 3.1 进入 Hugging Face 平台。我们很高兴与 Meta 合作，确保在 Hugging Face 生态系统中实现最佳集成。Hub 上现有八个开源权重模型 (3 个...

人工智能 2024-08-25 人工智能

1001阅读

Datawhale AI夏令营第四期魔搭-AIGC方向 task02 精读代码，实战进阶

今天我们的任务是对baseline的代码有一个更加细致的理解，然后我们会学习如何借助AI来提升我们的自学习能力，从而帮助大家在后面的学习工作中如何从容迎接各种挑战。授人以鱼不如授人以渔，你可以从中学大模型的提问技巧来实现快速学习，学会如何制作一个话剧连环画...

生成式AI 2024-08-25 人工智能

585阅读