token 第7页 - AIGC资讯

最强大模型 Llama 3.1-405B 架构设计剖析

—1— 最强大模型 Llama 3.1-405B 简介在历经了两天的提前“泄露风波”后，Llama 3.1 终于正式揭开面纱，由官方对外公布。新版 Llama 3.1 将其上下文处理能力扩展至 128K，推出了 8B、70B 及 405B 三个不...

人工智能 2024-08-05 人工智能

1322阅读

LLaMA模型量化方法优化:提高性能与减小模型大小

LLaMA模型量化方法优化:提高性能与减小模型大小 LLaMA模型量化方法优化:提高性能与减小模型大小引言新增量化方法性能评估 7B模型 13B模型结果分析结论 LLaMA模型量化方法优化:提高性能与减小模型大小...

AIGC 2024-08-05 人工智能

1373阅读

如何定量分析 Llama 3，大模型系统工程师视角的 Transformer 架构

读完全文后，你将获得回答以下问题的能力（参考答案，请见最后一章节）： Llama 3 技术博客说 70B 模型、最长序列 8K、15T Tokens，训练了 640w GPU 时，这发挥了 H100 理论算力（989TFlops）的百分之多少?...

大数据 2024-08-05 人工智能

870阅读

The Llama 3 Herd of Models.Llama 3 模型第1,2,3部分全文

现代人工智能(AI 系统是由基础模型驱动的。本文提出了一套新的基础模型，称为Llama 3。它是一组语言模型，支持多语言、编码、推理和工具使用。我们最大的模型是一个密集的Transformer，具有405B个参数和多达128K个tokens...

大数据 2024-08-04 人工智能

966阅读

比OpenAI的Whisper快50%，最新开源语音模型

生成式AI初创公司aiOla在官网开源了最新语音模型Whisper-Medusa，推理效率比OpenAI开源的Whisper快50%。 aiOla在Whisper的架构之上进行了修改采用了“多头注意力”机制的并行计算方法，允许模型在每个推理步骤中预测多个t...

人工智能 2024-08-04 人工智能

970阅读

LLamafactory用作Formatter的方法Qwen/lib/python3.12/abc.py

Qwen/lib/python3.12/abc.py class abstractstaticmethod(staticmethod : """A decorator indicating abstract staticmethods....

AIGC 2024-08-04 人工智能

768阅读

LLM大语言模型-ChatGPT、LLaMA、ChatGLM、文心一言、通义千问

LLM大语言模型-ChatGPT、LLaMA、ChatGLM、文心一言、通义千问一、LLM与PLM主要区别： LLM表现出PLM所没有的Emergent Abilities（涌现能力）,这些能力是LLM在复杂任务上表现惊人的关键，使得得人工智能算...

人工智能 2024-08-03 人工智能

1262阅读

普通电脑也能跑大模型，三步搞定私人AI助手 | LLaMA-3本地部署小白攻略

“ 在你的电脑上运行一个强大的AI助手，它不仅能力超群，还把所有秘密都藏在你的硬盘里。好奇这是如何实现的吗？动动手，三分钟就可以完成LLaMA-3的本地部署！” 01 — LLaMA-3‍‍‍‍ 最近在试验检索增强生成（RAG）...

AIGC 2024-08-03 人工智能

1146阅读

使用Claude 3.5 Sonnet和Stable Diffusion XL：如何通过Amazon Bedrock不断优化图像生成直到满足需求

在Amazon Bedrock的AI模型中，Anthropic Claude 3系列现在新增了图像识别功能。特别是最新的Anthropic Claude 3.5 Sonnet，图像识别能力得到了显著提升。我进行了一些简单的试验和比较，深入探索了这些Clau...

大数据 2024-08-03 人工智能

1276阅读

比肩 GPT-4o 的 Llama 3.1 本地部署快速体验的方法

比肩 GPT-4o 的 Llama 3.1 本地部署快速体验的方法 flyfish Llama 3.1模型简介 Llama 3.1是一系列大型语言模型，包含以下几种规模： 8B 参数：模型中有80亿个参数 70B 参数：模型中有700亿个参数...

人工智能 2024-08-03 人工智能

1082阅读

导出 Whisper 模型到 ONNX

前言在语音识别领域，Whisper 模型因其出色的性能和灵活性备受关注。为了在更多平台和环境中部署 Whisper 模型，导出为 ONNX 格式是一个有效的途径。ONNX（Open Neural Network Exchange）是一个开放格式...

AIGC 2024-08-03 人工智能

1803阅读

媲美Midjourney-v6，Kolors最新文生图模型部署

Kolors模型是由快手团队开发的大型文本到图像生成模型，专门用于将文本描述转换成高质量的图像。 Kolors模型支持中英文双语输入，生成效果与Midjourney-v6相媲美，能够处理长达256个字符的文本输入，具备生成中英文文字的能力。 Kolor...

生成式AI 2024-08-02 人工智能

1064阅读

深度学习论文: LLaMA: Open and Efficient Foundation Language Models

深度学习论文: LLaMA: Open and Efficient Foundation Language Models LLaMA: Open and Efficient Foundation Language Models PDF:https://ar...

AIGC 2024-08-02 人工智能

971阅读

GPU训Llama 3.1疯狂崩溃，竟有大厂用CPU服务器跑千亿参数大模型？

马斯克19天建成由10万块H100串联的世界最大超算，已全力投入Grok3的训练中。与此同时，外媒爆料称，OpenAI和微软联手打造的下一个超算集群，将由10万块GB200组成。在这场AI争霸赛中，各大科技公司们卯足劲加大对GPU的投资，似乎在暗示着拥...

大数据 2024-08-01 人工智能

920阅读

llama大模型提前停止策略，实现工具调用——以Llama3为例

在大模型的generate过程中为了实现工具调用功能，模型输出到了指定的token需要执行工具的时候，需要模型的generate停止。model.generate( 的参考链接：https://github.com/huggingface/transfor...

生成式AI 2024-08-01 人工智能

1833阅读

Llama 3.1要来啦？！测试性能战胜GPT-4o

哎呀，Meta声称将于今晚发布的Llama 3.1，数小时前就在Hugging Face上泄露出来了？泄露的人很有可能是Meta员工？还是先来看泄露出来的llama3.1吧。新的Llama 3.1模型包括8B、70B、405B三个版本。而经...

人工智能 2024-08-01 人工智能

808阅读

击败GPT-4o的开源模型如何炼成？关于Llama 3.1 405B，Meta都写在这篇论文里了

经历了提前两天的「意外泄露」之后，Llama 3.1 终于在昨夜由官方正式发布了。 Llama 3.1 将上下文长度扩展到了 128K，拥有 8B、70B 和 405B 三个版本，再次以一已之力抬高了大模型赛道的竞争标准。对 AI 社区来说，...

大数据 2024-08-01 人工智能

725阅读

接入百度文心一言API教程

然后，编辑文章。点击AI识别摘要，然后保存即可 COREAIPOWER设置暂时只支持经典编辑器.古腾堡编辑器等几个版本后支持.在比期间,你可以自己写点摘要摘要内容 AL识别摘要清空若有收获，就点个赞吧接入文心一言现...

人工智能 2024-08-01 人工智能

1258阅读

LLMs之Llama 3.1：Llama 3.1的简介、安装和使用方法、案例应用之详细攻略

LLMs之Llama 3.1：Llama 3.1的简介、安装和使用方法、案例应用之详细攻略导读：2024年7月23日，Meta重磅推出Llama 3.1。本篇文章主要提到了Meta推出的Llama 3.1自然语言生成模型。 >>...

人工智能 2024-07-31 人工智能

1552阅读

如何有效地使用Code Llama：AI编程助手的实用指南

在当今快速发展的人工智能时代，编程领域也迎来了革命性的变革。Meta公司最近发布的Code Llama模型就是这一趋势的代表作。本文将深入探讨如何充分利用Code Llama的各种功能，为开发者提供一个全面的指南，帮助您更好地理解和应用这一强大的AI编程工...

人工智能 2024-07-31 人工智能

1278阅读

AIGC助力ResNet分类任务：跃升10个百分点

目录 AIGC?缓解数据稀缺问题❓ 论文研究的动机✏️ 作者是怎么做的❓ 实验配置? 实验结果? 结论✅ 实践? 要增强的裂缝图片按照论文中的参数在stable-diffusionv1-5上进行textual inversion微调...

生成式AI 2024-07-31 人工智能

816阅读

微信小程序调用文心一言数据模型

微信小程序调用文心一言数据模型目录微信小程序调用文心一言数据模型 1.百度千帆大模型平台介绍 2.调用模型程序实现 1.百度千帆大模型平台介绍调用：首先要与数据模型API的地址建立连接，利用微信自带api-wx.reques...

生成式AI 2024-07-31 人工智能

1418阅读

AIGC实战：LLaMA2打造中文写作利器——数据准备与模型训练全攻略

目录一、下载并加载中文数据集二、中文数据集处理 1、数据格式 2、数据集处理之tokenizer训练格式 1）先将一篇篇文本拼凑到一起（只是简单的拼凑一起，用于训练tokenizer） 2...

人工智能 2024-07-30 人工智能

963阅读

AI日报：iOS 18.1开发者测试版上线；Vidu视频生成模型上线；Gen-3 Alpha上线图生视频

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、苹果 iOS 18.1 开发者...

AIGC 2024-07-30 人工智能

793阅读

Unsloth 微调 Llama 3

本文参考：https://colab.research.google.com/drive/135ced7oHytdxu3N2DNe1Z0kqjyYIkDXp 改编自：https://blog.csdn.net/qq_38628046/article/det...

AIGC 2024-07-30 人工智能

1130阅读

stable diffusion文生图代码解读

使用diffusers运行stable diffusion，文生图过程代码解读。只按照下面这种最简单的运行代码，省略了一些参数的处理步骤。 from diffusers import DiffusionPipeline pipeline = Diffu...

大数据 2024-07-29 人工智能

1181阅读

一文速览Llama 3.1——对其92页paper的全面细致解读：涵盖语言、视觉、语音的架构、原理

前言按我原本的计划，我是依次写这些文章：解读mamba2、解读open-television、我司7方面review微调gemma2，再接下来是TTT、nature审稿微调、序列并行、Flash Attention3.. 然TTT还没写完，7.23日...

人工智能 2024-07-29 人工智能

1139阅读

用LoRA微调 Llama 2：定制大型语言模型进行问答

Fine-tune Llama 2 with LoRA: Customizing a large language model for question-answering — ROCm Blogs (amd.com 在这篇博客中，我们将展示如何在AM...

AIGC 2024-07-29 人工智能

944阅读

hunyuandit_pytorch AIGC 以文生图模型

HunyuanDiT 论文 Hunyuan-DiT : A Powerful Multi-Resolution Diffusion Transformer with Fine-Grained Chinese Understanding https:/...

AIGC 2024-07-28 人工智能

923阅读

为什么AI数不清Strawberry里有几个 r？Karpathy：我用表情包给你解释一下

让模型知道自己擅长什么、不擅长什么是一个很重要的问题。还记得这些天大模型被揪出来的低级错误吗? 不知道9.11和9.9哪个大，数不清 Strawberry 单词里面有多少个 r…… 每每被发现一个弱点，大模型都只能接受人们的无情嘲笑。嘲笑之后，大家也...

大数据 2024-07-28 人工智能

2515阅读

AI多模态模型架构之LLM主干(3)：Llama系列

〔探索AI的无限可能，微信关注“AIGCmagic”公众号，让AIGC科技点亮生活〕本文作者：AIGCmagic社区刘一手前言 AI多模态大模型发展至今，每年都有非常优秀的工作产出，按照当前模型设计思路，多模态大模型的架构主要包括...

大数据 2024-07-28 人工智能

1288阅读

函数调用：在 xLAM 上微调 Llama 3得益于 QLoRA，速度快且内存高效

欢迎来到雲闪世界.最近的大型语言模型 (LLM 在大多数语言生成任务中都表现出色。然而，由于它们基于下一个标记预测进行操作，因此它们通常难以准确执行数学运算。此外...

生成式AI 2024-07-27 人工智能

944阅读

LLama 405B 技术报告解读

LLama 405B 技术报告解读果然传的消息都是真的，meta在24号凌晨发布了llama 3的405B版本，这次还是做一个技术报告解读。值得一提的是，在技术报告的开头，meta特意强调了一个 Managing complexity，大意是管控...

生成式AI 2024-07-27 人工智能

941阅读

在modelscope（魔塔）部署自己的Stable-Diffusion-WebUI并实现网络穿透，可外部调用

一、注册并登陆modelscope平台 modelscope账号的注册这里就不做过多的介绍，大家可以自行搜索完成账号注册及实名认证，领取免费GPU算力；登陆后按下图指示依次点击选择对应配置，最后点击‘启动’开启并进入服务器...

人工智能 2024-07-27 人工智能

1617阅读

硅谷AI保卫战打响！最强4050亿开源模型Llama 3.1上线，OpenAI：GPT-4o mini免费用｜最新快讯

Meta CEO扎克伯格强调，美国在 AI 发展方面永远领先中国数年是不现实的。但他也指出，即使是几个月的微小领先也会随着时间的推移而“积少成多”，从而使美国获得“明显优势”。（图片来源：Meta AI）就在今天凌晨，Meta和OpenAI...

大数据 2024-07-27 人工智能

920阅读

LLama+Mistral+…+Yi=? 免训练异构大模型集成学习框架DeePEn来了

LLama+Mistral+…+Yi=? 免训练异构大模型集成学习框架DeePEn来了机器之心 2024年07月19日 12:27 辽宁 AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了200...

AIGC 2024-07-27 人工智能

944阅读

GPT-4o mini实力霸榜，限时2个月微调不花钱，每天200万训练token免费薅

Llama3.1405B巨兽开源的同时，OpenAI又抢了一波风头。从现在起，每天200万训练token免费微调模型，截止到9月23日。 Llama3.1开源的同一天，OpenAI也open了一回。收到邮件的开发者们激动地奔走相告，这么大的羊毛一定...

AIGC 2024-07-27 人工智能

850阅读

微调神器LLaMA-Factory官方保姆级教程来了，从环境搭建到模型训练评估全覆盖

编者注：之前一直用firefly做微调，最近切换到LLaMA-Factory，发现不但简单易用，而且非常全面，有点相见恨晚的感觉。使用过程中我主要参考2个文档，一个是github上的官方中文文档： https://github.com/hiyouga/L...

AIGC 2024-07-27 人工智能

1363阅读

自回归模型胜过扩散模型：用于可扩展图像生成的 Llama

? 文献卡 Autoregressive Model Beats Diffusion: Llama for Scalable Image Generation 作者: Peize Sun; Yi Jiang; Shoufa Chen; Shil...

人工智能 2024-07-27 人工智能

1147阅读

ChatGLM3-6B使用lora微调实体抽取，工具LLaMA-Factory，医学数据集CMeEE

一、下载ChatGLM3-6B 下载地址，需要魔法测试模型：新建文件predict.py。运行下面测试代码。建议这里的transformers包最好和LLaMA-Factory环境的transformers包版本保持一致或者直接用LLaMA-Fa...

AIGC 2024-07-26 人工智能

1352阅读

AI日报：OpenAI推搜索引擎SearchGPT；智谱推AI视频产品清影；字节发布豆包图生图模型；B站上线AIGC推荐广告标题功能

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/ 1、挑战谷歌!OpenAI推搜索引...

大数据 2024-07-26 人工智能

852阅读

LoRA6~Stable Diffusion

这里说LoRA 在 Stable Diffusion 中的三种应用 LoRA 是当今深度学习领域中常见的技术。对于 SD，LoRA 则是能够编辑单幅图片、调整整体画风，或者是通过修改训练目标来实现更强大的功能。LoRA 的原理非常简单，它其实就是用两个参...

人工智能 2024-07-26 人工智能

901阅读

大模型智障检测+1：Strawberry有几个r纷纷数不清，最新最强Llama3.1也傻了

继分不清9.11和9.9哪个大以后，大模型又“集体失智”了! 数不对单词“Strawberry”中有几个“r”，再次引起一片讨论。 GPT-4o不仅错了还很自信。刚出炉的Llama-3.1405B，倒是能在验证中发现问题并改正。比较离谱的是Clau...

AIGC 2024-07-25 人工智能

889阅读

AI训AI惨遭投毒9次大崩溃，牛津剑桥等惊天发现登Nature封面！

9次迭代后，模型开始出现诡异乱码，直接原地崩溃!就在今天，牛津、剑桥等机构的一篇论文登上了Nature封面，称合成数据就像近亲繁殖，效果无异于投毒。有无破解之法?那就是——更多使用人类数据! 用AI生成的数据训练AI，模型会崩溃? 牛津、剑桥、帝国理工、多...

人工智能 2024-07-25 人工智能

930阅读

OpenAI掀桌子！免费提供GPT-4o mini微调，每天200万tokens

OpenAI宣布从今天开始到9月23日，免费为4级、5级用户提供GPT-4o mini微调服务，帮助开发者打造特定业务用例的生成式AI应用。在这期间，每天限制200万tokens数据，超过的部分将按照每10万tokens3美元收取。从9月24日开始，每1...

大数据 2024-07-25 人工智能

750阅读

【大语言模型LLMs】Llama系列简介

【大语言模型LLMs】Llama系列简介文章目录【大语言模型LLMs】Llama系列简介 1. LLaMa 1.1 引言 1.2 方法 1.2.1 预训练数据 1.2.2 架构 1.2.3 优化器 1.2.4 效率 2....

大数据 2024-07-24 人工智能

1237阅读

【大模型】微调实战—使用 ORPO 微调 Llama 3

ORPO 是一种新颖微调（fine-tuning）技术，它将传统的监督微调（supervised fine-tuning）和偏好对齐（preference alignment）阶段合并为一个过程。这减少了训练所需的计算资源和时间。此外，实证结果表明，ORP...

大数据 2024-07-24 人工智能

1126阅读

GPT-4o mini登顶大模型竞技场，奥特曼：两个月内微调免费

刚刚，GPT-4o mini版迎来“高光时刻”—— 登顶了lmsys大模型竞技场，和满血版并列第一，还把Claude3.5甩在了身后。不同于一般的数据集测评，大模型竞技场是用户自己出题、用脚投票的结果，无法通过“刷题”来走捷径，因此更为真实。这个成绩...

大数据 2024-07-24 人工智能

790阅读

Stable Diffusion工作原理一篇文章带你详解！

前言翻译自How does Stable Diffusion work? 1. SD能做什么最基本的功能是：文生图（text-to-image） SD以文字提示为输入，输出与提示相配的图像 2. 扩散模型 SD属于扩散模...

大数据 2024-07-24 人工智能

1093阅读

AI应用的流量“炼金术”

“五个离职同事里，至少有三个人在搞应用”，一位刚从大厂离职的员工告诉光子星球。大厂高管出走、组团找融资，大热项目组成员离职看应用，是目前AI赛道最真实的写照。进入2024年，模型层大局已定，鲜少有新玩家能够进入。而卷生卷死的AI应用，门槛不高，投入成本...

AIGC 2024-07-24 人工智能

788阅读