llama - AIGC资讯

开源模型应用落地-qwen2.5-7b-instruct-LoRA微调-LLaMA-Factory-单机单卡-V100（十八）

一、前言本篇文章将使用LLaMA-Factory去高效微调（命令和界面方式）QWen2.5系列模型，通过阅读本文，您将能够更好地掌握这些关键技术，理解其中的关键技术要点，并应用于自己的项目中。 QWen2系列模型微调: 开源模型应用落...

AIGC 2024-10-12 人工智能

3939阅读

大模型培训讲师叶梓:Llama Factory 微调模型实战分享提纲

LLaMA-Factory ——一个高效、易用的大模型训练与微调平台。它支持多种预训练模型，并且提供了丰富的训练算法，包括增量预训练、多模态指令监督微调、奖励模型训练等。 LLaMA-Factory的优势在于其简单易用的界面和强大的功能。用户可以在不编写...

大数据 2024-10-06 人工智能

1436阅读

Llama 3.1大模型的预训练和后训练范式解析

Meta的Llama大型语言模型每次出新版本，都会是一大事件。前段时间他们不仅发布了3.1的一个超大型的405亿参数模型，还对之前的8亿和70亿参数的模型做了升级，让它们在MMLU测试中的表现更好了。不同模型在MMLU基准测试中的表现他们还...

人工智能 2024-10-06 人工智能

1380阅读

Meta推出Llama 3.2 AI模型，支持多模态和边缘计算；OpenAI首席技术官穆拉蒂宣布离职

? AI新闻 ? Meta推出Llama 3.2 AI模型，支持多模态和边缘计算摘要：Meta于9月25日发布Llama 3.2 AI模型，具备开放性和可定制性，支持开发者实现边缘人工智能和视觉应用。该系列包含多模态视觉模型（11B和90B）及轻...

人工智能 2024-10-05 人工智能

1337阅读

如何在Android上运行Llama 3.2

引言随着Llama 3.2的发布，Meta在将强大的语言模型带到边缘和移动设备方面取得了重大进展。Llama 3.2包含了专为智能手机和平板电脑高效运行而设计的轻量级模型（1B和3B参数）。本教程将指导您通过MLC LLM库对Llama 3.2模型进...

AIGC 2024-10-05 人工智能

1934阅读

[240929] 12 款最佳免费开源隐写工具 | Llama 3.2: 开源、可定制模型，革新边缘人工智能和视觉体验

目录 12 款最佳免费开源隐写工具 Llama 3.2: 开源、可定制模型，革新边缘人工智能和视觉体验 12 款最佳免费开源隐写工具什么是隐写术？隐写术是一种将信息隐藏在其他信息中的艺术和科学，除了发送者和预期的接收者之外，...

AIGC 2024-10-05 人工智能

1456阅读

Meta又给OpenAI一记重击，视频生成Movie Gen震撼登场，甚至可以配音、编辑

在 OpenAI Sora 难产的时候，Meta 首次公开展示了自家的「用于媒体的突破性生成式 AI 研究」:Meta Movie Gen。 Meta 在相应博客中使用了「premiere」一词，也就是初次展示，因此手痒的用户可能还得再等上一段时间。 M...

大数据 2024-10-05 人工智能

1327阅读

【大模型与AIGC】VLM基础知识汇总

这里写目录标题 LLM输入时的理解 1. Tokenizer的实现：Word极大似然估计 LLM推理：关于Attention mask的理解 1. CausalModel 与 AttentionMask 2. attention mask乘法...

生成式AI 2024-10-04 人工智能

1662阅读

开源语音实时交互新突破：LLaMA-Omni实现大语言模型无缝语音交互

像 GPT-4o 这样的模型通过语音实现了与大型语言模型（LLMs）的实时交互，与基于文本的传统交互相比，显著提升了用户体验。然而，目前在如何构建基于开源 LLMs 的语音交互模型方面仍缺乏探索。为了解决这个问题，我们提出了 LLaMA-Omni，这是一个...

生成式AI 2024-10-04 人工智能

1753阅读

Meta发布Llama 3.2，Llama 终于能看见了！

Llama家族再添新成员，多模态能力终于到来！ Meta刚刚发布了Llama 3.2模型系列，包括多模态视觉模型和小型文本模型，共计10个开放权重模型。这次更新不仅带来了期待已久的视觉能力，还为移动设备和边缘计算提供了更多选择。多模态Llam...

生成式AI 2024-10-04 人工智能

1884阅读

LLM | llama.cpp 安装使用（支持CPU、Metal及CUDA的单卡/多卡推理）

1. 详细步骤 1.1 安装 cuda 等 nvidia 依赖（非CUDA环境运行可跳过） # 以 CUDA Toolkit 12.4: Ubuntu-22.04/24.04(x86_64 为例，注意区分 WSL 和 Ubuntu，详见 http...

大数据 2024-10-04 人工智能

3857阅读

Llama Farm 项目教程

Llama Farm 项目教程 llama_farm Use local llama LLM or openai to chat, discuss/summarize your documents, youtube videos, and so o...

生成式AI 2024-10-04 人工智能

1429阅读

llama3.cuda: 纯C/CUDA实现的Llama 3模型使用教程

llama3.cuda: 纯C/CUDA实现的Llama 3模型使用教程 llama3.cudallama3.cuda is a pure C/CUDA implementation for Llama 3 model.项目地址:https://git...

AIGC 2024-10-03 人工智能

1341阅读

`llama-journey` 开源项目安装与使用指南

llama-journey 开源项目安装与使用指南 llama-journey Experimental adventure game with AI-generated content 项目地址: https://gitcode.com/g...

人工智能 2024-10-03 人工智能

1518阅读

在矩池云使用 Llama-3.2-11B-Vision 详细指南

Llama 3.2-Vision是Meta开发的一系列多模态大型语言模型（LLMs），包含11B和90B两种规模的预训练和指令调整模型。这些模型专门优化用于视觉识别、图像推理、字幕生成和回答有关图像的一般问题。Llama 3.2-Vision模型在常见...

生成式AI 2024-10-03 人工智能

2008阅读

中文法律LLaMA (Lawyer LLaMA) 使用教程

中文法律LLaMA (Lawyer LLaMA 使用教程 lawyer-llama中文法律LLaMA (LLaMA for Chinese legel domain 项目地址:https://gitcode.com/gh_mirrors/la/law...

人工智能 2024-10-03 人工智能

1641阅读

LLaMA-Factory 让大模型微调变得更简单！！

背景如果只需要构建一份任务相关的数据，就可以轻松通过网页界面的形式进行 Fine-tuning 微调操作，那么必将大大减轻微调工作量。今年的 ACL 2024见证了北航和北大合作的突破—论文《LLAMAFACTORY: 统一高效微调超百种语言...

AIGC 2024-10-03 人工智能

1663阅读

llama-factory实战: 基于qwen2.5-7b 手把手实战自定义数据集清洗微调

基于qwen2.5 手把手实战自定义数据集微调（llama-factory）准备工作 1.数据集准备（例:民法典.txt） 2.服务器准备（阿里云 DSW 白嫖） 3.环境配置 pip 升级模型下载微调助手 4.数据集处理脚...

生成式AI 2024-10-03 人工智能

2200阅读

从零预训练一个tiny-llama#Datawhale组队学习Task2

完整的教程请参考：datawhalechina/tiny-universe: 《大模型白盒子构建指南》：一个全手搓的Tiny-Universe (github.com 这是Task2的学习任务目录 Qwen-blog Tokenizer（分词器...

AIGC 2024-10-03 人工智能

1454阅读

Rusty Llama Webapp：用Rust打造的高效聊天机器人

Rusty Llama Webapp：用Rust打造的高效聊天机器人 rusty_llamaA simple ChatGPT clone in Rust on both the frontend and backend. Uses open sourc...

人工智能 2024-10-03 人工智能

1549阅读

Llama 3.1 技术研究报告-3

四、后训练我们通过对预训练检查点进⾏多轮后训练，或在预训练检查点的基础上与⼈类反馈（Ouyang等⼈，2022年；Rafailov等⼈，2024年）对⻬模型，以产⽣对⻬的Llama 3模型。每⼀轮后训练包括监督式微调（SFT）和直接偏好优化（DPO；...

人工智能 2024-10-02 人工智能

1658阅读

Chinese-Vicuna: 一个基于LLaMA的中文指令跟随模型

Chinese-Vicuna简介 Chinese-Vicuna是一个基于LLaMA的中文指令跟随模型，由研究者开发，旨在以低资源的方式实现高效的中文语言模型训练。该项目的主要目标是构建和分享可以在单个Nvidia RTX-2080TI上训练的中文指令跟随...

生成式AI 2024-10-02 人工智能

1236阅读

深度技术分析：Meta Llama 3模型训练故障剖析

## 摘要 Meta公司在一项涉及16,384个Nvidia H100 80GB GPU的Llama 3 405B模型训练中，遭遇了频繁的硬件故障。在54天的训练期间，平均每三小时就发生一次组件故障，其中半数故障与GPU或其HBM3内存有关。尽管面临如此挑...

AIGC 2024-10-02 人工智能

1426阅读

Unsloth 教程 - 如何微调 Llama-3并导出到 Ollama

本文翻译整理自：? How to Finetune Llama-3 and Export to Ollamahttps://docs.unsloth.ai/tutorials/how-to-finetune-llama-3-and-export-to-ol...

大数据 2024-10-02 人工智能

3545阅读

什么是Agentic RAG？

Agentic RAG是检索增强生成(Retrieval-Augmented Generation, RAG 技术的一种高级形式,它通过引入人工智能代理(Agent 的概念,为语言模型赋予了更高层次的智能和自主性。以下是Agentic RAG的主要特点和优...

人工智能 2024-10-02 人工智能

1754阅读

llama factory LoRA微调qwen大模型 | 新手炼丹记录(1)

往期回顾 llama factory LoRA微调qwen大模型 | 新手炼丹记录(1 -CSDN博客大模型使用llama.cpp转换gguf格式并量化 | 新手炼丹记录(2 -CSDN博客 oll...

生成式AI 2024-10-02 人工智能

2079阅读

LLaMa-Factory入门教程

LLaMa-Factory是一个基于人工智能技术的开源项目，专为大型语言模型（LLMs）的微调而设计。它提供了丰富的工具和接口，使得用户能够轻松地对预训练的模型进行定制化的训练和调整，以适应特定的应用场景。以下将详细介绍如何使用LLaMa-Factory：...

生成式AI 2024-10-02 人工智能

1694阅读

LLaMA-Lite：轻量级Llama模型简介与实战指南

LLaMA-Lite：轻量级Llama模型简介与实战指南 llama-lite Embeddings focused small version of Llama NLP model 项目地址: https://gitcode.com/gh_m...

AIGC 2024-10-02 人工智能

1702阅读

中科院提出GPT-4o实时语音交互的开源对手：Llama-Omni

论文：LLaMA-Omni: Seamless Speech Interaction with Large Language Models地址：https://arxiv.org/pdf/2409.06666 研究背景研...

生成式AI 2024-10-01 人工智能

1402阅读

【丹摩智算实战】手把手教你Llama 3.1 8B部署：开启自然语言处理新篇章

前言在自然语言处理（NLP）领域，大模型（LLM）的发展日新月异，为各种应用场景带来了前所未有的能力。近日，Meta公司宣布推出了其最新的开源模型——Llama 3.1，这一消息在行业内引起了广泛关注。本文将详细介绍Llama 3.1的背景、特点、部...

生成式AI 2024-10-01 人工智能

1598阅读

AMD发布首个AI小语言模型：6900亿token、推测解码提速3.88倍

快科技10月1日消息，AMD发布了自己的首个小语言模型(SLM ，名为AMD-135M”。相比于越来越庞大的大语言模型(LLM ，它体积小巧，更加灵活，更有针对性，非常适合私密性、专业性很强的企业部署。 AMD-135小模型隶属于Llama家族，有两个版...

大数据 2024-10-01 人工智能

1331阅读

LLaMA- Adapter: Efficient Fine-tuning of Language Models with Zero-init Attention

发表时间：14 Jun 2023 论文链接：https://arxiv.org/pdf/2303.16199 作者单位：Shanghai Artificial Intelligence Laboratory Motivation：最近，指令跟踪模型取...

大数据 2024-10-01 人工智能

1587阅读

Ubuntu LLaMA-Factory实战

一、Ubuntu LLaMA-Factory实战安装： CUDA 安装 CUDA 是由 NVIDIA 创建的一个并行计算平台和编程模型，它让开发者可以使用 NVIDIA 的 GPU 进行高性能的并行计算。首先，在 https://develop...

生成式AI 2024-10-01 人工智能

1623阅读

LLaMA-Factory 安装和配置指南

LLaMA-Factory 安装和配置指南 LLaMA-Factory 易于使用的LLM微调框架（LLaMA, BLOOM, Mistral, 百川， Qwen, ChatGLM）。项目地址: https://gitcode.com/gh_m...

人工智能 2024-10-01 人工智能

5683阅读

Windows安装docker，启动ollama运行open-webui使用AIGC大模型写周杰伦歌词

Windows安装docker，启动ollama运行open-webui使用AIGC大模型写周杰伦歌词 1、下载docker的Windows版本。 docker下载地址： https://docs.docker.com/desktop/insta...

生成式AI 2024-10-01 人工智能

2139阅读

1500+ HuggingFace API token暴露，使数百万 Meta-Llama、Bloom 等大模型用户面临风险

HugginingFace 和 GitHub 是AI开发人员的重要平台，因此我们决定对这些平台做更为深入的研究。在这项研究中，我们发现了数以千计的 API 令牌，这些令牌暴露给恶意行为者，使数百万最终用户可能受到攻击。本文的主要内容包括：...

人工智能 2024-10-01 人工智能

1464阅读

探索LLaMA模型的无限可能：LLaMA API服务器项目推荐

探索LLaMA模型的无限可能：LLaMA API服务器项目推荐 llama-api An OpenAI-like LLaMA inference API 项目地址: https://gitcode.com/gh_mirrors/ll/llama...

大数据 2024-10-01 人工智能

1617阅读

使用llama.cpp 在推理MiniCPM-1.2B模型

llama.cpp 是一个开源项目，它允许用户在C++中实现与LLaMA（Large Language Model Meta AI）模型的交互。LLaMA模型是由Meta Platforms开发的一种大型语言模型，虽然llama.cpp本身并不包含LLaM...

AIGC 2024-10-01 人工智能

1551阅读

使用Ollama本地部署Llama 3.1大模型

Llama 3.1 介绍 2024 年 7 月 24 日，Meta 宣布推出迄今为止最强大的开源模型——Llama 3.1 405B，Llama 3.1 405B 支持上下文长度为 128K Tokens，增加了对八种语言的支持，号称第一个在常识、可...

人工智能 2024-10-01 人工智能

2566阅读

【Llama3.1-8B-Instruct】Llama Factory 等部署实战

一、模型介绍 Meta Llama 3.1 系列是一个多语言大型语言模型 (LLM 集合，包括 8B、70B 和 405B 三种尺寸（文本输入/文本输出）。Llama 3.1 的指令调优版本（8B、70B、405B）针对多语言对话用例进行了优化，并在常...

人工智能 2024-09-30 人工智能

2981阅读

Meta Llama 3介绍及其关键技术

随着深度学习算法的突破和发展，语言模型已经成为连接人与机器的重要桥梁。在这一领域中，Meta的Llama 3 作为最新一代的大规模预训练模型，凭借其卓越的性能和广泛的应用前景，正逐渐成为行业内的佼佼者。 Llama 3 的研发团队继承了前代模型的技术优势...

AIGC 2024-09-30 人工智能

1782阅读

使用 GaLore 预训练LLaMA-7B

项目代码： https://github.com/jiaweizzhao/galorehttps://github.com/jiaweizzhao/galore 参考博客： https://zhuanlan.zhihu.com/p/686686751...

生成式AI 2024-09-30 人工智能

1382阅读

重磅！美国取消SB-1047法案，OpenAI、谷歌、Meta大难不死！

美国加州州长Gavin Newsom在今天凌晨正式否决——SB-1047法案! 值得一提的是，过去30天Gavin一共签署了17个关于监管大模型、生成式AI安全使用的法案，唯独否决了1047，看来他也不是一个糊涂人。在这个积极否决的过程中，AI界泰斗-吴...

人工智能 2024-09-30 人工智能

1432阅读

从头开始实现 LLaMA 模型，这包括设计模型架构、编写训练算法等，tl-rtc-file打破距离,局域网传输可达70MB，免费开源很火热的一些可以通过网页进行远程控制的开源项目，以及操作系统引导自动

从头开始实现 LLaMA 模型，这包括设计模型架构、编写训练算法等，tl-rtc-file打破距离,局域网传输可达70MB，免费开源很火热的一些可以通过网页进行远程控制的开源项目，以及操作系统引导自动。这个开源项目名为 “llama3-from-s...

生成式AI 2024-09-30 人工智能

1280阅读

3天把Llama训成Mamba，性能不降，推理更快！

近日，Mamba方面又搞出了有意思的研究：来自康奈尔、普林斯顿等机构的研究人员成功将Llama提炼成了Mamba模型，并且设计了新的推测解码算法，加速了模型的推理。\ 先来看一张其乐融融的图片（一眼AI）：右边的小羊驼代表Llama，而左边的蛇（...

生成式AI 2024-09-30 人工智能

1453阅读

LlaMa-Factory源码解析之预训练LLaMA-Factory/src/llamafactory/train/pt/workflow.py -＞ run_pt()

LLaMA-Factory/src/llmtuner/train/pt/workflow.py at main · hiyouga/LLaMA-Factory · GitHub 截止至2024年7月，该框架workflow.py目录从LLaMA-Fact...

生成式AI 2024-09-30 人工智能

1568阅读

Windows环境下部署本地大模型教程

自ChatGPT在2022年爆发式出圈以来，大模型对人类世界产生了重大影响，无论是在生产、工作、写作方面还是自动驾驶领域，大模型发挥了非常重要的作用。现各大厂，无论是国内大厂还是国外大厂，都纷纷推出了自己的对话大模型供人们免费或付费使用。与此同时，开源...

生成式AI 2024-09-30 人工智能

3927阅读

下载官方llama

1.官网.pth格式去官网（Download Llama (meta.com ）申请具体可以看这个B站视频 Llama2模型申请与本地部署详细教程_哔哩哔哩_bilibili（视频是llama2，下载llama3是另外一个git）相关...

生成式AI 2024-09-30 人工智能

1678阅读

AI一键批量生成各类短视频,自动批量混剪短视频,自动把视频发布到抖音,快手,小红书,视频号上,赚钱从来没有这么容易过! 支持本地语音模型chatTTS,fasterwhisper,支持云语音

最近MoneyPrinterPlus比较火，可以自动生成视频，剪辑视频，而且还可以直接上传到多媒体平台上！！！赶紧自己动手实操一下吧。 1、首先安装好需要的环境。 Python 3.10+，安装地址：直接跳转到下载页面 ffmpeg 6.0+，123网盘...

生成式AI 2024-09-29 人工智能

1899阅读

LlamaFactory可视化微调大模型 - 参数详解

LlamaFactory 前言 LLaMA Factory 是一个用于微调大型语言模型的强大工具，特别是针对 LLaMA 系列模型。可以适应不同的模型架构和大小。支持多种微调技术，如全参数微调、LoRA（ Low-Rank Adaptation...

生成式AI 2024-09-29 人工智能

2415阅读