llm 第9页 - AIGC资讯

[arxiv论文解读]LlamaFactory：100+语言模型统一高效微调

该文档是一篇关于LLAMAFACTORY的学术论文，这是一个用于高效微调大型语言模型（LLMs）的统一框架。这篇论文详细介绍了LLAMAFACTORY的设计、实现和评估，以及它在语言建模和文本生成任务中的应用。下面是对文档内容的详细解释：摘要（Abst...

AIGC 2024-07-08 人工智能

1790阅读

破解ChatGPT惊人耗电！DeepMind新算法训练提效13倍，能耗暴降10倍

【新智元导读】ChatGPT能耗惊人，该怎么解?谷歌DeepMind新算法JEST问世，让LLM训练的迭代次数降低13倍，计算量减少10倍，或将重塑AI未来。 ChatGPT早已成为世界耗能大户:一天用掉超50万度电，相当于1.7万个美国家庭的用电量! 然...

AIGC 2024-07-07 人工智能

950阅读

在昇腾服务器上使用llama-factory对baichuan2-13b模型进行lora微调

什么是lora微调 LoRA 提出在预训练模型的参数矩阵上添加低秩分解矩阵来近似每层的参数更新，从而减少适配下游任务所需要训练的参数。环境准备这次使用到的微调框架是llama-factory。这个框架集成了对多种模型进行各种训练的代码，少...

人工智能 2024-07-07 人工智能

979阅读

传知代码-Llama 2：开放基础和微调聊天模型以及法律判决数据集分类实战(论文复现)

代码以及视频讲解本文所涉及所有资源均在传知代码平台可获取本文概述本文首先会介绍一下Llama2大模型，然后会使用一个公开的中文法律判决数据集（部分）进行Llama2提示学习的分类实战。论文主要内容这篇文章介绍了Llama 2，这是...

生成式AI 2024-07-07 人工智能

813阅读

【AIGC】LangChain入门指南—第二章 LangChain入门指南

第二章 LangChain入门指南文章目录第二章 LangChain入门指南前言一、主要内容 1、初识LangChain 1.1 为什么需要LangChain 1.2 LLM应用开发的最后1公里 1.3 LangChain的...

人工智能 2024-07-06 人工智能

1725阅读

使用LLaMA-Factory微调Llama3大模型

一、基础模型下载本文的背景是微调一个基于Llama3的中文版模型Llama3-8B-Chinese-Chat，用于中文指定领域的问答下游任务 1、HuggingFace官网直接下载官网地址：https://huggingface.co/mo...

人工智能 2024-07-05 人工智能

1398阅读

[AI视频-suno-V3音乐-AI绘画-AI文本生成-配音]

文章目录前言一、SUNO_V3 二、AI 图像生成工作流 Stable Diffusion 的工作原理 Stable Diffusion 的应用场景注意事项三、AI 图像生成--Freeloading 下面这个是我的小号：大家感兴趣...

生成式AI 2024-07-05 人工智能

1130阅读

AI日报：百度文心4.0免费开放；AI lab开源超强多模态大模型；对标GPT-4o！商汤发布日日新5o

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、百度文心智能体平台免费开放文心...

大数据 2024-07-05 人工智能

881阅读

通过Llama Index实现大模型的SQL生成的三种方法详解

通过Llama Index实现大模型的SQL生成的三种方法详解文中使用了chatglm的llm和embedding modle，利用的智谱的免费token Text2SQL其实就是从文本到SQL，也是NLP中的一种实践，这可以降低用户和数...

大数据 2024-07-05 人工智能

756阅读

视频多模态模型: VideoChat、Video-LLaMA、Video-ChatGPT、Video-LLaVA等

VideoChat VideoChat?: 基于视频指令数据微调的聊天机器人 https://arxiv.org/pdf/2305.06355.pdf https://github.com/OpenGVLab/Ask-Anything/tr...

人工智能 2024-07-04 人工智能

1074阅读

AIGC从入门到实战：只缘身在此山中：GPT 模型靠什么取胜和出圈？

AIGC从入门到实战：只缘身在此山中：GPT 模型靠什么取胜和“出圈”？作者：禅与计算机程序设计艺术 / Zen and the Art of Computer Programming / TextGenWebUILLM AIGC from Begi...

AIGC 2024-07-04 人工智能

899阅读

一文为你深度解析LLaMA2模型架构

本文分享自华为云社区《【云驻共创】昇思MindSpore技术公开课大咖深度解析LLaMA2 模型架构》，作者： Freedom123。一、前言随着人工智能技术的不断发展，自然语言处理（NLP）领域也取得了巨大的进步。在这个领域中，LLaMA展...

人工智能 2024-07-04 人工智能

1201阅读

全员i人？《大闹天宫》MBTI测试让全公司炸锅！最神秘国产大模型团队出手了

【新智元导读】最近，公司全体同事都在疯狂沉迷这款《大闹天宫MBTI》测试!各种直击打工人的灵魂拷问，让所有i人和e人在职场极限场景中反复拉扯。国产黑马和上影打造的原汁原味《大闹天宫》画风，简直让人一秒穿越回童年。就在最近，全公司都为这个大闹天宫MBTI测...

生成式AI 2024-07-04 人工智能

791阅读

【LLM教程-llama】如何Fine Tuning大语言模型？

今天给大家带来了一篇超级详细的教程,手把手教你如何对大语言模型进行微调(Fine Tuning ！（代码和详细解释放在后文）目录大语言模型进行微调(Fine Tuning 需要哪些步骤？大语言模型进行微调(Fine Tuning 训练过程及代码...

AIGC 2024-07-04 人工智能

1088阅读

llama-factory训练RLHF-PPO模型

理论上RLHF（强化学习）效果比sft好，也更难训练。ppo有采用阶段,步骤比较多,训练速度很慢. 记录下工作中使用llama-factory调试rlhf-ppo算法流程及参数配置,希望对大家有所帮助. llama-factory版本: 0.8.2...

AIGC 2024-07-03 人工智能

1332阅读

【Llama源码】旋转位置编码ROPE--源码阅读

旋转矩阵计算 rotary_emb 对应 L l a...

AIGC 2024-07-03 人工智能

909阅读

AIGC 生成对抗网络、大型预训练模型 LLM ChatGPT Transformer LLaMA LangChain Prompt Engineering 提示工程

AIGC AIGC（Artificial Intelligence Generated Content）是指基于生成对抗网络、大型预训练模型等人工智能的技术方法，通过已有数据的学习和识别，以适当的泛化能力生成相关内容的技术。AIGC的爆发得益于GAN、...

人工智能 2024-07-03 人工智能

973阅读

探索多模态智能边界：Visual-Chinese-LLaMA-Alpaca 开源项目解析与应用指南

探索多模态智能边界：Visual-Chinese-LLaMA-Alpaca 开源项目解析与应用指南在人工智能领域，多模态学习正逐渐成为研究热点，它旨在融合视觉和语言信息，构建能够理解和生成跨模态内容的智能体。Visual-Chinese-LLaMA...

生成式AI 2024-07-02 人工智能

974阅读

LLaMA-Factory实战推理

LLaMA-Factory官网：https://github.com/hiyouga/LLaMA-Factory 安装环境 git clone https://github.com/hiyouga/LLaMA-Factory.git cd LLaM...

人工智能 2024-07-02 人工智能

1011阅读

Mozilla 开源 llamafile:大语言模型分发与部署新范式

引言随着 ChatGPT、BERT 等大型语言模型(Large Language Model, LLM 在自然语言处理领域掀起巨大波澜,AI 技术正以前所未有的速度走近大众生活。然而,这些 LLM 的训练和推理对计算资源提出了极高要求,动辄数十甚至数百...

生成式AI 2024-07-02 人工智能

1139阅读

AI绘图软件midjourney的底层模型是什么？

生成式模型Midjourney如何工作： Midjourney 的底层模型是一个大型语言模型 (LLM ，它已经在海量图像和文本数据集上进行了训练。能够生成既逼真又富有创意的图像。Midjourney 的一些优势包括：准确性、创造力、速度。 LLM...

人工智能 2024-07-02 人工智能

1306阅读

LLM2Vec介绍和将Llama 3转换为嵌入模型代码示例

嵌入模型是大型语言模型检索增强生成(RAG 的关键组成部分。它们对知识库和用户编写的查询进行编码。使用与LLM相同领域的训练或微调的嵌入模型可以显著改进RAG系统。然而，寻找或训练这样的嵌入模型往往是一项困难的任务，因为领域内的数据通常是稀缺的。但...

大数据 2024-07-02 人工智能

878阅读

Llama模型家族之RLAIF 基于 AI 反馈的强化学习（三） RLAIF 的工作原理

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

大数据 2024-07-02 人工智能

909阅读

Kimi高阶技巧：打造你的AI写作助手，一键生成专业内容！

在这个信息爆炸的时代，人工智能正逐步改变我们的工作和生活方式。今天，我们要介绍的是一个能够极大提升写作效率的智能工具——Kimi，它可以帮助我们快速生成Markdown格式的专业内容，修改提示词，快速写出爆款文案，以及如何进行小红书式的精美排版！ ?系...

生成式AI 2024-07-02 人工智能

1536阅读

用 LMDeploy 高效部署 Llama-3-8B，1.8倍vLLM推理效率

节前，我们星球组织了一场算法岗技术&面试讨论会，邀请了一些互联网大厂朋友、参加社招和校招面试的同学，针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。汇总合集《大模型面试...

AIGC 2024-07-02 人工智能

1156阅读

【大模型】大模型 CPU 推理之 llama.cpp

【大模型】大模型 CPU 推理之 llama.cpp llama.cpp 安装llama.cpp Memory/Disk Requirements Quantization 测试推理下载模型测试参考 llama.cpp...

人工智能 2024-07-01 人工智能

1287阅读

使用LMDeploy部署和量化Llama 3模型

## 引言在人工智能领域，大型语言模型（LLMs）正变得越来越重要，它们在各种自然语言处理任务中发挥着关键作用。Llama 3是近期发布的一款具有8B和70B参数量的模型，它在性能和效率方面都取得了显著的进步。为了简化Llama 3的部署和量化过程，lm...

大数据 2024-07-01 人工智能

1168阅读

菲尔兹奖得主亲测GPT-4o，经典过河难题破解失败！最强Claude 3.5回答离谱，LeCun嘲讽LLM

【新智元导读】LLM能否解决「狼-山羊-卷心菜」经典过河难题?最近，菲尔兹奖得主Timothy Gowers分享了实测GPT-4o的过程，模型在最简单的题目上竟然做错了，甚至网友们发现，就连Claude3.5也无法幸免。在经典的「狼-山羊-卷心菜」过河问...

生成式AI 2024-07-01 人工智能

997阅读

详解各种LLM系列｜（5）LLaMA 3模型解析（Meta重磅发布！）

一、引言 Blog链接：https://ai.meta.com/blog/meta-llama-3/ MODEL CARD: https://github.com/meta-llama/llama3/blob/main/MODEL_CARD.md 体...

AIGC 2024-07-01 人工智能

1446阅读

探索开源宝藏：LLaMA 2 模型的全面优势与实践指南

探索开源宝藏：LLaMA 2 模型的全面优势与实践指南引言在大型语言模型（LLM）的领域中，Meta AI 开发的 LLaMA 2 以其开源的优势和强大的性能，迅速成为研究和开发社区的新宠。本文将深入探讨 LLaMA 2 的优势，并提供详细的实...

AIGC 2024-06-30 人工智能

904阅读

TiDB 如何利用 Copilot 优化数据库操作，提升用户体验与内部效率？

作者： TiDB社区小助手原文来源： https://tidb.net/blog/93a5deed 观点 | 李粒 PingCAP AI Lab 负责人编辑 | 李忠良在应对不断增长的...

大数据 2024-06-30 人工智能

922阅读

通过ORPO技术微调 llama3大模型(Fine-tune Llama 3 with ORPO)

通过ORPO对llama进行微调前言 ORPO是一种新颖的微调技术，它将传统的监督微调和偏好对齐阶段整合到一个过程中。这减少了训练所需的计算资源和时间。此外，经验结果表明，ORPO在各种模型大小和基准测试中都超过了其他对齐方法。在本文中，我们将...

生成式AI 2024-06-30 人工智能

927阅读

Google 深夜突袭，Gemma 2 狂卷 Llama 3

整理 | Echo Tang 出品丨AI 科技大本营（ID：rgznai100） Google 挤牙膏式的创新真是令人爱恨交织。早在一个多月前的 Google I/O 上，Google 便官宣将会在未来几周内推出开源模型 Gemma 的第二代 Ge...

大数据 2024-06-30 人工智能

968阅读

Llama-Code Shield解读：大模型代码安全护盾解析

引言大模型目前被广泛用于生成代码数据，能有效地提高研发效率。但LLM生成的代码中潜藏的安全漏洞，也成了悬在头顶的达摩克利斯之剑。最近，Llama-3的问世，不仅带来了新的代码生成能力，更配备了Code Shield这一安全检测利器，为LL...

生成式AI 2024-06-29 人工智能

1064阅读

【AIGC使用教程】AutoGPT 安装使用完全教程

欢迎关注【AIGC使用教程】专栏【AIGC使用教程】SciSpace 论文阅读神器【AIGC使用教程】Microsoft Edge/Bing Chat 注册使用完全指南【AIGC使用教程】GitHub Copilot 免费注册及在 VS Code...

AIGC 2024-06-29 人工智能

1288阅读

Niantic利用Meta Llama让数字生物栩栩如生

每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同...

人工智能 2024-06-29 人工智能

1026阅读

每日AIGC最新进展(20)：基于树的长视频理解VideoTree、IBM研究院提出AI生成图片生成检测、蚂蚁集团提出AI生成视频检测工具、CMU提出大型视频-语言模型

Diffusion Models专栏文章汇总：入门与实战 VideoTree: Adaptive Tree-based Video Representation for LLM Reasoning on Long Videos 本文介绍了一种名...

人工智能 2024-06-28 人工智能

976阅读

Llama_index利用本地大模型工具ollama（CPU）

基于ollama的本地大模型的LlamaIndex示例代码 from llama_index.core import VectorStoreIndex, SimpleDirectoryReader, Settings from llama_index....

AIGC 2024-06-28 人工智能

901阅读

GPT-4批评GPT-4实现「自我提升」！OpenAI前超级对齐团队又一力作被公开

今天，OpenAI悄悄在博客上发布了一篇新论文——CriticGPT，而这也是前任超级对齐团队的「遗作」之一。CriticGPT同样基于GPT-4训练，但目的却是用来指正GPT-4的输出错误，实现「自我批评」。 OpenAI最近的拖延症状逐渐严重，不仅GP...

人工智能 2024-06-28 人工智能

878阅读

Stable Diffusion【插件篇】：智能标签提示词插件sd-danbooru-tags-upsampler

今天给大家介绍一款智能标签提示词插件sd-danbooru-tags-upsampler。该智能提示词插件是今年2月23号才发布的第一版V0.1.0，算是比较新的智能提示词插件。它是通过使用轻量级LLM完成对danbooru标签采样生成提示词。因此生成...

AIGC 2024-06-28 人工智能

1462阅读

Llama模型家族之拒绝抽样(Rejection Sampling)（二）均匀分布简介

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

人工智能 2024-06-28 人工智能

931阅读

每日一看大模型新闻（2024.1.20-1.21）英伟达新对话QA模型准确度超GPT-4，却遭吐槽：无权重代码意义不大；Llama 2打败GPT-4！Meta让大模型自我奖励自迭代，再证合成数据是LL

1.产品发布 1.1韩国Kakao：推出多模态大模型Honeybee 发布日期：2024.1.20 Kakao unveils multimodal large language model Honeybee - The Korea Ti...

大数据 2024-06-27 人工智能

945阅读

在Redhat 7 Linux上安装llama.cpp [ 错误stdatomic.h: No such file or directory]

前期准备在github上下载llama.cpp或克隆。 GitHub - ggerganov/llama.cpp: LLM inference in C/C++ git clone https://github.com/ggerganov/ll...

AIGC 2024-06-27 人工智能

1268阅读

MCT Self-Refine：创新集成蒙特卡洛树搜索（MCTS）提高复杂数学推理任务的性能，超GPT4，使用 LLaMa-3 8B 进行自我优化

? 文献卡题目： Accessing GPT-4 level Mathematical Olympiad Solutions via Monte Carlo Tree Self-refine with LLaMa-3 8B 作者: Di Zh...

人工智能 2024-06-27 人工智能

1171阅读

Llama模型家族训练奖励模型Reward Model技术及代码实战（二）从用户反馈构建比较数据集

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

人工智能 2024-06-27 人工智能

1112阅读

AIGC 训练场景下的存储特征研究

云布道师引言：在传统块存储大行其道的时代，需要针对很多行业的工作负载（Workload）进行调研，包含块大小、随机读、读写比例等等。知道行业的 Workload 对于预估业务的 I/OPS、时延、吞吐等性能有很好的指导意义，其次，也便于制定针对行业的...

生成式AI 2024-06-27 人工智能

914阅读

使用 Llama-Index、Llama 3 和 Qdrant 构建高级重排-RAG 系统

原文：Plaban Nayak Build an Advanced Reranking-RAG System Using Llama-Index, Llama 3 and Qdrant 引言尽管 LLM（语言模型）能够生成有意义且语法正确的文本...

AIGC 2024-06-27 人工智能

1099阅读

Llama模型家族之RLAIF 基于 AI 反馈的强化学习（一）

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

大数据 2024-06-26 人工智能

1159阅读

增强大型语言模型（LLM）可访问性：深入探究在单块AMD GPU上通过QLoRA微调Llama 2的过程

Enhancing LLM Accessibility: A Deep Dive into QLoRA Through Fine-tuning Llama 2 on a single AMD GPU — ROCm Blogs 基于之前的博客《使用Lo...

人工智能 2024-06-26 人工智能

1428阅读