llm 第2页 - AIGC资讯

GPUStack正式发布: 为大模型而生的开源GPU集群管理器

经过 Seal 研发团队几个月来持续的开发和测试，我们满怀期待及热情地发布新的产品 GPUStack，GPUStack 是一个用于运行LLM（大型语言模型）的开源GPU集群管理器。尽管如今大语言模型作为公共的云上服务已经被广泛推广并在公有云上变得更加易于使...

AIGC 2024-09-23 人工智能

1028阅读

Llama模型家族之拒绝抽样(Rejection Sampling)（五）蒙特卡罗算法在拒绝抽样中：均匀分布与样本接受标准

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

生成式AI 2024-09-23 人工智能

760阅读

Lag-Llama：时间序列大模型开源了！

之前我们介绍过TimeGPT，它是第一个时间序列的大模型，具有零样本推理、异常检测等能力。TimeGPT引发了对时间序列基础模型的更多研究，但是它是一个专有模型，只能通过API访问。如今，终于出现一个用于时间序列预测的开源大模型：Lag-Llama...

人工智能 2024-09-23 人工智能

909阅读

LLM入门——在Colab上部署Llama2

LLM入门——在Colab上部署Llama2 2024/07/09 本文属于“LLM入门”系列，该系列是笔者自学LLM时记录的一些实践记录与心得，可能存在错误或过时的部分，请读者谅解。对于LLM入门学者，我推荐从Large Language...

大数据 2024-09-23 人工智能

866阅读

AIGC实战之如何构建出更好的大模型RAG系统

大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客...

生成式AI 2024-09-22 人工智能

965阅读

使用本地 LLM 构建 Llama 3.1 8b Streamlit 聊天应用程序：使用 Ollama 的分

介绍大型语言模型（LLMs）彻底改变了人工智能领域，提供了令人印象深刻的语言理解和生成能力。本文将指导您构建一个使用本地LLM的Streamlit聊天应用程序，特别是来自Meta的Llama 3.1 8b模型，通过Ollama库进行集成。...

人工智能 2024-09-22 人工智能

965阅读

速通LLaMA2：《Llama 2: Open Foundation and Fine-Tuned Chat Models》全文解读

文章目录概览 LLaMA和LLaMA2的区别 Abstract Introduction Pretraining Fine-tuning 1. 概括 2、Supervised Fine-Tuning（SFT） 3、⭐Reinforcemen...

人工智能 2024-09-22 人工智能

741阅读

基于大模型生成文献综述的实现思路：兼看昨日大模型进展早报

今天是24年8月份的第一天，我们先来回顾下昨日大模型进展早报。我们来看看一个工作，基于大模型的自动综述生成，Automated Review Generation Method Based on Large Language Models：(https...

生成式AI 2024-09-21 人工智能

1110阅读

Llama Factory ：百种以上语言模型的统一高效微调框架

人工智能咨询培训老师叶梓转载标明出处大模型适应到特定下游任务时，传统的全参数微调方法成本高昂，因此，研究者们一直在探索更高效的微调技术。由北京航空航天大学和北京大学的研究团队提出了一个名为Llama Factory的统一框架，旨在解决大模型高效微调的...

AIGC 2024-09-21 人工智能

766阅读

从零到一，打造顶尖RAG应用！揭秘RAG技术构建全流程！

通过本文你可以了解到：什么是RAG？如何搭建一个RAG应用？目前开源的RAG应用有哪些？ RAG简介检索增强生成（Retrieval Augmented Generation，RAG）是一种强大的工具，整合了从庞大知识库中检索到...

生成式AI 2024-09-21 人工智能

761阅读

4060显卡+LLaMA-Factory微调LLM——（四）Web UI

本地配置系统：win10 **硬件：**i5-12490f+RTX4060 前置准备目前本地微调大模型最常用的就是LLaMA-Factory，既可以用指令微调，又有Web UI，方便的很 github：https://github.com/...

人工智能 2024-09-21 人工智能

1739阅读

详聊LLaMa技术细节：LLaMA大模型是如何炼成的？

本文介绍来自 Meta AI 的 LLaMa 模型，类似于 OPT，也是一种完全开源的大语言模型。LLaMa 的参数量级从 7B 到 65B 大小不等，是在数万亿个 token 上面训练得到。值得一提的是，LLaMa 虽然只使用公共的数据集，依然取得了强悍...

AIGC 2024-09-21 人工智能

1169阅读

LLAMA-FACTORY：100+语言模型的统一高效微调框架

24年3月来自北航和北大的论文“LLAMA-FACTORY: Unified Efficient Fine-Tuning of 100+ Language Models”。高效的微调对于将大语言模型 (LLM 适应下游任务至关重要。然而，在不同模型上...

人工智能 2024-09-21 人工智能

1510阅读

大模型时代下的新一代广告系统

• 歧义词的多意图：多意图query下，基于样本生成逻辑，会偏向主意图，弱化甚至丢失次意图，导致召回问题，例如：小米（粮食or手机？），苹果（水果or手机？）； • 长尾类目冷启：由于用户点击数据的马太效应，使得大量的长尾类目没有...

大数据 2024-09-20 人工智能

631阅读

本地化LLM应用：Local_Llama——离线文档聊天的未来

本地化LLM应用：Local_Llama——离线文档聊天的未来 local_llama This repo is to showcase how you can run a model locally and offline, free of Op...

生成式AI 2024-09-20 人工智能

925阅读

LongLLaMA 项目使用教程

LongLLaMA 项目使用教程 long_llamaLongLLaMA is a large language model capable of handling long contexts. It is based on OpenLLaMA and...

AIGC 2024-09-20 人工智能

712阅读

如何微调 Llama 3 进行序列分类？

节前，我们星球组织了一场算法岗技术&面试讨论会，邀请了一些互联网大厂朋友、参加社招和校招面试的同学. 针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。汇总合集：《大模...

生成式AI 2024-09-20 人工智能

730阅读

家用消费级显卡玩转大模型超简单，一看就懂，一学就会

这篇文章主要介绍了如下内容：模型量化，包括转换为gguf格式如何通过Ollama部署运行模型通过这篇文章，你可以将一个很大的模型文件转换为一个相对很小的模型文件，并部署运行起来，运行速度可以大大提升，消费级显卡也可以无压力运行。为什么要...

大数据 2024-09-20 人工智能

773阅读

使用LLaMA-Factory进行模型微调（LLama3-8B-instruct）

1.使用环境 Linux -Ubuntu20.04 RTX3090 24GB， LORA+sft 训练微调 2. 下载项目，虚拟环境创建及安装： git clone https://github.com/hiyouga/LLaMA-Factor...

大数据 2024-09-20 人工智能

1304阅读

秘密 llama：全栈式私有LLM聊天机器人指南

秘密 llama：全栈式私有LLM聊天机器人指南 secret-llamaFully private LLM chatbot that runs entirely with a browser with no server needed. Suppor...

生成式AI 2024-09-19 人工智能

661阅读

[Sigcomm论文解析] Llama 3训练RoCE网络

最近正在开的Sigcomm上, Meta有一篇论文《RDMA over Ethernet for Distributed AI Training at Meta Scale》[1]详细介绍了它的物理网络部署和相关的拥塞控制机制. 本文来对它进行一些详细的解...

人工智能 2024-09-19 人工智能

1033阅读

大规模语言模型从理论到实践 LLaMA分布式训练实践

大规模语言模型从理论到实践 LLaMA分布式训练实践作者：禅与计算机程序设计艺术 / Zen and the Art of Computer Programming 1. 背景介绍 1.1 问题的由来随着深度学习的快速发展，大规模语言模型（La...

生成式AI 2024-09-19 人工智能

653阅读

用Transformers库运行Llama-3.1-Minitron-4B

我的笔记本来自8年前的旧时代，勉强能运行8B模型，于是打算试试看更小的…… Llama-3.1-Minitron 4B 简介 Llama-3.1-Minitron 4B 是基于Llama-3.1 8B模型，通过结构化权重剪枝和知识提炼技术优化而成的...

AIGC 2024-09-19 人工智能

799阅读

探索未来工作通讯的智能伙伴：Mattermost Copilot 插件

探索未来工作通讯的智能伙伴：Mattermost Copilot 插件 mattermost-plugin-aiMattermost plugin for LLMs项目地址:https://gitcode.com/gh_mirrors/ma/matte...

AIGC 2024-09-18 人工智能

841阅读

探索大模型和 Multi-Agent 在运维领域的实践

摘要：本文从智能运维面临的挑战和痛点出发，介绍企业运维领域应用 AIGC 的实践案例，基于确定性运维的实践经验，提出以 LLM 为中心，基于多 Agent 协同的运维方案，并提出在大模型时代下，对下一代智能运维的思考。本文分享自华为云社区《LLM...

生成式AI 2024-09-18 人工智能

836阅读

开源项目教程：llama-utils

开源项目教程：llama-utils llama-utilsThe easiest & fastest way to run customized and fine-tuned LLMs locally or on the edge项目地址:h...

生成式AI 2024-09-18 人工智能

802阅读

AI大佬齐聚国际顶会KDD 2024，中国队刷脸！大模型教育应用分析论文被录用

【新智元导读】AI时代下，智适应教育成为全新的范式。在刚刚结束的KDD2024大会上，国内一家前沿教育企业登上这个国际舞台，向所有人分享了真正个性化学习应该有的样子。进入开学季，一个词儿也跟着爆火——「无痛学习」。如今，AI已经以前所未见的速度，迅速...

人工智能 2024-09-18 人工智能

670阅读

使用 Elastic 和 LM Studio 的 Herding Llama 3.1

作者：来自 Elastic Charles Davison, Julian Khalifa 最新的 LM Studio 0.3 更新使 Elastic 的安全 AI Assistant 能够更轻松、更快速地与 LM Studio 托管模型一起运行。在...

AIGC 2024-09-18 人工智能

865阅读

OpenAI o1式思维链，开源模型也可以有，成功案例来了

北京时间9月13日午夜，OpenAI 发布了推理性能强大的 ο1系列模型。之后，各路研究者一直在尝试挖掘 ο1卓越性能背后的技术并尝试复现它。当然，OpenAI 也想了一些方法来抑制窥探，比如有多名用户声称曾试图诱导 ο1模型公布其思维过程，然后收到了 O...

AIGC 2024-09-18 人工智能

744阅读

速通LLaMA1：《LLaMA: Open and Efficient Foundation Language Models》全文解读

文章目录论文总览 1. 创新点和突破点 2. 技术实现与算法创新 3. 架构升级 4. 概念补充 SwiGLU激活函数 AdamW 5. 总结 Abstract Introduction Approach Pre-training...

人工智能 2024-09-18 人工智能

1030阅读

AI智能体研发-模型篇（一）：大模型训练框架LLaMA-Factory在国内网络环境下的安装、部署及使用

一、引言贫富差距的产生是信息差，技术贫富差距的产生亦如此。如果可以自我发现或者在别人的指导下发现优秀的开源项目，学习或工作效率真的可以事半功倍。今天力荐的项目是LLaMA-Factory，我在去年8月份就开始使用这个项目进行模型部署和微调训练（fi...

生成式AI 2024-09-17 人工智能

989阅读

【LLM大模型】使用QLoRa微调Llama 2

本篇文章将介绍使用PEFT库和QLoRa方法对Llama 27b预训练模型进行微调。我们将使用自定义数据集来构建情感分析模型。只有可以对数据进行微调我们才可以将这种大模型进行符合我们数据集的定制化。一些前置的知识如果熟悉Google Cola...

人工智能 2024-09-17 人工智能

709阅读

构建基于知识图谱的医药智能体Agent - 基于Llama 3.1、NVIDIA NIM 和 LangChain实践

使用ChatGPT创建虽然大多数人关注RAG与非结构化文本的关系，比如公司文档或技术文档，但我对基于结构化信息的检索系统持乐观态度，特别是知识图谱。关于GraphRAG，特别是微软的实现，[重磅 - 微软官宣正式在GitHub开源GraphRAG]，令...

生成式AI 2024-09-17 人工智能

664阅读

Nvidia AI 发布 Llama-Minitron 3.1 4B：通过修剪和提炼 Llama 3.1 8B 构建的新语言模型

Nvidia 刚刚发布了语言模型的新版本，不过这次是一个小型语言模型：Llama-3.1-Minitron 4B 模型。这意味着它是语言模型不断发展的重要步骤之一，通过剪枝和知识提炼等尖端技术，将大型模型的效率与小型模型相结合。 Llama-3.1-...

生成式AI 2024-09-16 人工智能

549阅读

LLaMA-Factory微调入门个人重制版

LLaMA-Factory微调入门个人重制版说明：首次发表日期：2024-08-30 LLaMA-Factory 官方Github仓库： https://github.com/hiyouga/LLaMA-Factory 关于本文是对L...

生成式AI 2024-09-16 人工智能

586阅读

人工智能 | MetaLlama大模型

llama 大模型介绍我们介绍 LLaMA，这是一个基础语言模型的集合，参数范围从 7B 到 65B。我们在数万亿个Token上训练我们的模型，并表明可以专门使用公开可用的数据集来训练最先进的模型，而无需诉诸专有的和无法访问的数据集。特别是，...

生成式AI 2024-09-16 人工智能

1181阅读

Meta开源的Llama官方Agent：Llama-Agentic-System深度解析

TLDR • Meta 推出的 Llama as a System 将 Llama 3.1 模型转变为一个能够自主完成任务的智能代理，通过多步推理、工具使用和系统级安全机制，为构建更智能、更安全的 AI 应用开辟了新的可能性。 • Llama-A...

AIGC 2024-09-16 人工智能

907阅读

三步搞定私人AI助手 | LLaMA-3本地部署小白攻略

“ 在你的电脑上运行一个强大的AI助手，它不仅能力超群，还把所有秘密都藏在你的硬盘里。好奇这是如何实现的吗？动动手，三分钟就可以完成LLaMA-3的本地部署！ ” 01、LLaMA-3‍‍‍‍ 最近在试验检索增强生成（RAG）的项目，想试试换一个强点的...

AIGC 2024-09-16 人工智能

790阅读

在自己笔记本上使用 Llama-3 生成 PowerPoint — 幻灯片自动化的第一步

在企业界幻灯片无处不在，它经常被用作交流想法和成就的方式。我个人在过去的四年里一直在大型跨国公司工作，制作幻灯片是大多数人每周都会做的事情。如果幻灯片能够有效利用时间，那就不是什么大问题了。有很多人会贬低这一点，但在我看来，幻灯片在大多数公司中消耗了...

生成式AI 2024-09-15 人工智能

807阅读

FastAPI部署大模型Llama 3.1

项目地址：self-llm/models/Llama3_1/01-Llama3_1-8B-Instruct FastApi 部署调用.md at master · datawhalechina/self-llm (github.com 目的：使用Aut...

人工智能 2024-09-15 人工智能

1313阅读

探索Meta新发布的大模型：Llama 3.1

最近正好关注到了meta发布的新大模型llama3.1，于是抱着好奇的态度来试一下。近期，Meta发布了其最新的大模型——Llama 3.1。作为一名科技爱好者和人工智能的追随者，我迫不及待地想要了解这一新模型的性能和特点。本文将带你一起探索Llama...

AIGC 2024-09-15 人工智能

845阅读

新范式：AIGC推动的数据要素产业价值促进创新

引言大模型的发展与数据要素的价值创造互为因果，LLM正推动着数据要素以“激发AGI”的全新范式创造价值。如何有效地整合规模化、高质量的数据以用于大型模型的训练，不仅是推进大模型发展的窗口，也将成为进一步发掘数据要素潜在价值的关键动力。遵循技术发展的...

生成式AI 2024-09-15 人工智能

628阅读

小白学大模型：LLaMA-Factory 介绍与使用

最近这一两周看到不少互联网公司都已经开始秋招提前批了。不同以往的是，当前职场环境已不再是那个双向奔赴时代了。求职者在变多，HC 在变少，岗位要求还更高了。最近，我们又陆续整理了很多大厂的面试题，帮助一些球友解惑答疑，分享技术面试中的那些弯弯绕绕。...

人工智能 2024-09-15 人工智能

880阅读

揭秘AI世界：一网打尽大模型、AIGC等热门概念，快速提升你的学习力！

AI（人工智能）人工智能 (AI 是对人类智慧行为的仿真。它涵盖了各种技术和领域，目的是让计算机模仿、延伸甚至超越人类智能。本质就是帮人工作做事的工具。 AGI（通用人工智能） AGI，全称为Artificial General Inte...

人工智能 2024-09-14 人工智能

776阅读

大模型_基于医疗领域用lora微调医疗数据及LLaMA微调ChatDoctor模型

文章目录 ChatDoctor 目标方法结果结论收集和准备医患对话数据集创建外部知识数据库具有知识大脑的自主聊天医生的开发模型培训结果数据和模型：微调推理 ChatDoctor 目标这项研究的主要...

AIGC 2024-09-14 人工智能

1109阅读

探索和构建 LLaMA 3 架构：深入探究组件、编码和推理技术

Meta 正在加大在人工智能 (AI 竞赛中的力度，推出了新的开源 AI 模型 Llama 3 以及新版 Meta AI。这款虚拟助手由 Llama 3 提供支持，现已在所有 Meta 平台上可用。以下是您需要了解的有关 Meta 最新大型语言模...

大数据 2024-09-14 人工智能

877阅读

大模型+小模型协同处理跨文档理解任务，成本更低，性能更高

“Synergetic Event Understanding: A Collaborative Approach to Cross-Document Event Coreference Resolution with Large Language Mod...

大数据 2024-09-13 人工智能

1000阅读

谈谈Function Calling

? 大模型分发助手，分发你的Prompt，助你学习AIGC ? LLM-HUB: Distribute Your Prompt, Unlock AIGC's Power Function Calling，这个让大语言模型 (LLM 如虎添翼的利器，...

AIGC 2024-09-13 人工智能

663阅读

本地服务器部署Text generation并添加code llama实现远程多人协作

文章目录前言 1. 本地部署Text generation Web UI 2. 安装CodeLlama大模型 3. 实现公网远程使用Code Llama 4. 固定Text generation Web UI公网地址前言本篇...

人工智能 2024-09-13 人工智能

827阅读

【AIGC半月报】AIGC大模型启元：2024.08（下）

【AIGC半月报】AIGC大模型启元：2024.08（下）） (1 Nemotron-4-Minitron（Nvidia LLM） (2 VITA（腾讯优图多模态大模型） (3 mPLUG-Owl3（阿里巴巴多模态大模型） (4 ADA...

AIGC 2024-09-13 人工智能

730阅读