llms 第2页 - AIGC资讯

Llama-3的安装和使用方法和案例应用

LLMs之Llama3：LLama-3是一款非常实用的自然语言处理工具，支持多种自然语言处理任务，如文本分类、情感分析、命名实体识别等。下面是LLama-3的简介、安装和使用方法、案例应用之详细攻略。一、简介 LLama-3是一款基于LLama模型的...

大数据 2024-08-05 人工智能

1524阅读

部署LLaMA-Factory及微调大模型测试

安装过程安装依赖按照GitHub上介绍的过程安装即可GitHub - hiyouga/LLaMA-Factory: Unify Efficient Fine-Tuning of 100+ LLMshttps://github.com/hiyouga...

生成式AI 2024-08-04 人工智能

1263阅读

深度学习论文: LLaMA: Open and Efficient Foundation Language Models

深度学习论文: LLaMA: Open and Efficient Foundation Language Models LLaMA: Open and Efficient Foundation Language Models PDF:https://ar...

AIGC 2024-08-02 人工智能

1046阅读

LLMs之Llama 3.1：Llama 3.1的简介、安装和使用方法、案例应用之详细攻略

LLMs之Llama 3.1：Llama 3.1的简介、安装和使用方法、案例应用之详细攻略导读：2024年7月23日，Meta重磅推出Llama 3.1。本篇文章主要提到了Meta推出的Llama 3.1自然语言生成模型。 >>...

人工智能 2024-07-31 人工智能

1639阅读

用LoRA微调 Llama 2：定制大型语言模型进行问答

Fine-tune Llama 2 with LoRA: Customizing a large language model for question-answering — ROCm Blogs (amd.com 在这篇博客中，我们将展示如何在AM...

AIGC 2024-07-29 人工智能

1013阅读

测试：ollama加载羊驼版本llama-3中文大模型

找了一个晚上各种模型，像极了当初找各种操作系统的镜像，雨林木风，深蓝、老毛桃…… 主要是官方的默认7B版本回答好多英文，而且回复的很慢，所以我是在ollama上搜索"chinese"找到了这个羊驼版本的， ollama run lgkt/llama3-...

生成式AI 2024-07-26 人工智能

1084阅读

【大语言模型LLMs】Llama系列简介

【大语言模型LLMs】Llama系列简介文章目录【大语言模型LLMs】Llama系列简介 1. LLaMa 1.1 引言 1.2 方法 1.2.1 预训练数据 1.2.2 架构 1.2.3 优化器 1.2.4 效率 2....

大数据 2024-07-24 人工智能

1309阅读

2024-06-21 问AI: 在大语言模型中，什么是LLama Index

文心一言 LLama Index是一个针对基于LLM（大型语言模型）的应用程序的数据框架，旨在提供RAG（检索增强生成，Retrieval-Augmented Generation）能力。以下是关于LLama Index的清晰概述：定义与功能：...

AIGC 2024-07-23 人工智能

1312阅读

视频大语言模型调研论文《Video-LLaMA: An Instruction-tuned Audio-Visual Language Model for Video Understanding》解读

本文是关于论文《Video-LLaMA: An Instruction-tuned Audio-Visual Language Model for Video Understanding》的简要介绍。Video-LLaMA是阿里达摩院的一个多模态大语言模型...

大数据 2024-07-22 人工智能

1069阅读

Llama模型家族之拒绝抽样(Rejection Sampling)（九）强化学习之Rejection Sampling

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

大数据 2024-07-21 人工智能

1754阅读

给｢大模型初学者｣的 LLaMA 3 核心技术剖析

编者按：本文旨在带领读者深入了解 LLaMA 3 的核心技术 —— 使用 RMSNorm 进行预归一化、SwiGLU 激活函数、旋转编码（RoPE）和字节对编码（BPE）算法。RMSNorm 技术让模型能够识别文本中的重点，SwiGLU 激活函数则如同“...

生成式AI 2024-07-21 人工智能

1253阅读

甲骨文首次将LLMs引入数据库，集成Llama 3和Mistral，和数据库高效对话

信息时代，数据为王。数据库作为数据存储&管理的一种方式，正在以势不可挡的趋势与AI结合。前有OpenAI 收购了数据库初创公司 Rockset，引发广泛关注；Oracle公司（甲骨文）作为全球最大的信息管理软件及服务供应商，近日发布新产品Hea...

人工智能 2024-07-20 人工智能

870阅读

Streaming local LLM with FastAPI, Llama.cpp and Langchain

题意：使用FastAPI、Llama.cpp和Langchain流式传输本地大型语言模型问题背景： I have setup FastAPI with Llama.cpp and Langchain. Now I want to enable...

大数据 2024-07-18 人工智能

985阅读

AIGC+教育专题：2024年AIGC+教育行业报告

今天分享的是AIGC+教育系列深度研究报告：《AIGC+教育专题：2024年AIGC+教育行业报告》。（报告出品方：艾瑞咨询）报告共计：58页宏观：AIGC带来的生产力革新 AIGC延伸扩展人脑智能，降低使用门槛，应用影响力无限泛化麦...

大数据 2024-07-18 人工智能

987阅读

Llama模型家族之使用 Supervised Fine-Tuning（SFT）微调预训练Llama 3 语言模型（七）使用 LoRA 微调 LLM 的实用技巧

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

生成式AI 2024-07-16 人工智能

1491阅读

快速LLaMA：面向大型语言模型的查询感知推理加速论文摘要翻译与评论

论文摘要翻译与评论论文标题： QuickLLaMA: Query-aware Inference Acceleration for Large Language Models 提出的框架我们Q-LLM框架的示意图。来自记忆上下文的输入被...

AIGC 2024-07-11 人工智能

952阅读

大模型咨询培训老师叶梓：利用知识图谱和Llama-Index增强大模型应用

大模型（LLMs）在自然语言处理领域取得了显著成就，但它们有时会产生不准确或不一致的信息，这种现象被称为“幻觉”。为了提高LLMs的准确性和可靠性，可以借助外部知识源，如知识图谱。那么我们如何通过Llama-Index实现知识图谱与LLMs的有效交互，从而...

生成式AI 2024-07-08 人工智能

890阅读

[arxiv论文解读]LlamaFactory：100+语言模型统一高效微调

该文档是一篇关于LLAMAFACTORY的学术论文，这是一个用于高效微调大型语言模型（LLMs）的统一框架。这篇论文详细介绍了LLAMAFACTORY的设计、实现和评估，以及它在语言建模和文本生成任务中的应用。下面是对文档内容的详细解释：摘要（Abst...

AIGC 2024-07-08 人工智能

1784阅读

传知代码-Llama 2：开放基础和微调聊天模型以及法律判决数据集分类实战(论文复现)

代码以及视频讲解本文所涉及所有资源均在传知代码平台可获取本文概述本文首先会介绍一下Llama2大模型，然后会使用一个公开的中文法律判决数据集（部分）进行Llama2提示学习的分类实战。论文主要内容这篇文章介绍了Llama 2，这是...

生成式AI 2024-07-07 人工智能

809阅读

LLaMA-Factory实战推理

LLaMA-Factory官网：https://github.com/hiyouga/LLaMA-Factory 安装环境 git clone https://github.com/hiyouga/LLaMA-Factory.git cd LLaM...

人工智能 2024-07-02 人工智能

1007阅读

Llama模型家族之RLAIF 基于 AI 反馈的强化学习（三） RLAIF 的工作原理

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

大数据 2024-07-02 人工智能

905阅读

【每周AI简讯】Stable Diffusion 3大版本更新

ChatGPT中文版AI7号 Stable Diffusion 3大版本更新 Stability AI发布了其最新的图像生成模型Stable Diffusion 3，旨在挑战Sora和Gemini。此版本采用创新架构，提高跨硬件系统的性能，需较大计算力...

人工智能 2024-06-29 人工智能

862阅读

Niantic利用Meta Llama让数字生物栩栩如生

每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同...

人工智能 2024-06-29 人工智能

1022阅读

每日AIGC最新进展(20)：基于树的长视频理解VideoTree、IBM研究院提出AI生成图片生成检测、蚂蚁集团提出AI生成视频检测工具、CMU提出大型视频-语言模型

Diffusion Models专栏文章汇总：入门与实战 VideoTree: Adaptive Tree-based Video Representation for LLM Reasoning on Long Videos 本文介绍了一种名...

人工智能 2024-06-28 人工智能

970阅读

Llama_index利用本地大模型工具ollama（CPU）

基于ollama的本地大模型的LlamaIndex示例代码 from llama_index.core import VectorStoreIndex, SimpleDirectoryReader, Settings from llama_index....

AIGC 2024-06-28 人工智能

897阅读

Llama模型家族之拒绝抽样(Rejection Sampling)（二）均匀分布简介

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

人工智能 2024-06-28 人工智能

927阅读

MCT Self-Refine：创新集成蒙特卡洛树搜索（MCTS）提高复杂数学推理任务的性能，超GPT4，使用 LLaMa-3 8B 进行自我优化

? 文献卡题目： Accessing GPT-4 level Mathematical Olympiad Solutions via Monte Carlo Tree Self-refine with LLaMa-3 8B 作者: Di Zh...

人工智能 2024-06-27 人工智能

1165阅读

使用 Llama-Index、Llama 3 和 Qdrant 构建高级重排-RAG 系统

原文：Plaban Nayak Build an Advanced Reranking-RAG System Using Llama-Index, Llama 3 and Qdrant 引言尽管 LLM（语言模型）能够生成有意义且语法正确的文本...

AIGC 2024-06-27 人工智能

1096阅读

Llama模型家族之RLAIF 基于 AI 反馈的强化学习（一）

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

大数据 2024-06-26 人工智能

1154阅读

LLaMa系列模型详解（原理介绍、代码解读）：LLaMA 2

LLaMA 2 大型语言模型（LLMs）作为高度能力的人工智能助手，在需要跨多个领域专家知识的复杂推理任务中表现出巨大潜力，包括编程和创意写作等专业领域。它们通过直观的聊天界面与人类互动，这导致了快速和广泛的公众采用。考虑到训练方法的看似简单性，LLM...

AIGC 2024-06-24 人工智能

1351阅读

每日AIGC最新进展(24)：用于图像质量和审美评估的统一视觉-语言预训练模型UniQA、可控生成图像压缩框架Control-GIC、3D感知扩散模型Ouroboros3D

Diffusion Models专栏文章汇总：入门与实战 UniQA: Unified Vision-Language Pre-training for Image Quality and Aesthetic Assessment 本文提出了一...

人工智能 2024-06-23 人工智能

1053阅读

LLMs：Chinese-LLaMA-Alpaca的简介(扩充中文词表+增量预训练+指令精调)、安装、案例实战应用之详细攻略

LLMs：Chinese-LLaMA-Alpaca的简介(扩充中文词表+增量预训练+指令精调、安装、案例实战应用之详细攻略导读：2023年4月17日，哈工大讯飞联合实验室，本项目开源了中文LLaMA模型和指令精调的Alpaca大模型，以进一步...

人工智能 2024-06-21 人工智能

1242阅读

在Windows上用Llama Factory微调Llama 3的基本操作

这篇博客参考了一些文章，例如：教程：利用LLaMA_Factory微调llama3:8b大模型_llama3模型微调保存-CSDN博客也可以参考Llama Factory的Readme：GitHub - hiyouga/LLaMA-Factory: U...

生成式AI 2024-06-21 人工智能

1125阅读

用 LLama-Factory 训练和微调 LLama3，打造你的专属 AI 模型！

用 LLama-Factory 训练和微调 LLama3，打造你的专属 AI 模型！文章目录用 LLama-Factory 训练和微调 LLama3，打造你的专属 AI 模型！什么是模型微调？为什么使用 LLama-Fact...

人工智能 2024-06-20 人工智能

1335阅读

GPT-4o攻破ARC-AGI无法被挑战的神话！71%准确率成新SOTA

【新智元导读】号称不可能轻易被击败的AGI基准ARC-AGI被GPT-4o撼动，GPT-4o以在公共测试集50%、在训练集71%的准确率成为了新的SOTA! ARC-AGI是唯一可以用来衡量通用人工智能进展的基准，创造者François Chollets曾...

AIGC 2024-06-20 人工智能

841阅读

[论文阅读] (32)南洋理工大学刘杨教授——网络空间安全和AIGC整合之道学习笔记及强推（InForSec）

首先祝大家五一节快乐！《娜璋带你读论文》系列主要是督促自己阅读优秀论文及听取学术讲座，并分享给大家，希望您喜欢。由于作者的英文水平和学术能力不高，需要不断提升，所以还请大家批评指正，非常欢迎大家给我留言评论，学术路上期待与您前行，加油。本文是南洋理工大...

AIGC 2024-06-20 人工智能

1140阅读

Llama 3 构建语音助手：将本地 RAG 与 Qdrant、Whisper 和 LangChain 集成

Llama 3 构建语音助手：将本地 RAG 与 Qdrant、Whisper 和 LangChain 集成文章目录 Llama 3 构建语音助手：将本地 RAG 与 Qdrant、Whisper 和 LangChain 集成不同行...

人工智能 2024-06-19 人工智能

1242阅读

【Tokenizer原理篇】超详细！AIGC面试系列大模型进阶(5)

本期问题聚焦于大模型Tokenizer相关问题本期问题快览模型中的Tokenization是指的什么常用的Tokenization方法了解有哪些吗了解什么是Byte-Pair Encoding(BPE 吗介绍下Byte-Pair E...

AIGC 2024-06-17 人工智能

2192阅读

大规模语言模型从理论到实践 LLaMA的模型结构

1.背景介绍随着人工智能技术的不断发展，大规模语言模型（Large Language Models, LLMs）已经成为自然语言处理领域的热点。这些模型通过在大规模数据集上进行训练，能够生成连贯、相关且有趣的文本输出。LLaMA 是 Meta AI 开...

AIGC 2024-06-16 人工智能

989阅读

大型语言模型（LLMs）在AIGC中的核心地位

本文收录于专栏：精通AI实战千例专栏合集 https://blog.csdn.net/weixin_52908342/category_11863492.html 从基础到实践，深入学习。无论你是初学者还是经验丰富的老手，对于本专栏案例和项目实践...

大数据 2024-06-14 人工智能

895阅读

Perplexica 是 Perplexity.ai 的开源 AI 搜索引擎替代品

Perplexica 是一个开源项目，旨在提供一个隐私保护的 AI 搜索引擎，作为 Perplexity AI 等专有选项的替代方案。它利用大型语言模型（LLMs）和人工智能功能，提供了一个开放的搜索解决方案。产品入口：https://top.aiba...

AIGC 2024-06-11 人工智能

1006阅读

《The end of Software》争议不断：AIGC下的软件行业是不是80年代的传统媒体行业？

要理解软件将如何变化，我们可以从研究技术如何改变其他行业中获益。如果你倾听，历史往往会有韵律。在互联网之前，媒体的行为方式非常不同——它很贵。你必须支付人们制作内容、编辑它和分发它。因为内容的制作成本很高，所以它必须赚钱。消费者为报纸、杂志、书籍、有线...

生成式AI 2024-06-10 人工智能

968阅读

LLaMA 2语言大模型的微调策略：LoRA与全参数选择

随着自然语言处理（NLP）技术的飞速发展，大型语言模型（LLMs）在各个领域都展现出了强大的能力。LLaMA 2作为其中的佼佼者，具有巨大的潜力。然而，如何有效地对LLaMA 2进行微调，以适应特定的任务或数据集，成为了一个关键问题。本文将对LoRA技术与...

人工智能 2024-06-10 人工智能

936阅读

使用LLM2Vec将Llama 3转变为一个嵌入模型

文章目录 LLM2Vec：您的LLM也是一个嵌入模型使用LLM2Vec将Llama 3转变为文本嵌入模型为 RAG 设置 Llama 3 文本嵌入模型结论原文：Benjamin Marie Turn Llama 3 into a...

AIGC 2024-06-10 人工智能

876阅读

AI | LLaMA-Factory 一个好用的微调工具

‘’ LLama Factory，这个工具能够高效且低成本地支持对 100 多个模型进行微调。LLama Factory 简化了模型微调的过程，并且易于访问，使用体验友好。此外，它还提供了由 Hiyouga 提供的 Hugging Face 空间，可...

AIGC 2024-06-08 人工智能

1464阅读

LLM之RAG之LlaMAIndex：llama-index(一块轻快构建索引来查询本地文档的数据框架神器)的简介、安装、使用方法之详细攻略

LLM之RAG之LlaMAIndex：llama-index(一块轻快构建索引来查询本地文档的数据框架神器的简介、安装、使用方法之详细攻略目录 LlamaIndex的简介 1、LlamaIndex有什么帮助? 2、核心原理 llama-i...

生成式AI 2024-06-08 人工智能

1592阅读

全新推理框架SymbCoT 让大模型实现类人的符号逻辑推理能力

新加坡国立大学联合加州大学圣芭芭拉分校与奥克兰大学的研究人员提出了一种名为SymbCoT（Symbolic Chain-of-Thought）的全新推理框架，旨在提升大语言模型(LLMs 的符号逻辑推理能力。这一框架结合了符号化逻辑表达式与思维链，极大提升...

AIGC 2024-06-07 人工智能

1041阅读

Llama模型家族训练奖励模型Reward Model技术及代码实战（一）

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

AIGC 2024-06-07 人工智能

1002阅读

LLM微调技术LoRA图解

译者 | 朱先忠审校 | 重楼简介当涉及到大型语言模型时，微调可能是人们讨论最多的技术方面的内容之一。大多数人都知道，训练这些模型是非常昂贵的，需要大量的资本投资;所以，看到我们可以通过采用现有的模型并用自己的数据对模型进行微调，从而创建一个具有...

人工智能 2024-06-06 人工智能

925阅读

从提示工程到代理工程：构建高效AI代理的策略框架概述

自ChatGPT推出以来，仅仅一年多的时间里，公众对于“人工智能”（AI）的认识已经发生了根本性的变化。这种变化部分源于公众意识的提高，更多则是基于这样一个认识：AI驱动的系统不仅可能，而且可能已经具备了与人类相当的能力和表现。ChatGPT不仅是AI能...

人工智能 2024-06-06 人工智能

825阅读