大型语言模型第3页

使用LLaMA-Factory微调大模型

使用LLaMA-Factory微调大模型 github 地址https://github.com/hiyouga/LLaMA-Factory 搭建环境 git clone --depth 1 https://github.com/hiyouga/...

人工智能 2024-07-23 人工智能

1074阅读

2024-06-21 问AI: 在大语言模型中，什么是LLama Index

文心一言 LLama Index是一个针对基于LLM（大型语言模型）的应用程序的数据框架，旨在提供RAG（检索增强生成，Retrieval-Augmented Generation）能力。以下是关于LLama Index的清晰概述：定义与功能：...

AIGC 2024-07-23 人工智能

1317阅读

首个超越GPT4o级开源模型！Llama 3.1泄密：4050亿参数，下载链接、模型卡都有了

Llama3.1终于现身了，不过出处却不是 Meta 官方。今日，Reddit 上新版 Llama 大模型泄露的消息遭到了疯传，除了基础模型，还包括8B、70B 和最大参数的405B 的基准测试结果。下图为 Llama3.1各版本与 OpenAI G...

生成式AI 2024-07-23 人工智能

833阅读

Llama 3模型：更自由、更强大的AI对话体验

引言人工智能领域正在经历一场革命，大型语言模型（LLM）的不断进步正在重塑我们与机器交互的方式。在这个快速发展的领域中，Meta公司推出的Llama系列模型一直备受关注。最新发布的Llama 3模型在多个方面都展现出了显著的进步，尤其是在减少不必要的...

人工智能 2024-07-22 人工智能

1084阅读

视频大语言模型调研论文《Video-LLaMA: An Instruction-tuned Audio-Visual Language Model for Video Understanding》解读

本文是关于论文《Video-LLaMA: An Instruction-tuned Audio-Visual Language Model for Video Understanding》的简要介绍。Video-LLaMA是阿里达摩院的一个多模态大语言模型...

大数据 2024-07-22 人工智能

1076阅读

AIGC领域综述

AIGC领域综述 2023 1. A Survey of Large Language Models 2. A Complete Survey on Generative AI (AIGC : Is ChatGPT from GPT-4 to...

生成式AI 2024-07-22 人工智能

1117阅读

AI时代，有必要学AIGC大型模型部署实践课程嘛？适合那些人学习？有什么用？

在人工智能（AI）迅猛发展的今天，AIGC（Artificial Intelligence Generated Content，即基于人工智能的内容自动生成）已成为推动产业创新与发展的核心驱动力之一。随着ChatGPT、Claude等大型语言模型的兴起，掌...

大数据 2024-07-19 人工智能

1468阅读

本地私有化部署开源大模型完整教程：LangChain + Streamlit+ Llama 【LLM大模型】

在过去的几个月里，大型语言模型(llm 获得了极大的关注，这些模型创造了令人兴奋的前景，特别是对于从事聊天机器人、个人助理和内容创作的开发人员。大型语言模型(llm 是指能够生成与人类语言非常相似的文本并以自然方式理解提示的机器学习模型。这些模型使...

生成式AI 2024-07-19 人工智能

1588阅读

（5-5-01）金融市场情绪分析：使用Llama 2 大模型实现财经信息的情感分析微调（1）

5.5 使用Llama 2 大模型实现财经信息的情感分析微调情感分析在金融和经济领域具有重要意义，可以帮助企业从市场洞察、风险管理和投资决策等方面获得有价值的信息。然而，在金融和经济文本方面的标注数据相对稀缺，因此需要使用自然语言处理技术和预训练模型...

人工智能 2024-07-19 人工智能

1524阅读

Streaming local LLM with FastAPI, Llama.cpp and Langchain

题意：使用FastAPI、Llama.cpp和Langchain流式传输本地大型语言模型问题背景： I have setup FastAPI with Llama.cpp and Langchain. Now I want to enable...

大数据 2024-07-18 人工智能

988阅读

AIGC实用场景-ChatBI架构设计

1. ChatBI概述 1.1 定义与背景 ChatBI是一种新兴的商业智能（BI）系统，它通过自然语言处理（NLP）技术，使得用户能够通过聊天的方式与数据进行交互。这种系统背后的理念是简化数据分析的复杂性，让非技术用户也能轻松地获取和分析数据。...

AIGC 2024-07-17 人工智能

2429阅读

使用llama.cpp量化模型

文章目录概要整体实验流程技术细节小结概要大模型量化是指在保持模型性能尽可能不变的情况下，通过减少模型参数的位数来降低模型的计算和存储成本。本次实验环境为魔搭社区提供的免费GPU环境（24G），使用Llama.cpp进行...

AIGC 2024-07-17 人工智能

1494阅读

绕晕了！9.11 大还是 9.9 大，难倒一批 AI 大模型？

「9.11和9.9，哪个大?」对于不少习惯了更新软件版本号的程序员而言，不少人的第一反应就是:当然是9.11大。但是如果没有限定场景，只是单纯地提出上面这个问题时，结果必然是相反的。没想到，将这个问题抛给前能答疑解惑、后能挑战各种高数难题的 AI 大模...

生成式AI 2024-07-17 人工智能

1180阅读

山东大学项目实训（十六）:基于LLaMA-Factory的微调模型评估和测试

在LLaMA-Factory的Evaluate & Predict界面进行评测原始模型评测微调后模型评测可以看到，微调之后的模型在各个指标上有了显著提升在完成大型语言模型（如 ChatGLM）的微调后，对模型进行全面评估...

生成式AI 2024-07-16 人工智能

1818阅读

Fastgpt接入Whisper本地模型实现语音输入

前言 FastGPT 默认使用了 OpenAI 的 LLM 模型和语音识别模型，如果想要私有化部署的话，可以使用openai 开源模型Whisper。参考文章《openai 开源模型Whisper语音转文本模型下载使用》开源项目地址：兼容op...

人工智能 2024-07-15 人工智能

1964阅读

近屿OJAC带你解读：AIGC核心知识点LLM

近年来，人工智能（AI）领域经历了令人瞩目的增长，尤其是自然语言处理（NLP）。你知道是什么推动了NLP领域的这种飞速发展吗？没错，那就是大型语言模型LLM。这些模型可能会彻底改变我们与科技的互动方式！这些模型是如何工作的呢？它们为何如此流行？在本文中...

生成式AI 2024-07-14 人工智能

886阅读

突破AI性能瓶颈揭秘LLaMA-MoE模型的高效分配策略

获取本文论文原文PDF，请在公众号【AI论文解读】留言：论文解读本文介绍了一种名为“LLaMA-MoE”的方法，通过将现有的大型语言模型（LLMs）转化为混合专家网络（MoE），从而解决了训练MoE时遇到的数据饥饿和不稳定性问题。该方法基于著名的LLa...

AIGC 2024-07-13 人工智能

969阅读

快速上手文心一言指令

文心一言是百度推出的基于深度学习技术的大型语言模型，能够进行智能问答、文本生成、翻译、情感分析等多种语言任务。要快速上手文心一言指令，可以参考以下步骤：注册与登录：首先需要访问文心一言的官方网站或应用商店，下载并安装应用。完成注册和登录后，你就...

大数据 2024-07-13 人工智能

1080阅读

Llama 3 与 GPT-4：哪个更好？

Llama 3 和 GPT-4 是目前公开可用的两种最先进的大型语言模型（LLM）。让我们通过比较这两个模型的多模态性、上下文长度、性能和成本，来看看哪个 LLM 更好。什么是 GPT-4？ GPT-4 是 OpenAI 开发的最新大型语言模型（...

生成式AI 2024-07-12 人工智能

1348阅读

高质量AIGC/ChatGPT/大模型资料分享

2023年要说科技圈什么最火爆，一定是ChatGPT、AIGC（人工智能生成内容）和大型语言模型。这些技术前沿如同科技世界的新潮流，巨浪拍岸，引发各界关注。ChatGPT的互动性和逼真度让人们瞠目，它能与用户展开流畅对话，回答问题，乃至创作文章和诗歌，展现...

大数据 2024-07-12 人工智能

992阅读

NLP主流大模型如GPT3/chatGPT/T5/PaLM/LLaMA/GLM的原理和差异有哪些-详细解读

自然语言处理（NLP）领域的多个大型语言模型（如GPT-3、ChatGPT、T5、PaLM、LLaMA和GLM）在结构和功能上有显著差异。以下是对这些模型的原理和差异的深入分析： GPT-3 (Generative Pre-trained Transf...

AIGC 2024-07-12 人工智能

1458阅读

快速LLaMA：面向大型语言模型的查询感知推理加速论文摘要翻译与评论

论文摘要翻译与评论论文标题： QuickLLaMA: Query-aware Inference Acceleration for Large Language Models 提出的框架我们Q-LLM框架的示意图。来自记忆上下文的输入被...

AIGC 2024-07-11 人工智能

953阅读

力图缩小与NVIDIA差距！AMD豪掷6.65亿美元现金收购Silo AI

快科技7月11日消息，AMD近日宣布，将以6.65亿美元的全现金方式收购芬兰人工智能初创公司Silo AI，力图缩小与行业领导者NVIDIA的差距。 Silo AI作为欧洲最大的私人AI实验室之一，专注于为企业提供定制化的AI模型和平台。此次收购将使AM...

大数据 2024-07-11 人工智能

972阅读

【Qwen2部署实战】llama.cpp：一键部署高效运行Qwen2-7B模型

系列篇章? No. 文章 1 【Qwen部署实战】探索Qwen-7B-Chat：阿里云大型语言模型的对话实践 2 【Qwen2部署实战】Qwen2初体验：用Transformers打造智能聊天机器人 3 【Qwen2部署实战】探索Qw...

大数据 2024-07-10 人工智能

1491阅读

文心一言对GPT-4o的评价与分析

在人工智能的浪潮中，大型语言模型（LLM）的发展日新月异，为自然语言处理（NLP）领域带来了诸多突破。GPT系列模型作为其中的佼佼者，其每一次更新都牵动着业界的目光。近日，GPT-4o的发布更是引发了广泛的讨论。本文将从文心一言的视角出发，对GPT-4o进...

大数据 2024-07-10 人工智能

825阅读

14-31 剑和诗人5 - 使用 AirLLM 和分层推理在单个 4GB GPU 上运行 LLama 3 70B

利用分层推理实现大模型语言(LLM 大型语言模型 (LLM 领域最近取得了显著进展，LLaMa 3 70B 等模型突破了之前认为可能实现的极限。然而，这些模型的庞大规模给其部署和实际使用带来了巨大挑战，尤其是在资源受限的设备上，例如内存有限的 GPU...

AIGC 2024-07-09 人工智能

1295阅读

推荐开源项目：Purple Llama - 开放式生成AI的负责任构建工具集合

推荐开源项目：Purple Llama - 开放式生成AI的负责任构建工具集合 Purple Llama 是一个综合性的项目，旨在通过提供工具和评估方法，帮助社区在开放的生成人工智能模型上进行负责任的开发。这个项目不仅关注技术的可能性，更重视安全性和...

生成式AI 2024-07-08 人工智能

1145阅读

传知代码-Llama 2：开放基础和微调聊天模型以及法律判决数据集分类实战(论文复现)

代码以及视频讲解本文所涉及所有资源均在传知代码平台可获取本文概述本文首先会介绍一下Llama2大模型，然后会使用一个公开的中文法律判决数据集（部分）进行Llama2提示学习的分类实战。论文主要内容这篇文章介绍了Llama 2，这是...

生成式AI 2024-07-07 人工智能

813阅读

LLaMA 2-原理&模型&训练-你懂了吗?

LLaMA 2的原理 LLaMA 2是Meta AI开发的大型语言模型，它基于Transformer架构，采用了自注意力机制来处理输入序列中的长期依赖关系。LLaMA 2的核心原理包括自注意力机制、多头注意力、层归一化和残差连接等，这些技术共同使得模型...

大数据 2024-07-06 人工智能

1089阅读

大模型的实践应用24-LLaMA-Factory微调通义千问qwen1.5-1.8B模型的实例

大家好，我是微学AI，今天给大家介绍一下大模型的实践应用24-LLaMA-Factory微调通义千问qwen1.5-1.8B模型的实例, LLaMA-Factory是一个专门用于大语言模型微调的框架，它支持多种微调方法，如LoRA、QLoRA等，并提供了丰...

大数据 2024-07-05 人工智能

1505阅读

AI日报：百度文心4.0免费开放；AI lab开源超强多模态大模型；对标GPT-4o！商汤发布日日新5o

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、百度文心智能体平台免费开放文心...

大数据 2024-07-05 人工智能

881阅读

构建您的私人语音助手：在本地运行的Whisper + Ollama + Bark之旅

构建您的私人语音助手：在本地运行的Whisper + Ollama + Bark之旅在深入了解如何构建并本地运行自己的大型语言模型（RAG）后，今天我们将更进一步，不仅实现高级对话功能，还赋予其听和说的能力。想象一下拥有如电影《钢铁侠》中Jarvis或...

人工智能 2024-07-03 人工智能

1833阅读

AIGC 生成对抗网络、大型预训练模型 LLM ChatGPT Transformer LLaMA LangChain Prompt Engineering 提示工程

AIGC AIGC（Artificial Intelligence Generated Content）是指基于生成对抗网络、大型预训练模型等人工智能的技术方法，通过已有数据的学习和识别，以适当的泛化能力生成相关内容的技术。AIGC的爆发得益于GAN、...

人工智能 2024-07-03 人工智能

973阅读

LLaMA-Factory实战推理

LLaMA-Factory官网：https://github.com/hiyouga/LLaMA-Factory 安装环境 git clone https://github.com/hiyouga/LLaMA-Factory.git cd LLaM...

人工智能 2024-07-02 人工智能

1011阅读

AI绘图软件midjourney的底层模型是什么？

生成式模型Midjourney如何工作： Midjourney 的底层模型是一个大型语言模型 (LLM ，它已经在海量图像和文本数据集上进行了训练。能够生成既逼真又富有创意的图像。Midjourney 的一些优势包括：准确性、创造力、速度。 LLM...

人工智能 2024-07-02 人工智能

1306阅读

使用LMDeploy部署和量化Llama 3模型

## 引言在人工智能领域，大型语言模型（LLMs）正变得越来越重要，它们在各种自然语言处理任务中发挥着关键作用。Llama 3是近期发布的一款具有8B和70B参数量的模型，它在性能和效率方面都取得了显著的进步。为了简化Llama 3的部署和量化过程，lm...

大数据 2024-07-01 人工智能

1168阅读

探索开源宝藏：LLaMA 2 模型的全面优势与实践指南

探索开源宝藏：LLaMA 2 模型的全面优势与实践指南引言在大型语言模型（LLM）的领域中，Meta AI 开发的 LLaMA 2 以其开源的优势和强大的性能，迅速成为研究和开发社区的新宠。本文将深入探讨 LLaMA 2 的优势，并提供详细的实...

AIGC 2024-06-30 人工智能

904阅读

通过ORPO技术微调 llama3大模型(Fine-tune Llama 3 with ORPO)

通过ORPO对llama进行微调前言 ORPO是一种新颖的微调技术，它将传统的监督微调和偏好对齐阶段整合到一个过程中。这减少了训练所需的计算资源和时间。此外，经验结果表明，ORPO在各种模型大小和基准测试中都超过了其他对齐方法。在本文中，我们将...

生成式AI 2024-06-30 人工智能

927阅读

技术突破：llamafile一键部署大模型，释放AI潜力

目录一、引言二、什么是llamafile？ 1、设计目标 2、技术构成 3、与传统部署方式的对比 4、一键部署的优势三、核心特性 1、一键部署的便捷性 2、跨平台支持 3、独立可执行文件 4、简化的分发流程 5、技术细节 6、用户体...

生成式AI 2024-06-29 人工智能

970阅读

每日AIGC最新进展(20)：基于树的长视频理解VideoTree、IBM研究院提出AI生成图片生成检测、蚂蚁集团提出AI生成视频检测工具、CMU提出大型视频-语言模型

Diffusion Models专栏文章汇总：入门与实战 VideoTree: Adaptive Tree-based Video Representation for LLM Reasoning on Long Videos 本文介绍了一种名...

人工智能 2024-06-28 人工智能

976阅读

⌈ 传知代码 ⌋ LLaMA 开放高效基础语言模型

?前情提要? 本文是传知代码平台中的相关前沿知识与技术的分享~ 接下来我们即将进入一个全新的空间，对技术有一个全新的视角~ 本文所涉及所有资源均在传知代码平台可获取以下的内容一定会让你对AI 赋能时代有一个颠覆性的认识哦！！！以下内容干货满满...

AIGC 2024-06-26 人工智能

865阅读

探索和构建 LLaMA 3 架构：深入探讨组件、编码和推理技术（一）

探索和构建 LLaMA 3 架构：深入探讨组件、编码和推理技术（一） Meta 通过推出新的开源 AI 模型 Llama 3 以及新版本的 Meta AI，正在加强其在人工智能 (AI 竞赛中的竞争力。该虚拟助手由 Llama 3 提供支持，现已可在所...

人工智能 2024-06-25 人工智能

1088阅读

字节跳动回应AI处理器传闻：消息不实

快科技6月24日消息，有传闻称，字节跳动正在与美国芯片制造商博通合作开发先进的AI处理器。据说，这款AI处理器将采用5nm工艺制造，由台积电负责生产，尽管设计工作进展顺利，但目前尚未开始流片”阶段，即设计阶段结束和制造开始的标志。对此，字节跳动回应称，...

生成式AI 2024-06-24 人工智能

789阅读

重磅！Meta 发布 Llama 3，前所未有的强大功能和多模态能力｜TodayAI

Meta今日宣布推出其最新一代尖端开源大型语言模型Llama 3。该模型预计很快将在多个领先的云服务平台上线，包括AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、Microsoft A...

生成式AI 2024-06-24 人工智能

1107阅读

李宏毅【生成式AI导论 2024】第7讲：大型语言模型修练史 — 第二阶段: 名师指点，发挥潜力 (兼谈对 ChatGPT 做逆向工程与 LLaMA 时代的开始)

如果只有指令微调… 人类老师需要给语言模型准备的教材是长这个样子的。要先想出人类可能会去问语言模型的问题，为每一个问题想一个正确的答案。有问题有答案之后，就可以把这些资料转成语言模型，可以拿来做训练文字接龙的格式。这种使用人类老师准备的资料来学习...

AIGC 2024-06-23 人工智能

883阅读

每日AIGC最新进展(24)：用于图像质量和审美评估的统一视觉-语言预训练模型UniQA、可控生成图像压缩框架Control-GIC、3D感知扩散模型Ouroboros3D

Diffusion Models专栏文章汇总：入门与实战 UniQA: Unified Vision-Language Pre-training for Image Quality and Aesthetic Assessment 本文提出了一...

人工智能 2024-06-23 人工智能

1057阅读

LLaMA 羊驼系大语言模型的前世今生

关于 LLaMA LLaMA是由Meta AI发布的大语言系列模型，完整的名字是Large Language Model Meta AI，直译：大语言模型元AI。Llama这个单词本身是指美洲大羊驼，所以社区也将这个系列的模型昵称为羊驼系模型。 Ll...

人工智能 2024-06-21 人工智能

1666阅读

【AIGC调研系列】Jina的Reader API是什么

Jina的Reader API是一个能够将任何网址转换成对大型语言模型（LLM）友好的输入格式的工具。用户只需在URL前添加简单的前缀"https://r.jina.ai/"，即可实现这一转换，从而为使用代理和检索生成系统的用户提供改善后的输出结果[1][...

人工智能 2024-06-21 人工智能

1190阅读

在 Apple Silicon Mac（M1、M2 或 M3）上运行最新 LLM 模型 Meta Llama 3 的分步指南

您是否正在寻找在基于 Apple Silicon 的 Mac 上运行最新 Meta Llama 3 的最简单方法？那么您来对地方了！在本指南中，我将向您展示如何在本地运行这个强大的语言模型，使您能够利用自己机器的资源来实现隐私和离线可用性。本教程将包括在...

AIGC 2024-06-21 人工智能

1355阅读

探索未来文本交互的利器 - Nvim-Llama：将大型语言模型引入Neovim的革命性尝试...

? 探索未来文本交互的利器 - Nvim-Llama：将大型语言模型引入Neovim的革命性尝试项目地址:https://gitcode.com/jpmcb/nvim-llama 在快速演进的人工智能领域，即时、高效的与语言模型交互已经成为开发者的梦...

人工智能 2024-06-20 人工智能

1023阅读