大型语言模型 - AIGC资讯

ai与能源消耗：大模型训练的碳足迹争议

标题：AI与能源消耗：大模型训练的碳足迹争议在人工智能（AI）技术日新月异的今天，大型语言模型、深度学习网络等先进算法正以前所未有的速度推动着科技进步和社会变革。然而，随着这些AI大模型性能的不断提升，其背后隐藏的能源消耗问题也逐渐浮出水面，引发了广泛的争...

AIGC 2025-06-27 人工智能

1076阅读

Llama 3.1大模型的预训练和后训练范式解析

Meta的Llama大型语言模型每次出新版本，都会是一大事件。前段时间他们不仅发布了3.1的一个超大型的405亿参数模型，还对之前的8亿和70亿参数的模型做了升级，让它们在MMLU测试中的表现更好了。不同模型在MMLU基准测试中的表现他们还...

人工智能 2024-10-06 人工智能

1371阅读

【大模型与AIGC】VLM基础知识汇总

这里写目录标题 LLM输入时的理解 1. Tokenizer的实现：Word极大似然估计 LLM推理：关于Attention mask的理解 1. CausalModel 与 AttentionMask 2. attention mask乘法...

生成式AI 2024-10-04 人工智能

1656阅读

`llama-journey` 开源项目安装与使用指南

llama-journey 开源项目安装与使用指南 llama-journey Experimental adventure game with AI-generated content 项目地址: https://gitcode.com/g...

人工智能 2024-10-03 人工智能

1510阅读

Chinese-Vicuna: 一个基于LLaMA的中文指令跟随模型

Chinese-Vicuna简介 Chinese-Vicuna是一个基于LLaMA的中文指令跟随模型，由研究者开发，旨在以低资源的方式实现高效的中文语言模型训练。该项目的主要目标是构建和分享可以在单个Nvidia RTX-2080TI上训练的中文指令跟随...

生成式AI 2024-10-02 人工智能

1232阅读

LLaMa-Factory入门教程

LLaMa-Factory是一个基于人工智能技术的开源项目，专为大型语言模型（LLMs）的微调而设计。它提供了丰富的工具和接口，使得用户能够轻松地对预训练的模型进行定制化的训练和调整，以适应特定的应用场景。以下将详细介绍如何使用LLaMa-Factory：...

生成式AI 2024-10-02 人工智能

1692阅读

中科院提出GPT-4o实时语音交互的开源对手：Llama-Omni

论文：LLaMA-Omni: Seamless Speech Interaction with Large Language Models地址：https://arxiv.org/pdf/2409.06666 研究背景研...

生成式AI 2024-10-01 人工智能

1396阅读

LLaMA-Factory 安装和配置指南

LLaMA-Factory 安装和配置指南 LLaMA-Factory 易于使用的LLM微调框架（LLaMA, BLOOM, Mistral, 百川， Qwen, ChatGLM）。项目地址: https://gitcode.com/gh_m...

人工智能 2024-10-01 人工智能

5678阅读

使用llama.cpp 在推理MiniCPM-1.2B模型

llama.cpp 是一个开源项目，它允许用户在C++中实现与LLaMA（Large Language Model Meta AI）模型的交互。LLaMA模型是由Meta Platforms开发的一种大型语言模型，虽然llama.cpp本身并不包含LLaM...

AIGC 2024-10-01 人工智能

1545阅读

使用 GaLore 预训练LLaMA-7B

项目代码： https://github.com/jiaweizzhao/galorehttps://github.com/jiaweizzhao/galore 参考博客： https://zhuanlan.zhihu.com/p/686686751...

生成式AI 2024-09-30 人工智能

1376阅读

从头开始实现 LLaMA 模型，这包括设计模型架构、编写训练算法等，tl-rtc-file打破距离,局域网传输可达70MB，免费开源很火热的一些可以通过网页进行远程控制的开源项目，以及操作系统引导自动

从头开始实现 LLaMA 模型，这包括设计模型架构、编写训练算法等，tl-rtc-file打破距离,局域网传输可达70MB，免费开源很火热的一些可以通过网页进行远程控制的开源项目，以及操作系统引导自动。这个开源项目名为 “llama3-from-s...

生成式AI 2024-09-30 人工智能

1275阅读

AIGC时代！AI的“iPhone时刻”与投资机遇

AIGC时代！AI的“iPhone时刻”与投资机遇前言 AI的“iPhone时刻”与投资机遇前言 AIGC，也就是人工智能生成内容，它就像是一股汹涌的浪潮，席卷了整个科技世界。它的出现，让我们看到了人工智能的无限潜力，也让我们...

AIGC 2024-09-30 人工智能

1185阅读

Emacs Copilot 安装与使用指南

Emacs Copilot 安装与使用指南 emacs-copilotLarge language model code completion for Emacs项目地址:https://gitcode.com/gh_mirrors/em/emacs-...

AIGC 2024-09-29 人工智能

1629阅读

AI日报：文生图新顶流？神秘蓝莓模型横空出世；阿里妈妈开源AI图像修复模型；谷歌斥资27亿美元重聘AI专家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/ 1、神秘蓝莓模型横空出世:AI文生...

大数据 2024-09-29 人工智能

1258阅读

LlamaFactory可视化微调大模型 - 参数详解

LlamaFactory 前言 LLaMA Factory 是一个用于微调大型语言模型的强大工具，特别是针对 LLaMA 系列模型。可以适应不同的模型架构和大小。支持多种微调技术，如全参数微调、LoRA（ Low-Rank Adaptation...

生成式AI 2024-09-29 人工智能

2409阅读

微软Copilot将集成到新加坡的法律科技平台中

新加坡的律师现在可以使用微软的生成式人工智能（Gen AI）工具Copilot，但在拥抱这项技术的同时，仍需牢记人工监督的重要性。 Microsoft 365的Copilot已集成到该国的法律技术平台中，该平台于2022年推出，旨在支持法律工作流程，并包...

生成式AI 2024-09-29 人工智能

1402阅读

每日AIGC最新进展(56)：当下最强开源图片/视频理解模型CogVLM2发布

Diffusion Models专栏文章汇总：入门与实战随着大型语言模型和多模态对齐技术的发展，视频理解模型在一般开放领域也取得了重大进展。然而，目前大多数视频理解模型使用帧平均和视频令牌压缩方法，导致时间信息的丢失和无法准确回答与时间相关的问题。...

大数据 2024-09-26 人工智能

1088阅读

将LLaMA模型导出为ONNX格式的教程

将LLaMA模型导出为ONNX格式的教程 export_llama_to_onnx export llama to onnx 项目地址: https://gitcode.com/gh_mirrors/ex/export_llama_to_onn...

大数据 2024-09-26 人工智能

1935阅读

Emacs Copilot：你的智能编程伙伴

Emacs Copilot：你的智能编程伙伴 emacs-copilotLarge language model code completion for Emacs项目地址:https://gitcode.com/gh_mirrors/em/emacs...

AIGC 2024-09-24 人工智能

1160阅读

大模型之使用PyTorch编写Meta的Llama 3实际功能代码（六）

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

AIGC 2024-09-24 人工智能

1133阅读

Lag-Llama：时间序列大模型开源了！

之前我们介绍过TimeGPT，它是第一个时间序列的大模型，具有零样本推理、异常检测等能力。TimeGPT引发了对时间序列基础模型的更多研究，但是它是一个专有模型，只能通过API访问。如今，终于出现一个用于时间序列预测的开源大模型：Lag-Llama...

人工智能 2024-09-23 人工智能

1340阅读

速通LLaMA2：《Llama 2: Open Foundation and Fine-Tuned Chat Models》全文解读

文章目录概览 LLaMA和LLaMA2的区别 Abstract Introduction Pretraining Fine-tuning 1. 概括 2、Supervised Fine-Tuning（SFT） 3、⭐Reinforcemen...

人工智能 2024-09-22 人工智能

1124阅读

Llama Factory ：百种以上语言模型的统一高效微调框架

人工智能咨询培训老师叶梓转载标明出处大模型适应到特定下游任务时，传统的全参数微调方法成本高昂，因此，研究者们一直在探索更高效的微调技术。由北京航空航天大学和北京大学的研究团队提出了一个名为Llama Factory的统一框架，旨在解决大模型高效微调的...

AIGC 2024-09-21 人工智能

1085阅读

LLaMA Cog 模板：轻松构建和部署大型语言模型

LLaMA Cog 模板：轻松构建和部署大型语言模型 cog-llama-templateLLaMA Cog template项目地址:https://gitcode.com/gh_mirrors/co/cog-llama-template 项目介...

AIGC 2024-09-21 人工智能

996阅读

如何微调 Llama 3 进行序列分类？

节前，我们星球组织了一场算法岗技术&面试讨论会，邀请了一些互联网大厂朋友、参加社招和校招面试的同学. 针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。汇总合集：《大模...

生成式AI 2024-09-20 人工智能

1119阅读

速通LLaMA1：《LLaMA: Open and Efficient Foundation Language Models》全文解读

文章目录论文总览 1. 创新点和突破点 2. 技术实现与算法创新 3. 架构升级 4. 概念补充 SwiGLU激活函数 AdamW 5. 总结 Abstract Introduction Approach Pre-training...

人工智能 2024-09-18 人工智能

1521阅读

构建基于知识图谱的医药智能体Agent - 基于Llama 3.1、NVIDIA NIM 和 LangChain实践

使用ChatGPT创建虽然大多数人关注RAG与非结构化文本的关系，比如公司文档或技术文档，但我对基于结构化信息的检索系统持乐观态度，特别是知识图谱。关于GraphRAG，特别是微软的实现，[重磅 - 微软官宣正式在GitHub开源GraphRAG]，令...

生成式AI 2024-09-17 人工智能

1000阅读

Ollama保姆级教程

Ollama保姆级教程 Ollama是一个开源框架，专门设计用于在本地运行大型语言模型。它的主要特点是将模型权重、配置和数据捆绑到一个包中，从而优化了设置和配置细节，包括GPU使用情况，简化了在本地运行大型模型的过程。 Ollama还提供了对模型量化...

生成式AI 2024-09-15 人工智能

5136阅读

在自己笔记本上使用 Llama-3 生成 PowerPoint — 幻灯片自动化的第一步

在企业界幻灯片无处不在，它经常被用作交流想法和成就的方式。我个人在过去的四年里一直在大型跨国公司工作，制作幻灯片是大多数人每周都会做的事情。如果幻灯片能够有效利用时间，那就不是什么大问题了。有很多人会贬低这一点，但在我看来，幻灯片在大多数公司中消耗了...

生成式AI 2024-09-15 人工智能

1150阅读

小白学大模型：LLaMA-Factory 介绍与使用

最近这一两周看到不少互联网公司都已经开始秋招提前批了。不同以往的是，当前职场环境已不再是那个双向奔赴时代了。求职者在变多，HC 在变少，岗位要求还更高了。最近，我们又陆续整理了很多大厂的面试题，帮助一些球友解惑答疑，分享技术面试中的那些弯弯绕绕。...

人工智能 2024-09-15 人工智能

1252阅读

大模型_基于医疗领域用lora微调医疗数据及LLaMA微调ChatDoctor模型

文章目录 ChatDoctor 目标方法结果结论收集和准备医患对话数据集创建外部知识数据库具有知识大脑的自主聊天医生的开发模型培训结果数据和模型：微调推理 ChatDoctor 目标这项研究的主要...

AIGC 2024-09-14 人工智能

1637阅读

探索和构建 LLaMA 3 架构：深入探究组件、编码和推理技术

Meta 正在加大在人工智能 (AI 竞赛中的力度，推出了新的开源 AI 模型 Llama 3 以及新版 Meta AI。这款虚拟助手由 Llama 3 提供支持，现已在所有 Meta 平台上可用。以下是您需要了解的有关 Meta 最新大型语言模...

大数据 2024-09-14 人工智能

1276阅读

LLama 3 跨各种 GPU 类型的基准测试

2024 年 4 月 18 日，AI 社区对 Llama 3 70B 的发布表示欢迎，这是一款最先进的大型语言模型（LLM）。该型号是 Llama 系列的下一代产品，支持广泛的用例。该模型 istelf 在广泛的行业平台上表现良好，并提供了新功能，包括改...

生成式AI 2024-09-12 人工智能

1154阅读

推荐项目：Honest LLaMA——追求真相的大型语言模型干预技术

推荐项目：Honest LLaMA——追求真相的大型语言模型干预技术 honest_llamaInference-Time Intervention: Eliciting Truthful Answers from a Language Model项目...

大数据 2024-09-12 人工智能

1402阅读

AI智能体是什么？AI智能体工程师前景如何？

在人工智能飞速发展的今天，AI智能体（AI Agent）逐渐走进了公众视野。对于AI领域的初学者来说，理解AI智能体的概念、组成和应用场景是入门的关键。码叔今天为你揭开AI智能体AI Agent的神秘面纱，带你一探究竟。 AI智能体的能力与大模型紧密相连...

AIGC 2024-09-12 人工智能

1888阅读

新一代模型微调方案LLama-Pro ，快来围观！！！

❝ 大家好，我是 Bob! ? 一个想和大家慢慢变富的 AI 程序员? 分享 AI 前沿技术、项目经验、面试技巧! 欢迎关注我，一起探索，一起破圈！? Y LLAMA PRO论文笔记直达链接：摘要这篇论文介绍了一种名为L...

AIGC 2024-09-10 人工智能

1017阅读

GPT-4o不会数r，被外国小哥原地逼疯！谷歌论文揭秘Transformer「数不到n」

提示工程师Riley Goodside小哥，依然在用「Strawberry里有几个r」折磨大模型们，GPT-4o在无限次PUA后，已经被原地逼疯!相比之下，Claude坚决拒绝PUA，是个大聪明。而谷歌最近的论文也揭示了本质原因:LLM没有足够空间，来存储...

人工智能 2024-09-10 人工智能

980阅读

家用设备轻松搭建 AI 集群，畅跑 Llama 3.1 405B

作者：老余捞鱼原创不易，转载请标明出处及原作者。写在前面的话：本文主要介绍如何在家用设备上运行大型开源语言模型Llama 3.1 405B，首先我会解释构建人工智能集群来提高运行效率的原理，随后会演示如何通过Dist...

人工智能 2024-09-09 人工智能

954阅读

解决llama_index中使用Ollama出现timed out 问题

现象： File "~/anaconda3/envs/leo_py38/lib/python3.8/site-packages/httpx/_transports/default.py", line 86, in map_httpcore_excep...

人工智能 2024-09-08 人工智能

1946阅读

第三十五篇-各大模型测评地址和说明集合

1.Open LLM Leaderboard - 开放式LLM排行榜测评地址：https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard 说明：使用Eleuther...

AIGC 2024-09-06 人工智能

1774阅读

探索高效能的CPU版语言模型 —— 深入解读LLaMa CPU Fork

探索高效能的CPU版语言模型 —— 深入解读LLaMa CPU Fork llama-cpu项目地址:https://gitcode.com/gh_mirrors/ll/llama-cpu 在人工智能的广阔领域中，语言模型的进步一直是推动技术前沿的...

生成式AI 2024-09-06 人工智能

980阅读

Llama中的曼巴：通过推测解码加速推理

大型语言模型（LLMs）已经彻底改变了自然语言处理领域，但在处理非常长的序列时面临重大挑战。主要问题来自于Transformer架构的计算复杂度随序列长度呈二次方增长以及其巨大的键值（KV）缓存需求。这些限制严重影响了模型的效率，特别是在推理过程中，使生成...

大数据 2024-09-04 人工智能

1232阅读

LongLLaMA：扩展上下文处理能力的大型语言模型

LongLLaMA：扩展上下文处理能力的大型语言模型 long_llamaLongLLaMA is a large language model capable of handling long contexts. It is based on Ope...

人工智能 2024-09-04 人工智能

1039阅读

震撼发布！阿里通义FunAudioLLM：重塑自然语音交互新纪元，开源引领语音处理革命！

近年来，人工智能的进步如 GPT-4o 和 Gemini-1.5极大地改变了人与机器的互动方式，2023这种转变在语音处理领域尤为明显。阿里巴巴通义实验室近日发布并开源了 FunAudioLLM，这是一个旨在增强人与大型语言模型（LLMs）之间...

人工智能 2024-09-04 人工智能

1165阅读

探索LLaMA Factory：一站式大模型微调平台

探索LLaMA Factory：一站式大模型微调平台 LLaMA-Factory易于使用的LLM微调框架（LLaMA, BLOOM, Mistral, 百川， Qwen, ChatGLM）。项目地址:https://gitcode.com/gh_mir...

生成式AI 2024-09-02 人工智能

1745阅读

Science官宣允许AI写作！学会AI工具将是科研人的必修课

《科学》(Science）期刊今年修改了投稿规则：允许在论文的「方法」章节说明后，正当地采用生成式人工智能（AI）和大型语言模型制作插图、撰写论文内容。这意味着Science及旗下子刊推翻了 2023 年 1 月所设定...

生成式AI 2024-09-02 人工智能

1087阅读

使用 ORPO 微调 Llama 3

原文地址：https://towardsdatascience.com/fine-tune-llama-3-with-orpo-56cfab2f9ada 更便宜、更快的统一微调技术 2024 年 4 月 19 日 ORPO 是一种新的令人兴奋的微调技...

大数据 2024-09-01 人工智能

893阅读

《史上最简单的SpringAI+Llama3.x教程》-05-打破界限，Function Calling在业务场景中的应用

什么是Function Calling Function Calling 是一种技术，它允许大型语言模型（如GPT）在生成文本的过程中调用外部函数或服务。这种功能的核心在于，模型本身不直接执行函数，而是生成包含函数名称和执行函数所需参数的JSON，...

生成式AI 2024-09-01 人工智能

1507阅读

8G显存运行Llama 3.1 405B！

我正在接受挑战，在只有 8GB VRAM 的 GPU 上运行 Llama 3.1 405B 模型。 Llama 405B 模型有 820GB！这是 8GB VRAM 容量的 103 倍！显然，8GB VRAM 无法容纳它。那么我们如何让它工作呢？...

大数据 2024-08-31 人工智能

1275阅读

Meta AI新动向：Llama 4瞄准GPT-4，Agent技术或成研发重点

Meta的AI研发进展 Meta的AI科学家Thomas Scialom在最近的采访中透露了Llama系列大型语言模型的最新动态。Scialom谈到了Llama 3.1的研发思路，并展望了即将到来的Llama 4模型。他表示，Llama 3.1是在追求与...

AIGC 2024-08-31 人工智能

962阅读