语言模型第2页 - AIGC资讯

基于Llama构建的语音语言模型LLaMA-Omni；增强记忆的长文本建模检索方法；全功能的AI应用AnythingLLM

✨ 1: LLaMA-Omni LLaMA-Omni是基于Llama-3.1-8B-Instruct构建的语音语言模型，支持高质量低延迟的语音互动。 LLaMA-Omni是一个基于Llama-3.1-8B-Instruct构建的语音语言模型...

大数据 2024-09-28 人工智能

1718阅读

[从0开始AIGC][LLM]：LLM中Encoder-Only or Decoder-Only？为什么主流LLM是Decoder-Only？

LLM中Encoder-Only or Decoder-Only & 为什么主流LLM是Decoder-Only？文章目录 LLM中Encoder-Only or Decoder-Only & 为什么主流LLM是Dec...

大数据 2024-09-28 人工智能

1684阅读

DataWhale Task02：从零预训练一个tiny-llama 20923

DataWhale Task02：从零预训练一个tiny-llama 20923 原文link：https://github.com/KMnO4-zx/tiny-llm 开源内容：https://github.com/datawhalechina/t...

人工智能 2024-09-28 人工智能

1375阅读

陈睿：B站已成中国AI心智最强社区！

快科技9月27日消息，在2024年中国国际智能传播论坛上，哔哩哔哩董事长兼CEO陈睿发表演讲时表示，B站已经成为中国AI心智最强的社区。他指出，AI是B站上年轻人最关注的内容，也是该平台上增长最快的科技领域。据陈睿介绍，中国有68%的90后活跃在B站，...

人工智能 2024-09-27 人工智能

1059阅读

128 深入解析Llama Index的响应合成生成 llamaindex.core.response_synthesizers.generation.py

深入解析Llama Index的响应合成生成在自然语言处理（NLP）领域，Llama Index 是一个强大的工具，用于构建和处理复杂的语言模型。本文将深入探讨 Llama Index 中的生成器模块（Generation），并通过详细的代码示例和技...

人工智能 2024-09-27 人工智能

1422阅读

国内外大模型汇总（包括科大星火、文心一言、通义千问、智普清言、华为大模型）

国内外大模型汇总 1. 科大讯飞星火认知大模型主要特点：多语言能力：以中文为核心，同时支持多语言处理，能够进行跨语种的语言理解和生成。广泛的任务能力：具备内容生成、语言理解、知识问答、推理、数学计算、代码理解与生成等多种能力，能够处理复杂的自...

大数据 2024-09-27 人工智能

1694阅读

大模型——LLaVA和LLaMA的介绍和区别

LLaVA和LLaMA是两个不同的模型架构，它们的设计目的和应用领域有所不同： LLaMA（Large Language Model Meta AI）简介：LLaMA是由Meta AI推出的一系列大规模语言模型（Large Language M...

生成式AI 2024-09-27 人工智能

1927阅读

每日AIGC最新进展(56)：当下最强开源图片/视频理解模型CogVLM2发布

Diffusion Models专栏文章汇总：入门与实战随着大型语言模型和多模态对齐技术的发展，视频理解模型在一般开放领域也取得了重大进展。然而，目前大多数视频理解模型使用帧平均和视频令牌压缩方法，导致时间信息的丢失和无法准确回答与时间相关的问题。...

大数据 2024-09-26 人工智能

1021阅读

将LLaMA模型导出为ONNX格式的教程

将LLaMA模型导出为ONNX格式的教程 export_llama_to_onnx export llama to onnx 项目地址: https://gitcode.com/gh_mirrors/ex/export_llama_to_onn...

大数据 2024-09-26 人工智能

1824阅读

LLaMA-Factory使用指南：快速训练专属大模型，打造定制化AI解决方案！

本文聊聊 LLama-Factory，它是一个开源框架，这里头可以找到一系列预制的组件和模板，让你不用从零开始，就能训练出自己的语言模型（微调）。不管是聊天机器人，还是文章生成器，甚至是问答系统，都能搞定。而且，LLama-Factory 还支持多种框架和...

AIGC 2024-09-26 人工智能

1814阅读

人工智能生成内容（AIGC）对程序员的影响

? 人工智能生成内容（AIGC）对程序员的影响 ? 引言 AIGC技术正在深刻影响软件开发行业，给程序员带来诸多机遇和挑战。程序员不仅需要适应这些新兴技术，还要有效利用它们来提升自己的工作效率和创新能力。 ? AIGC技术的优势 ? 效率提...

人工智能 2024-09-25 人工智能

1145阅读

ollama本地部署大语言模型记录

目录安装Ollama 更改模型存放位置拉取模型 Gemma Mistral Qwen1.5(通义千问 codellama 部署Open webui 测试性能知识广度问题1 问题2 代码能力总结最近突然对大语言...

生成式AI 2024-09-25 人工智能

1070阅读

Lit-LLaMA 开源项目教程

Lit-LLaMA 开源项目教程 lit-llamaImplementation of the LLaMA language model based on nanoGPT. Supports flash attention, Int8 and GPTQ...

大数据 2024-09-24 人工智能

952阅读

Emacs Copilot：你的智能编程伙伴

Emacs Copilot：你的智能编程伙伴 emacs-copilotLarge language model code completion for Emacs项目地址:https://gitcode.com/gh_mirrors/em/emacs...

AIGC 2024-09-24 人工智能

1073阅读

llama_ros：ROS 2中的AI融合工具包

llama_ros：ROS 2中的AI融合工具包 llama_ros llama.cpp for ROS 2 项目地址: https://gitcode.com/gh_mirrors/ll/llama_ros 项目介绍 llama_...

人工智能 2024-09-24 人工智能

1362阅读

万字长文｜LLM大模型基础入门（非常详细）从入门到精通系列之：（三）Transformer 架构

...

生成式AI 2024-09-24 未命名

1070阅读

姚期智院士大模型新研究：思维图DoT，用数学理论确保AI逻辑一致性

姚期智院士领衔，推出大模型新推理框架，CoT“王冠”戴不住了。提出思维图（DiagramofThought），让大模型思考更像人类。团队更是为这种推理过程提供了数学基础，通过拓扑斯理论（Topos Theory）正式化（formalize）DoT，确保...

AIGC 2024-09-24 人工智能

1159阅读

大模型之使用PyTorch编写Meta的Llama 3实际功能代码（六）

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

AIGC 2024-09-24 人工智能

1059阅读

GPUStack正式发布: 为大模型而生的开源GPU集群管理器

经过 Seal 研发团队几个月来持续的开发和测试，我们满怀期待及热情地发布新的产品 GPUStack，GPUStack 是一个用于运行LLM（大型语言模型）的开源GPU集群管理器。尽管如今大语言模型作为公共的云上服务已经被广泛推广并在公有云上变得更加易于使...

AIGC 2024-09-23 人工智能

1390阅读

Llama模型家族之拒绝抽样(Rejection Sampling)（五）蒙特卡罗算法在拒绝抽样中：均匀分布与样本接受标准

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

生成式AI 2024-09-23 人工智能

1052阅读

GPT-4o能玩《黑神话》！精英怪胜率超人类，无强化学习纯大模型方案

AI玩黑神话，第一个精英怪牯护院轻松拿捏啊。有方向感，视角也没有问题。躲闪劈棍很丝滑。甚至在打鸦香客和牯护院时，AI的胜率已经超过人类。而且是完全使用大模型玩，没有使用强化学习。阿里巴巴的研究人员们提出了一个新型VARP（视觉动作角色扮演...

AIGC 2024-09-23 人工智能

960阅读

Lag-Llama：时间序列大模型开源了！

之前我们介绍过TimeGPT，它是第一个时间序列的大模型，具有零样本推理、异常检测等能力。TimeGPT引发了对时间序列基础模型的更多研究，但是它是一个专有模型，只能通过API访问。如今，终于出现一个用于时间序列预测的开源大模型：Lag-Llama...

人工智能 2024-09-23 人工智能

1248阅读

LLM入门——在Colab上部署Llama2

LLM入门——在Colab上部署Llama2 2024/07/09 本文属于“LLM入门”系列，该系列是笔者自学LLM时记录的一些实践记录与心得，可能存在错误或过时的部分，请读者谅解。对于LLM入门学者，我推荐从Large Language...

大数据 2024-09-23 人工智能

1191阅读

使用本地 LLM 构建 Llama 3.1 8b Streamlit 聊天应用程序：使用 Ollama 的分

介绍大型语言模型（LLMs）彻底改变了人工智能领域，提供了令人印象深刻的语言理解和生成能力。本文将指导您构建一个使用本地LLM的Streamlit聊天应用程序，特别是来自Meta的Llama 3.1 8b模型，通过Ollama库进行集成。...

人工智能 2024-09-22 人工智能

1241阅读

【AIGC】InstructPixPix:基于文本引导的图像编辑技术

github:diffusers/examples/instruct_pix2pix/train_instruct_pix2pix_sdxl.py at main · huggingface/diffusers · GitHub 论文：https://a...

生成式AI 2024-09-22 人工智能

1134阅读

速通LLaMA2：《Llama 2: Open Foundation and Fine-Tuned Chat Models》全文解读

文章目录概览 LLaMA和LLaMA2的区别 Abstract Introduction Pretraining Fine-tuning 1. 概括 2、Supervised Fine-Tuning（SFT） 3、⭐Reinforcemen...

人工智能 2024-09-22 人工智能

1017阅读

24全网最全stable diffusion模型讲解！快来！！新手必收藏！！

前言手把手教你入门绘图超强的AI绘画程序Stable Diffusion，用户只需要输入一段图片的文字描述，即可生成精美的绘画。给大家带来了全新Stable Diffusion保姆级教程资料包（文末可获取） AI模型最新展现出的图像生成能力远远超出...

生成式AI 2024-09-21 人工智能

1046阅读

使用LLaMA-Factory快速训练自己的专用大模型

本文聊聊 LLama-Factory，它是一个开源框架，这里头可以找到一系列预制的组件和模板，让你不用从零开始，就能训练出自己的语言模型（微调）。不管是聊天机器人，还是文章生成器，甚至是问答系统，都能搞定。而且，LLama-Factory 还支持多种框架和...

大数据 2024-09-21 人工智能

1069阅读

Llama Factory ：百种以上语言模型的统一高效微调框架

人工智能咨询培训老师叶梓转载标明出处大模型适应到特定下游任务时，传统的全参数微调方法成本高昂，因此，研究者们一直在探索更高效的微调技术。由北京航空航天大学和北京大学的研究团队提出了一个名为Llama Factory的统一框架，旨在解决大模型高效微调的...

AIGC 2024-09-21 人工智能

1016阅读

LLaMA Cog 模板：轻松构建和部署大型语言模型

LLaMA Cog 模板：轻松构建和部署大型语言模型 cog-llama-templateLLaMA Cog template项目地址:https://gitcode.com/gh_mirrors/co/cog-llama-template 项目介...

AIGC 2024-09-21 人工智能

929阅读

详聊LLaMa技术细节：LLaMA大模型是如何炼成的？

本文介绍来自 Meta AI 的 LLaMa 模型，类似于 OPT，也是一种完全开源的大语言模型。LLaMa 的参数量级从 7B 到 65B 大小不等，是在数万亿个 token 上面训练得到。值得一提的是，LLaMa 虽然只使用公共的数据集，依然取得了强悍...

AIGC 2024-09-21 人工智能

1567阅读

LLAMA-FACTORY：100+语言模型的统一高效微调框架

24年3月来自北航和北大的论文“LLAMA-FACTORY: Unified Efficient Fine-Tuning of 100+ Language Models”。高效的微调对于将大语言模型 (LLM 适应下游任务至关重要。然而，在不同模型上...

人工智能 2024-09-21 人工智能

1884阅读

2024.9月最新Super智能AI知识库开源系统chatgpt网站源码AI绘画AI机器人在线客服源码企业/个人私有化AI系统部署源码

前言：以下所有的详细内容可在我们的官方文档中查看： Super智能AI知识库官方文档一、人工智能人工智能技术正在迅速发展，AI语言模型、AI绘画、AI视频在多个领域都有广泛的应用。它们不仅在科技创新方面表现出色，还在艺术创作、内容生产和商...

生成式AI 2024-09-21 人工智能

1206阅读

广告烧钱过亿，70%用户靠投流，大模型算不过成本账？

一个兽医博主在记录父亲深夜抢救母牛的过程中，使用Kimi查找“母牛传染病”的相关医学内容;一个生活博主在告诉大家如何用AI实现人生第一个13万的过程中，向用户展示如何用豆包生产内容;打工人上班途中在北京地铁1号线永安里站出口，看到智谱清言应用的大屏广告;好...

人工智能 2024-09-20 人工智能

797阅读

LongLLaMA 项目使用教程

LongLLaMA 项目使用教程 long_llamaLongLLaMA is a large language model capable of handling long contexts. It is based on OpenLLaMA and...

AIGC 2024-09-20 人工智能

963阅读

如何微调 Llama 3 进行序列分类？

节前，我们星球组织了一场算法岗技术&面试讨论会，邀请了一些互联网大厂朋友、参加社招和校招面试的同学. 针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。汇总合集：《大模...

生成式AI 2024-09-20 人工智能

1035阅读

手把手带你了解和实践扩充 LLaMA 大语言模型的 tokenizer 模型（实现中文token过程）

目前，大语言模型呈爆发式的增长，其中，基于llama家族的模型占据了半壁江山。而原始的llama模型对中文的支持不太友好，接下来本文将讲解如何去扩充vocab里面的词以对中文进行token化。一般的，目前比较主流的是使用sentencepiece训练中...

生成式AI 2024-09-19 人工智能

1615阅读

使用微调神器LLaMA-Factory轻松改变大语言模型的自我认知

一、引言在本地化部署大语言模型时，为了能够改变大语言模型的自我认知，最简单的方式，就是使用系统提示词（system_prompt）的方式，譬如在与大模型进行对话时，首先将这段话作为message发送给大模型——{"role":"system","con...

大数据 2024-09-19 人工智能

2404阅读

大规模语言模型从理论到实践 LLaMA分布式训练实践

大规模语言模型从理论到实践 LLaMA分布式训练实践作者：禅与计算机程序设计艺术 / Zen and the Art of Computer Programming 1. 背景介绍 1.1 问题的由来随着深度学习的快速发展，大规模语言模型（La...

生成式AI 2024-09-19 人工智能

923阅读

用Transformers库运行Llama-3.1-Minitron-4B

我的笔记本来自8年前的旧时代，勉强能运行8B模型，于是打算试试看更小的…… Llama-3.1-Minitron 4B 简介 Llama-3.1-Minitron 4B 是基于Llama-3.1 8B模型，通过结构化权重剪枝和知识提炼技术优化而成的...

AIGC 2024-09-19 人工智能

1280阅读

探索未来工作通讯的智能伙伴：Mattermost Copilot 插件

探索未来工作通讯的智能伙伴：Mattermost Copilot 插件 mattermost-plugin-aiMattermost plugin for LLMs项目地址:https://gitcode.com/gh_mirrors/ma/matte...

AIGC 2024-09-18 人工智能

1150阅读

AIGC实战——多模态模型Flamingo

AIGC实战——多模态模型Flamingo 0. 前言 1. Flamingo 架构 2. 视觉编码器 3. Perceiver 重采样器 4. 语言模型 5. FIamingo 应用小结系列链接 0. 前言我们已经学习了文...

AIGC 2024-09-18 人工智能

1469阅读

开源项目教程：llama-utils

开源项目教程：llama-utils llama-utilsThe easiest & fastest way to run customized and fine-tuned LLMs locally or on the edge项目地址:h...

生成式AI 2024-09-18 人工智能

1128阅读

速通LLaMA1：《LLaMA: Open and Efficient Foundation Language Models》全文解读

文章目录论文总览 1. 创新点和突破点 2. 技术实现与算法创新 3. 架构升级 4. 概念补充 SwiGLU激活函数 AdamW 5. 总结 Abstract Introduction Approach Pre-training...

人工智能 2024-09-18 人工智能

1396阅读

构建基于知识图谱的医药智能体Agent - 基于Llama 3.1、NVIDIA NIM 和 LangChain实践

使用ChatGPT创建虽然大多数人关注RAG与非结构化文本的关系，比如公司文档或技术文档，但我对基于结构化信息的检索系统持乐观态度，特别是知识图谱。关于GraphRAG，特别是微软的实现，[重磅 - 微软官宣正式在GitHub开源GraphRAG]，令...

生成式AI 2024-09-17 人工智能

929阅读

Nvidia AI 发布 Llama-Minitron 3.1 4B：通过修剪和提炼 Llama 3.1 8B 构建的新语言模型

Nvidia 刚刚发布了语言模型的新版本，不过这次是一个小型语言模型：Llama-3.1-Minitron 4B 模型。这意味着它是语言模型不断发展的重要步骤之一，通过剪枝和知识提炼等尖端技术，将大型模型的效率与小型模型相结合。 Llama-3.1-...

生成式AI 2024-09-16 人工智能

785阅读

人工智能 | MetaLlama大模型

llama 大模型介绍我们介绍 LLaMA，这是一个基础语言模型的集合，参数范围从 7B 到 65B。我们在数万亿个Token上训练我们的模型，并表明可以专门使用公开可用的数据集来训练最先进的模型，而无需诉诸专有的和无法访问的数据集。特别是，...

生成式AI 2024-09-16 人工智能

1777阅读

WebLlama：基于Llama-3的网页浏览助手开发指南

WebLlama：基于Llama-3的网页浏览助手开发指南 webllamaLlama-3 agents that can browse the web by following instructions and talking to you项目地址:...

AIGC 2024-09-16 人工智能

848阅读

rk3588使用npu加速运行whisper语音识别模型

rk3588运行whisper模型有三种方法：1.使用纯cpu运行原始pytorch模型；2.将whisper模型转成onnx格式，再转成rknn格式使用npu运行；3.利用npu提供的矩阵运算功能，结合cpu一起运行原始pytorch模型。方法1做不到实...

AIGC 2024-09-16 人工智能

3407阅读

三步搞定私人AI助手 | LLaMA-3本地部署小白攻略

“ 在你的电脑上运行一个强大的AI助手，它不仅能力超群，还把所有秘密都藏在你的硬盘里。好奇这是如何实现的吗？动动手，三分钟就可以完成LLaMA-3的本地部署！ ” 01、LLaMA-3‍‍‍‍ 最近在试验检索增强生成（RAG）的项目，想试试换一个强点的...

AIGC 2024-09-16 人工智能

1124阅读