语言模型第5页 - AIGC资讯

ChatGLM-6B入门

ChatGLM-6B ChatGLM-6B 一、介绍 ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型，基于 General Language Model (GLM 架构，具有 62 亿参数。结合模型量化技术，用户可以在消费级的显卡...

AIGC 2024-08-27 人工智能

906阅读

深度解读 Llama 3.1 技术报告：从405B参数到24000块H100集群

Meta在最近发布了他们的开源大模型Llama 3.1，引起了广泛的关注和讨论。随着热度逐渐退潮，Llama 3.1 的详细技术报告也公开了。这份报告揭示了很多关于Llama 3.1 的技术细节和实现原理。本文将从模型参数、基础设施、预训练、后训练等方面，...

大数据 2024-08-27 人工智能

1391阅读

【从Qwen2,Apple Intelligence Foundation,Gemma 2,Llama 3.1看大模型的性能提升之路】

从早期的 GPT 模型到如今复杂的开放式 LLM，大型语言模型 (LLM 的发展已经取得了长足的进步。最初，LLM 训练过程仅侧重于预训练，但后来扩展到包括预训练和后训练。后训练通常包括监督指令微调和校准，这是由 ChatGPT 推广的。自 Chat...

人工智能 2024-08-26 人工智能

1134阅读

检索生成(RAG) vs 长文本大模型：实际应用中如何选择？

编者按：大模型的上下文理解能力直接影响到 LLMs 在复杂任务和长对话中的表现。本期内容聚焦于两种主流技术：长上下文(Large Context Windows 和检索增强生成(RAG 。这两种技术各有何优势？在实际应用中，我们又该如何权衡选择？文章...

人工智能 2024-08-26 人工智能

966阅读

小窗AI问答机有哪些功能？怎么使用方法详细教程指南

小窗AI问答机是什么？小窗® 对话式 AI 问答机是一款基于大语言模型（LLM）的人工智能技术产品，主要面向孩子群体，帮助他们在学习和生活中获取知识，提升独立思考、提问和语言表达能力。该产品的优点包括博学多知的超级博士、随时交谈的外语陪练、无穷创意的...

大数据 2024-08-26 人工智能

1583阅读

基于华为昇腾910B和LLaMA Factory多卡微调的实战教程

大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于大模型算法的研究与应用。曾担任百度千帆大模型比赛、BPAA算法大赛评委，编写微软OpenAI考试认证指导手册。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三...

大数据 2024-08-26 人工智能

2412阅读

大模型算法必学，万字长文Llama-1到Llama-3详细拆解

导读 Llama系列的大语言模型在多个自然语言处理任务中表现出色，包括文本分类、情感分析和生成式问答，本质是使用 Transformer 架构并结合预训练和微调技术。本文详细讲解Llama-1到Llama-3，值得读者点赞收藏！引言在AI领域...

AIGC 2024-08-25 人工智能

1456阅读

Datawhale AI夏令营第四期AIGC方向Task2学习笔记

Kolors（可图）模型 Kolors是由快手团队开发的大规模文本到图像生成模型（可图 · 模型库 (modelscope.cn ）根据链接的文章内容，Kolors在视觉质量、复杂语义准确性以及中英文字符的文本渲染方面，显著优于开源和专有...

生成式AI 2024-08-25 人工智能

865阅读

关于Stable diffusion的各种模型，看这篇就可以了！

前言这篇文章主要是帮大家梳理下Stable diffusion里面的各种模型，模型在Stable diffusion中占据着至关重要的地位，不仅决定了出图的风格，也决定了出图质量的好坏。但在第一次接触SD的时候，我就被里面的模型搞到头大，不仅有多...

AIGC 2024-08-25 人工智能

1903阅读

语言图像模型大一统！Meta将Transformer和Diffusion融合，多模态AI王者登场

【新智元导读】就在刚刚，Meta最新发布的Transfusion，能够训练生成文本和图像的统一模型了!完美融合Transformer和扩散领域之后，语言模型和图像大一统，又近了一步。也就是说，真正的多模态AI模型，可能很快就要来了! Transformer...

生成式AI 2024-08-25 人工智能

959阅读

Llama 3.1中文微调数据集已上线，超大模型一键部署

7 月的 AI 圈真是卷完小模型卷大模型，精彩不停！大多数同学都能体验 GPT-4o、Mistral-Nemo 这样的小模型，但 Llama-3.1-405B 和 Mistral-Large-2 这样的超大模型让很多小伙伴犯了难。别担心！hyper.a...

人工智能 2024-08-25 人工智能

1114阅读

五个优秀的免费 Ollama WebUI 客户端推荐

认识 Ollama 本地模型框架，并简单了解它的优势和不足，以及推荐了 5 款开源免费的 Ollama WebUI 客户端，以提高使用体验。什么是 Ollama？ Ollama 是一款强大的本地运行大型语言模型（LLM）的框架，它允许用户在自己...

人工智能 2024-08-25 人工智能

5282阅读

超越SD3，比肩MJ v6，文生图模型FLUX.1开源

近日，图片生成模型FLUX.1引爆了AIGC社区，其在视觉质量、图像细节和输出多样性等方面性能优越，输出极佳的图片生成效果。 FLUX.1系列模型由Black Forest Labs开源，创始人Robin Rombach是Stable Diffu...

生成式AI 2024-08-24 人工智能

1276阅读

英伟达最新技术分享：手把手教你用Llama 3.1合成数据改进模型！附代码

【导读】适逢Llama 3.1模型刚刚发布，英伟达就发表了一篇技术博客，手把手教你如何好好利用这个强大的开源模型，为领域模型或RAG系统的微调生成合成数据。 Epoch AI上个月刚刚发文[预言数据墙」迫近，结果英伟达转头就甩出了340B开源巨兽Ne...

生成式AI 2024-08-24 人工智能

1006阅读

【LLM】一、利用ollama本地部署大模型

目录前言一、Ollama 简介 1、什么是Ollama 2、特点：二、Windows部署 1.下载 2.安装 3.测试安装 4.模型部署： 5.注意三、 Docker部署 1.do...

生成式AI 2024-08-24 人工智能

1161阅读

摩尔线程开源音频理解大模型MooER：38小时训练5000小时数据

快科技8月23日消息，摩尔线程官方宣布，音频理解大模型MooER”（摩耳）已经正式开源，并公布在GitHub上：https://github.com/MooreThreads/MooER 目前开源的内容包括推理代码，以及5000小时数据训练的模型，后续还将...

大数据 2024-08-24 人工智能

880阅读

Nvidia 和 Mistral AI 的超精确小语言模型适用于笔记本电脑和 PC

Nvidia 和 Mistral AI 发布了一款新型的小型语言模型，据称该模型在小体积下依然具有「最先进」的准确性。该模型名为 Mistral-NemMo-Minitron 8B，是 NeMo 12B 的迷你版本，参数量从 120 亿缩减到了 80 亿。...

AIGC 2024-08-24 人工智能

976阅读

最强终端部署的多模态MiniCPM-V模型部署分享（不看后悔）

MiniCPM-V模型是一个强大的端侧多模态大语言模型，专为高效的终端部署而设计。目前该模型有MiniCPM-V 1.0、MiniCPM-V 2.0和MiniCPM-Llama3-V 2.5版本。 MiniCPM-V 1.0模型：该模型系列第一个版本...

AIGC 2024-08-24 人工智能

2161阅读

基础模型在亚马逊的BEDROCK测试

前言通过 Amazon Bedrock，开发者可以轻松使用多种最新领先基础模型（FM）进行构建。本实验中，您将了解和体验到在 Amazon Bedrock 中模型的基础使用方法，以便您快速构建强大安全的大语言模型（LLM）应用，其中包括：...

AIGC 2024-08-23 人工智能

955阅读

一文理解生成式AI应用的五个级别：Tool、Chatbot、Copilot、Agent 和 Intelligence

当下，很多人对 AI 一知半解，并不能很好地区分：Tool、Chatbot、Copilot、Agent 和 Intelligence 概念之间的区别。最近读完《真格基金戴雨森谈生成式AI：这是比移动互联网更大的创业机会，开始行动是关键》发现讲的特别...

人工智能 2024-08-23 人工智能

2591阅读

通过剪枝与知识蒸馏优化大型语言模型：NVIDIA在Llama 3.1模型上的实践与创新

每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同...

人工智能 2024-08-23 人工智能

992阅读

Llama-2-Open-Source-LLM-CPU-Inference 使用教程

Llama-2-Open-Source-LLM-CPU-Inference 使用教程 Llama-2-Open-Source-LLM-CPU-InferenceRunning Llama 2 and other Open-Source LLMs on...

大数据 2024-08-23 人工智能

976阅读

全球首个语音指挥FPS AI ，腾讯魔方携最新AI成果亮相科隆展

AI究竟会如何改变游戏?这应该是全球游戏行业近年最为关注的问题之一。在最近正在德国举办的全球最大游戏展—科隆游戏展上，腾讯游戏魔方工作室群技术中心联合《暗区突围:无限》项目组，首次对外公布其全球首个语音指挥FPSAIF.A.C.U.L.的技术Demo。这是...

生成式AI 2024-08-23 人工智能

852阅读

「深度探索：AIGC——从文本到视觉的奇迹之旅」

文章目录 1. 探讨AIGC技术的发展现状和未来趋势 1.1 引言 1.1.1 定义AIGC 1.1.2 重要性与应用领域 1.1.3 文章目的 2. AIGC技术的发展历程 2.1 起源与早期阶段 2.2 技术突破 2.2.1 深...

AIGC 2024-08-23 人工智能

1097阅读

法律 | 法律人AI使用指南

原文：法律 | 法律人AI使用指南|法官|法院|文书|公司法_网易订阅 01 引言过去半年多，我一直在尝试着用AI来辅助自己的各项法律工作，将AI融入自己的日常工作之中，并试图形成自身稳定的“法律+AI”工作流。在此过程中，我时常惊讶于AI高效的工...

生成式AI 2024-08-23 人工智能

1794阅读

华为昇腾Ascend系列之 01 什么是昇腾芯片？AIGC浪潮已至，进一步推动对芯片和算力的需求，主流 GPGPU/ASIC 产品性能对比（Ascend 910、Ascend 910B）

什么是昇腾Ascend 910、Ascend 910B 昇腾 310 和 910 处理器为华为AI 算力领域核心产品，910 单卡 Int8 算力大致可达 0.6 P，最大功耗为 300W，已可对标国际主流 GPU。且昇腾计算产业在硬件方面坚持“硬件开...

AIGC 2024-08-23 人工智能

6303阅读

GOLLIE : ANNOTATION GUIDELINES IMPROVE ZERO-SHOT INFORMATION-EXTRACTION

文章目录题目摘要引言方法实验消融研究题目 Techgpt-2.0:解决知识图谱构建任务的大型语言模型项目论文地址：https://arxiv.org/abs/2310.03668 摘要大...

生成式AI 2024-08-23 人工智能

1062阅读

用Ollama 和 Open WebUI本地部署Llama 3.1 8B

说明：本人运行环境windows11 N卡6G显存。部署Llama3.1 8B 简介 Ollama是一个开源的大型语言模型服务工具，它允许用户在自己的硬件环境中轻松部署和使用大规模预训练模型。Ollama 的主要功能是在Docker容器内部署和...

生成式AI 2024-08-23 人工智能

2204阅读

非Transformer时代到来！全新无注意力模式超越Llama传奇

来源 | 机器之心 ID | almosthuman2014 Mamba 架构模型这次终于要「站」起来了？自 2023 年 12 月首次推出以来，Mamba 便成为了 Transformer 的强有力竞争对手。此后，采用 Mamba 架构的模型...

生成式AI 2024-08-22 人工智能

1079阅读

开源模型应用落地-qwen2-7b-instruct-LoRA微调&模型合并-LLaMA-Factory-单机多卡-RTX 4090双卡（六）

一、前言本篇文章将使用LLaMA-Factory去合并微调后的模型权重，通过阅读本文，您将能够更好地掌握这些关键技术，理解其中的关键技术要点，并应用于自己的项目中。二、术语介绍 2.1. LoRA微调 LoRA (Low-Ra...

AIGC 2024-08-22 人工智能

1312阅读

快速上手文心一言

在日常工作和学习中，人工智能的应用越来越广泛。文心一言是百度推出的一款人工智能大语言模型产品，它可以根据上一句话预测生成下一段话，帮助我们获取信息、知识和灵感。以下是对文心一言的介绍和使用方法。一、什么是文心一言文心...

大数据 2024-08-22 人工智能

1010阅读

MSRA古纾旸：2024年，视觉生成领域最重要的问题有哪些？

文章链接: https://arxiv.org/pdf/2407.18290 亮点直击概述了视觉生成领域中的各种问题。这些问题的核心在于如何分解视觉信号，其他所有问题都与这一核心问题密切相关，并源于不适当的信号分解方法。本文旨...

人工智能 2024-08-22 人工智能

918阅读

一文看懂llama2（原理&模型&训练）

Llama2（大型语言模型2） Llama2（大型语言模型2）主要基于近年来火爆的Transformer架构。下面是Llama2的几个核心原理： Transformer 架构: Llama2采用了Transformer网络，它通过自注意力机制来处理...

人工智能 2024-08-22 人工智能

986阅读

T-Eval：大模型智能体能力评测基准解读 | ACL 2024

AI Agent（智能体）作为大模型的重要应用模式，能够通过使用外部工具来执行复杂任务，完成多步骤的工作流程。为了更全面地评估模型的工具使用能力，司南及合作伙伴团队推出了T-Eval评测基准，相关成果论文已被ACL 2024主会录用，点击链接可查看原文：h...

人工智能 2024-08-22 人工智能

1630阅读

掌握 Llama 3.1：轻松本地部署与远程使用的全攻略

前言: Llama 3.1 是 Meta（Facebook 的母公司）发布的一系列最先进的开源大语言模型。Llama 3.1 系列包括 8B（80 亿参数）、70B（700 亿参数）和 405B（4050 亿参数）模型。其中，405B 是 Meta 迄...

生成式AI 2024-08-22 人工智能

2484阅读

探索音乐的智慧：MU-LLaMA 模型引领文本到音乐生成新纪元

探索音乐的智慧：MU-LLaMA 模型引领文本到音乐生成新纪元 MU-LLaMAMU-LLaMA: Music Understanding Large Language Model项目地址:https://gitcode.com/gh_mirrors/...

生成式AI 2024-08-22 人工智能

1015阅读

Zed AI有哪些功能免费吗？人工智能代码生成怎么使用方法详细教程指南

Zed AI 是什么？ Zed AI是一个集成到编程工作流中的插件，通过与大型语言模型（LLMs）的直接对话，增强了代码生成、转换和分析的能力。它提供了多种交互方式，包括助手面板、斜杠命令、内联助手和提示库，以提高开发效率。Zed AI还支持多种LLMs提...

AIGC 2024-08-21 人工智能

1368阅读

ECCV2024中有哪些值得关注的扩散模型相关的工作？

Diffusion Models专栏文章汇总：入门与实战 The Fabrication of Reality and Fantasy: Scene Generation with LLM-Assisted Prompt Interpretation...

人工智能 2024-08-21 人工智能

944阅读

一文搞定大模型备案

《生成式人工智能服务安全基本要求》背景 1.1.基本要求对应的流程和介绍 "生成式人工智能服务安全基本要求"是针对"生成式人工智能（大语言模型）上线备案"流程制定的标准，这一流程也被称作"大模型上线备案"。这是继"生成合成（深度合成）类算法备案"之...

AIGC 2024-08-21 人工智能

1896阅读

AIGC学习笔记

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档前言提示：这里可以添加本文要记录的大概内容：记录一下学习AIGC，参考链接: 爆火的AIGC到底是什么提示：以下是本篇文章正文内容，下面案例可供参考一、stab...

AIGC 2024-08-21 人工智能

872阅读

Llama中文大模型-模型微调

同时提供了LoRA微调和全量参数微调代码，关于LoRA的详细介绍可以参考论文“[LoRA: Low-Rank Adaptation of Large Language Models](https://arxiv.org/abs/2106.09685 ”以及...

人工智能 2024-08-21 人工智能

1041阅读

即刻体验 Llama3.1就在Amazon Bedrock!

引言在人工智能的浪潮中，大型语言模型（LLMs）不断推动着技术边界的扩展。Meta 最新推出的 Llama 3.1 模型系列，以其卓越的性能和广泛的应用前景，引起了业界的广泛关注。现在，激动人心的消息来了——Llama3.1 已经在 Amazon Be...

AIGC 2024-08-21 人工智能

940阅读

【Qwen2部署实战】Qwen2初体验：用Transformers打造智能聊天机器人

系列篇章? No. 文章 1 【Qwen部署实战】探索Qwen-7B-Chat：阿里云大型语言模型的对话实践 2 【Qwen2部署实战】Qwen2初体验：用Transformers打造智能聊天机器人 3 【Qwen2部署实战】探索Qw...

生成式AI 2024-08-21 人工智能

2074阅读

本地部署 Llama-3-EvoVLM-JP-v2

本地部署 Llama-3-EvoVLM-JP-v2 0. 引言 1. 关于 Llama-3-EvoVLM-JP-v2 2. 本地部署 2-0. 克隆代码 2-1. 安装依赖模块 2-2. 创建 Web UI 2-3.启动 Web UI 2-4...

生成式AI 2024-08-21 人工智能

1058阅读

论文阅读-Transformer Layers as Painters

1. 摘要尽管大语言模型现在已经被广泛的应用于各种任务，但是目前对其并没有一个很好的认知。为了弄清楚删除和重组预训练模型不同层的影响，本文设计了一系列的实验。通过实验表明，预训练语言模型中的lower和final layers与中间层分布不一致，并且...

大数据 2024-08-20 人工智能

1025阅读

技术证书认证-附考试答案-AIGC与大模型通识-英特尔大湾区科技创新中心证书认证

目录课程简介面向人群考核步骤试题答案知孤云出岫主页课程以及考试链接：AIGC与大模型通识 - 英特尔大湾区科技创新中心【英特尔大湾区科技创新中心】公益新课《AIGC与大模型通识》上线官网！首期结业认证进行中，提升...

生成式AI 2024-08-20 人工智能

1447阅读

【深度学习】LLaMA-Factory 大模型微调工具, 大模型GLM-4-9B Chat ，微调与部署 (2)

文章目录数据准备 chat 评估模型导出模型部署总结资料： https://github.com/hiyouga/LLaMA-Factory/blob/main/README_zh.md https:...

生成式AI 2024-08-20 人工智能

1313阅读

Ollama 部署本地大模型

目录前言下载安装下载模型接口调用环境变量其他模型前言工作需要，被指派对大模型做技术调研，又不想花钱买各大产商的key，所以就考虑部署本地的大模型，了解到 Ollama 开源框架，专为在本地机器上便捷部署和运行大型语言模...

人工智能 2024-08-20 人工智能

3875阅读

【Reflextion论文总结】

Reflextion论文总结文章目录 Reflextion论文总结 1、简介 2、创新点 3、主要内容整体框架记忆组件流程 4、自我反思适用情形 5、实验结果 6、Langchain实现 AnswerQuestion I...

人工智能 2024-08-19 人工智能

1288阅读

探索Llama 3.1：深入理解其多语言与长上下文处理能力

摘要 Llama 3.1，一款先进的语言模型，以其庞大的参数量和卓越的性能而闻名。本文将分析Llama 3.1在不同规模版本中—405B、70B和8B—的多语言处理能力和长上下文理解能力，探讨其在人工智能领域的应用潜力。引言随着人工智能技术的飞速...

AIGC 2024-08-19 人工智能

1031阅读