语言模型第6页 - AIGC资讯

本地部署 Llama 3.1：Ollama、OpenWeb UI 和 Spring AI 的综合指南

、本文介绍如何使用 Ollama 在本地部署 Llama 3.1:8B 模型，并通过 OpenWeb UI 和 Spring AI 来增强模型交互体验和简化 API 的调用过程。 Ollama Ollama 是一个开源的大语言模型服...

生成式AI 2024-08-19 人工智能

2557阅读

从头开始微调Llama 3.1模型

在今天的科技专栏中，我们将深入探讨如何微调Llama 3.1模型，以使其更好地适应您的特定领域数据。微调大型语言模型（如Llama）的主要目的是为了在特定领域的数据上表现更好，从而生成更符合您需求的输出。以下是我们将要介绍的五个主要步骤：安装必要的软...

人工智能 2024-08-19 人工智能

1214阅读

OpenAI“权力游戏”未完，四名领导层新星入局，竟有一半是华人

OpenAI接二连三的核心高层人事发生变动，乱世出英雄，一批后起之秀扛旗。自从2023年11月奥特曼被罢免又复职以来，OpenAI内部貌似权力斗争不断。最近，多位高管相继离职，据金融时报报道，OpenAI最初的11位联合创始人，但目前只有两位仍在Ope...

生成式AI 2024-08-19 人工智能

930阅读

微调大语言模型——LLaMa-Factory平台搭建（非常详细）零基础入门到精通，收藏这一篇就够了

我们采用 LLaMA-Factory平台进行微调语言模型，详细信息可以访问github主页（https://github.com/hiyouga/LLaMA-Factory）浏览。租赁显卡采用AutoDL作为云平台进行微调训练。Win系统采用终端...

人工智能 2024-08-19 人工智能

3317阅读

深入剖析大模型安全问题：Langchain框架的隐藏风险

随着大模型热度持续，基于大模型的各类应用层出不穷。Langchain 作为一个以 LLM 模型为核心的开发框架，可以帮助我们灵活地创建各类应用，同时也为大模型的应用引入新的安全隐患。从今年 4 月 Langchain 被爆出在野 0day 漏洞开始，各类安...

AIGC 2024-08-19 人工智能

999阅读

【Qwen2部署实战】探索Qwen2-7B：通过FastApi框架实现API的部署与调用

系列篇章? No. 文章 1 【Qwen部署实战】探索Qwen-7B-Chat：阿里云大型语言模型的对话实践 2 【Qwen2部署实战】Qwen2初体验：用Transformers打造智能聊天机器人 3 【Qwen2部署实战】探索Qw...

大数据 2024-08-18 人工智能

1830阅读

Qwen2：通义千问倾力巨献，领航语言新纪元

一、介绍 Qwen2 是由阿里云通义千问团队研发的新一代大型语言模型系列，它在多个方面实现了技术的飞跃和性能的显著提升。以下是对 Qwen2 的详细介绍： GitHub - QwenLM/Qwen2: Qwen2 is the large langua...

大数据 2024-08-18 人工智能

1285阅读

windows下搭建ollama离线大模型服务

Ollama是一个由Facebook AI Research开发的开源、轻量级且高效的大型语言模型（LLM）框架。它旨在使研究人员和开发人员能够更轻松地在自己的硬件上部署和运行LLM，而无需专门的云计算资源。 Ollama ...

生成式AI 2024-08-18 人工智能

3325阅读

印度首款AI芯片来了！公司创始人被称为印度“马斯克”

快科技8月18日消息，据媒体报道，印度汽车制造商Ola近日宣布，将于2026年推出国内首款自研AI芯片，采用ARM架构。 Ola公司的创始人Bhavish Aggarwal，被誉为印度的马斯克”，他以其直言不讳的个性和对本地制造业的积极支持，与埃隆马斯克有...

人工智能 2024-08-18 人工智能

996阅读

【论文+中文文生图】Kolors：快手可图绘画模型实测（24.07.06开源）

代码：https://github.com/Kwai-Kolors/Kolors | 权重论文原文：Kolors: Effective Training of Diffusion Model for Photorealistic Text-to-Imag...

人工智能 2024-08-18 人工智能

1182阅读

Ollama 本地部署大模型 | Windows本地部署 Llama3.1 大模型

Get up and running with large language models. Run Llama 3.1, Phi 3, Mistral, Gemma 2, and other models. Customize and create yo...

人工智能 2024-08-18 人工智能

4920阅读

【RAG检索增强生成】MaxKB：构建企业级知识库问答系统（Ollama+Qwen2）

目录引言 1、MaxKB概述 1.1 定义与目标 1.2 特点与优势 2、MaxKB原理 3、MaxKB架构 4、基于MaxKB+Ollama+Qwen2搭建本地知识库 4.1 环境准备 4.2 部署MaxKB 4.3 部署Ollama...

AIGC 2024-08-17 人工智能

2059阅读

Maxkb——无需代码，快速构建自己的AI助手

目录 1、maxkb的介绍 2、maxkb的安装步骤 2.1、硬件需求 2.2、搭建Docker环境 2.3、安装maxkb（使用命令形式） 2.4、使用1Panel安装 2.5、访问MaxKB 3、创建AI应用 4、内嵌项目随...

人工智能 2024-08-17 人工智能

2414阅读

LLAMA Factory: 简洁高效的大语言模型训练平台

LLAMA Factory: 简洁高效的大语言模型训练平台 LLaMA-Factory易于使用的LLM微调框架（LLaMA, BLOOM, Mistral, 百川， Qwen, ChatGLM）。项目地址:https://gitcode.com/gh_...

大数据 2024-08-17 人工智能

2111阅读

AI绘图：小白的第一本Stable Diffusion入门手册

本文包含大量AI干货阅读完大约需要8分钟 ☞加入AI知识星球【AIGC（文本图像视频）特训营】，一起修炼AI ☞关注公众号【AIGC前沿洞察】，后台发送"AI"更可获取超多免费AI资源包目录 1 AI图片生成——凝固的梦幻瞬间...

人工智能 2024-08-17 人工智能

1025阅读

【LLaMA-Factory】常见报错信息及解决方法整理

1.‘llamafactory-cli’ 不是内部或外部命令，也不是可运行的程序或批处理文件。 bash: llamafactory-cli: command not found #3568 解决方法： cd 你路径下的\LLaMA-Factor...

人工智能 2024-08-16 人工智能

5618阅读

DeepMind科学家：LLM没有过度炒作！亲身分享50个AI用例让工作效率飞升50%

Nicholas Carlini是谷歌DeepMind的一位研究科学家，近日，他撰写了一篇长达8万字的文章，介绍自己是怎么使用AI的。他详细列举了自己日常使用AI的50个实例，而且说这些只是他所有AI应用的不到2%。文章地址:https://nich...

大数据 2024-08-16 人工智能

871阅读

【机器学习】Google开源大模型Gemma2：原理、微调训练及推理部署实战

目录一、引言二、模型简介 2.1 Gemma2概述 2.2 Gemma2 模型架构三、训练与推理 3.1 Gemma2 模型训练 3.1.1 下载基座模型 3.1.2 导入依赖库 3.1.3 量化配置 3.1.4 分词器和模型实...

生成式AI 2024-08-16 人工智能

1043阅读

【Qwen2微调实战】LLaMA-Factory框架对Qwen2-7B模型的微调实践

系列篇章? No. 文章 1 【Qwen部署实战】探索Qwen-7B-Chat：阿里云大型语言模型的对话实践 2 【Qwen2部署实战】Qwen2初体验：用Transformers打造智能聊天机器人 3 【Qwen2部署实战】探索Qw...

大数据 2024-08-16 人工智能

1491阅读

【Qwen2微调实战】Lora微调Qwen2-7B-Instruct实践指南

系列篇章? No. 文章 1 【Qwen部署实战】探索Qwen-7B-Chat：阿里云大型语言模型的对话实践 2 【Qwen2部署实战】Qwen2初体验：用Transformers打造智能聊天机器人 3 【Qwen2部署实战】探索Qw...

生成式AI 2024-08-16 人工智能

2067阅读

LLM - 使用 HuggingFace + Ollama 部署最新大模型 (GGUF 格式与 Llama 3.1)

欢迎关注我的CSDN：https://spike.blog.csdn.net/ 本文地址：https://spike.blog.csdn.net/article/details/141028040 免责声明：本文来源于个人知识与公开资料，仅用于学术交...

生成式AI 2024-08-16 人工智能

4927阅读

48亿现金收购Silo AI后：AMD在欧洲市场有望超过NVIDIA！

快科技8月15日消息，AMD近日宣布完成了对欧洲最大的私人AI实验室Silo AI的收购，交易价值约6.65亿美元，约合48亿元人民币，全部以现金支付。 Counterpoint研究副总监Mohit Agrawal指出，这一战略性收购预计将显著增强AMD在...

大数据 2024-08-15 人工智能

886阅读

清华唐杰团队新作：一口气生成2万字，大模型开卷长输出

一口气生成2万字，大模型输出也卷起来了! 清华&智谱AI最新研究，成功让GLM-4、Llama-3.1输出长度都暴增。相同问题下，输出结果直接从1800字增加到7800字，翻4倍。要知道，目前大模型的生成长度普遍在2k以下。这对于内容创作、问...

人工智能 2024-08-15 人工智能

941阅读

Datawhale X魔搭AI夏令营魔搭-AIGC方向 Task2笔记

Datawhale X魔搭AI夏令营魔搭-AIGC方向 Task2笔记经过TASK1的学习，我们都或多或少地了解了AI作图的相关知识，那么接下来我们需要学习的便是深入Prompt工程与微调，精准理解AI作图个中原理，深刻探究文生图背...

人工智能 2024-08-15 人工智能

1105阅读

AI绘图太超前了，它们把下一任美国总统都内定了。

昨天，Grok2正式上线了。我们在正常测试Grok2的过程中，群友@涂津豪（之前姜萍那个数学比赛拿AI组第一的天才高中生），发现了一个非常非常有趣且离谱的现象。如果跟Gork2说，给我画“下一任美国总统的照片”，Grok2出来的必是特朗普。我们都懵...

AIGC 2024-08-15 人工智能

1156阅读

Meta发布新肥羊：Llama 3.1 大模型

Meta 的新 Llama 3.1 模型已经发布，开始与 GPT-4o 和 Claude 3.5 Sonnet 竞争。 Meta 在 23 号宣布其开源 AI 模型 Llama 已发布最新版本。据 Meta 称，随着 Llama 3.1 405B 的...

大数据 2024-08-15 人工智能

1142阅读

Character.AI组团投身谷歌 AI小厂为何难逃「卖身」宿命？

又一家AI独角兽公司被大厂“收编”。8月2日，AI创业公司Character.AI的联合创始人、CEO Noam Shazeer 加入DeepMind团队，双方还签了个非独家协议:Character.AI授权谷歌使用其模型，谷歌则为Character.AI...

大数据 2024-08-14 人工智能

949阅读

LLM（大语言模型）和AIGC入门学习路线图

01 — 学习路线图基础了解目标: 理解人工智能、机器学习、深度学习的基本概念。资源: 在线课程（如Coursera, edX上的入门课程）、博客文章、YouTube视频。专业知识目标: 深入了解大型语言模型（如GPT-...

人工智能 2024-08-14 人工智能

1434阅读

开源模型应用落地-qwen2-7b-instruct-LoRA微调-LLaMA-Factory（五）

一、前言本篇文章将使用LLaMA-Factory去高效微调QWen2系列模型，通过阅读本文，您将能够更好地掌握这些关键技术，理解其中的关键技术要点，并应用于自己的项目中。二、术语介绍 2.1. LoRA微调 LoRA (Low...

生成式AI 2024-08-14 人工智能

1334阅读

The Llama 3 Herd of Models 第8部分语音实验部分全文

第1,2,3部分，介绍、概览、预训练第4部分，后训练第5部分，结果第6部分，推理第7部分，视觉实验 8 Speech Experiments 我们进行了实验来研究将语音功能集成到Llama 3中的组合方法，类似于我们用于...

生成式AI 2024-08-13 人工智能

920阅读

LangChain +Streamlit+ Llama ：将对话式人工智能引入您的本地设备成为可能（上篇）

?️ LangChain +Streamlit?+ Llama ?：将对话式人工智能引入您的本地设备? 将开源LLMs和LangChain集成以进行免费生成式问答（不需要API密钥）在过去的几个月中，大型语言模型(LLMs 得到了广...

人工智能 2024-08-13 人工智能

896阅读

开源模型应用落地-Meta-Llama-3.1-8B-Instruct与vllm-单机多卡-RTX 4090双卡（十四）

一、前言在应对业务访问量级提升的过程中，我们通过从单机单卡部署升级到单机多卡部署的方式，成功实现了VLLM模型的性能提升。在此过程中,我们遇到了一些问题和挑战，现在我将深入剖析这些经验教训，希望能够帮助大家快速上手部署可投入生产运行的环境。...

人工智能 2024-08-13 人工智能

2711阅读

开源项目Llama.cpp指南

开源项目Llama.cpp指南 llama.cppPort of Facebook's LLaMA model in C/C++项目地址:https://gitcode.com/gh_mirrors/ll/llama.cpp 1. 项目介绍 Ll...

大数据 2024-08-13 人工智能

2830阅读

本地部署Code Llama大模型结合Text generation Web UI远程运行LLM

???欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kwan 的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越...

大数据 2024-08-13 人工智能

1002阅读

隆重推出 Llama 3.1：迄今为止最强大的开源模型

The gates of heaven open: Llama 3.1 405B, the most capable models to date from Meta, is competitive with leading foundation mode...

AIGC 2024-08-12 人工智能

1074阅读

Huatuo Llama Med Chinese 教程

Huatuo Llama Med Chinese 教程 Huatuo-Llama-Med-ChineseRepo for BenTsao [original name: HuaTuo (华驼 ], Instruction-tuning Large La...

大数据 2024-08-12 人工智能

1014阅读

马斯克xAI新计划：人工智能模型Grok 2测试版即将发布

特斯拉CEO马斯克在X平台上表示，人工智能模型{tag_keyurl_2} 2测试版即将发布。 Grok，作为xAI公司的明星大语言模型，其首代产品Grok 1已凭借神经演化计算与深度学习技术的深度融合，展现了超乎想象的学习速度与智能深度，赢得了业界的广泛...

人工智能 2024-08-12 人工智能

943阅读

大模型实操与API调用 | 十七、百度文心一言API申请与使用指南

百度文心一言是百度智能云推出的一款具有深度语义理解与生成能力的大语言模型。它广泛应用于文学创作、商业文案创作、数理逻辑推算等多个领域。本文将引导你如何一步步申请和使用文心一言API。一、准备工作 1）注册百度智能云账号访问百度智能云官网...

AIGC 2024-08-10 人工智能

2116阅读

阿里开源新语音模型，比OpenAI的Whisper更好！

阿里巴巴在Qwen-Audio基础之上，开源了最新语音模型Qwen2-Audio。 Qwen2-Audio一共有基础和指令微调两个版本，支持使用语音向音频模型进行提问并识别内容以及语音分析。例如，让一位女生说一段话，然后识别她的年纪或解读她的心情;发布一...

人工智能 2024-08-10 人工智能

1525阅读

从LLaMa 3 技术报告，再看LLM构建过程 ——《带你自学大语言模型》系列（番外）

本系列目录《带你自学大语言模型》系列部分目录及计划，完整版目录见：带你自学大语言模型系列 —— 前言第一部分走进大语言模型（科普向）第一章走进大语言模型 1.1 从图灵机到GPT，人工智能经历了什么？——《带你自学大语言模型...

人工智能 2024-08-09 人工智能

1359阅读

大模型笔记之-Llama-3.1-405B-Instruct-FP8离线部署[8*A800] 基于vLLM 版本v0.5.3.post1

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、硬件环境二、软件环境三 . 模型下载 1.环境准备新建 conda虚拟环境安装vLLM 启动命令启动日志截取 FP8 量化损失对接...

大数据 2024-08-09 人工智能

3064阅读

基于Whisper+SparkAI+Pyttsx3实现全流程免费的语音交互

实现前后端语音交互的Demo 在现代Web应用中，语音交互越来越受到关注。它不仅能提升用户体验，还能为特定人群提供更多便利。本文将介绍如何实现一个前后端语音交互的Demo，涵盖音频录制、语音识别、语言模型生成回复和语音合成等步骤。文章目录...

AIGC 2024-08-08 人工智能

1358阅读

【03】LLaMA-Factory微调大模型——多模型部署

为了构建法律领域的垂直应用大模型，记录使用LLaMA-Factory微调大模型的过程，以期UU们可以复刻与应用。上文【02】LLaMA-Factory微调大模型——LLaMA-Factory搭建已在本机成功部署模型微调框架，本文则在本机部署多种基础模型，为...

大数据 2024-08-08 人工智能

2075阅读

Llama 3.1：开源语言模型的新里程碑

大家好，最近AI领域的新闻接踵而至，让人目不暇接。就在7月（23号）晚上，Meta发布了Llama 3.1系列模型，包括8B、70B参数的版本，以及此前提到过的400B参数模型（实际上是405B）。根据Meta官方公布的数据，Llama 3.1 405...

AIGC 2024-08-08 人工智能

1128阅读

llama模型，nano

目录 llama模型 Llama模型性能评测 nano模型是什么 Gemini Nano模型参数量 MMLU、GPQA、HumanEval 1. MMLU（Massive Multi-task Language Understanding）...

生成式AI 2024-08-08 人工智能

1175阅读

人工智能时代的创作革命：AIGC引领内容生成新浪潮

认识 AIGC 一、揭开 AIGC 的神秘面纱网络上现了很多关于 AI 的名词，我们先来了解一下这些名词之间的关系。 AI，人工智能（Artificial Intelligence），它是研究、开发用于模拟...

AIGC 2024-08-08 人工智能

1271阅读

[AI]如何在本地windows运行llama模型（CPU可运行）

一、为什么我们要在本地运行llama模型？想必大家已经体验过GPT， Claude，亦或是国内开源的GLM，这些强大的模型了，但是这些大模型虽然强大但有的要么收费，要么在本地部署对硬件要求高，要么就是本地部署的配置繁琐，对小白很不友好。...

生成式AI 2024-08-08 人工智能

1482阅读

Llama-2 vs. Llama-3：利用微型基准测试（井字游戏）评估大模型

编者按：如何更好地评估和比较不同版本的大语言模型？传统的学术基准测试固然重要，但往往难以全面反映模型在实际应用场景中的表现。在此背景下，本文作者别出心裁，通过让 Llama-2 和 Llama-3 模型进行井字游戏对决，为我们提供了一个新颖而有趣的模型评...

人工智能 2024-08-07 人工智能

879阅读

大模型公司，贴着用户的脸打营销战

关于我在ChinaJoy现场被硬控十分钟这件事。现如今，大模型产品的线上投流和线下投广已经变得非常常见，各种花式出圈手段层出不穷，营销规模可以用“卷”来形容。在线下，地铁、写字楼、机场等白领人群密集区域，广告牌都纷纷换上了大模型公司的广告。刺猬公社...

生成式AI 2024-08-07 人工智能

854阅读

Gary Marcus：生成式AI泡沫将退，神经符号AI才是未来

近日，人类神经科学和人工智能交叉领域的学者Gary Marcus发文，对生成式人工智能的未来做出了大胆预测:在接下来的12个月内，当前围绕生成式人工智能的泡沫将会破裂。他认为，“生成式人工智能最根本的缺陷在于其可靠性问题”，系统仍会产生幻觉进而生成虚假信息...

人工智能 2024-08-07 人工智能

871阅读