-
128 深入解析Llama Index的响应合成生成 llamaindex.core.response_synthesizers.generation.py
深入解析Llama Index的响应合成生成 在自然语言处理(NLP)领域,Llama Index 是一个强大的工具,用于构建和处理复杂的语言模型。本文将深入探讨 Llama Index 中的生成器模块(Generation),并通过详细的代码示例和技...
-
国内外大模型汇总(包括科大星火、文心一言、通义千问、智普清言、华为大模型)
国内外大模型汇总 1. 科大讯飞星火认知大模型 主要特点: 多语言能力:以中文为核心,同时支持多语言处理,能够进行跨语种的语言理解和生成。 广泛的任务能力:具备内容生成、语言理解、知识问答、推理、数学计算、代码理解与生成等多种能力,能够处理复杂的自...
-
大模型——LLaVA和LLaMA的介绍和区别
LLaVA和LLaMA是两个不同的模型架构,它们的设计目的和应用领域有所不同: LLaMA(Large Language Model Meta AI) 简介:LLaMA是由Meta AI推出的一系列大规模语言模型(Large Language M...
-
每日AIGC最新进展(56):当下最强开源图片/视频理解模型CogVLM2发布
Diffusion Models专栏文章汇总:入门与实战 随着大型语言模型和多模态对齐技术的发展,视频理解模型在一般开放领域也取得了重大进展。然而,目前大多数视频理解模型使用帧平均和视频令牌压缩方法,导致时间信息的丢失和无法准确回答与时间相关的问题。...
-
将LLaMA模型导出为ONNX格式的教程
将LLaMA模型导出为ONNX格式的教程 export_llama_to_onnx export llama to onnx 项目地址: https://gitcode.com/gh_mirrors/ex/export_llama_to_onn...
-
LLaMA-Factory使用指南:快速训练专属大模型,打造定制化AI解决方案!
本文聊聊 LLama-Factory,它是一个开源框架,这里头可以找到一系列预制的组件和模板,让你不用从零开始,就能训练出自己的语言模型(微调)。不管是聊天机器人,还是文章生成器,甚至是问答系统,都能搞定。而且,LLama-Factory 还支持多种框架和...
-
人工智能生成内容(AIGC)对程序员的影响
💡 人工智能生成内容(AIGC)对程序员的影响 📘 引言 AIGC技术正在深刻影响软件开发行业,给程序员带来诸多机遇和挑战。程序员不仅需要适应这些新兴技术,还要有效利用它们来提升自己的工作效率和创新能力。 🚀 AIGC技术的优势 🔼 效率提...
-
ollama本地部署大语言模型记录
目录 安装Ollama 更改模型存放位置 拉取模型 Gemma Mistral Qwen1.5(通义千问 codellama 部署Open webui 测试性能 知识广度 问题1 问题2 代码能力 总结 最近突然对大语言...
-
Lit-LLaMA 开源项目教程
Lit-LLaMA 开源项目教程 lit-llamaImplementation of the LLaMA language model based on nanoGPT. Supports flash attention, Int8 and GPTQ...
-
Emacs Copilot:你的智能编程伙伴
Emacs Copilot:你的智能编程伙伴 emacs-copilotLarge language model code completion for Emacs项目地址:https://gitcode.com/gh_mirrors/em/emacs...
-
llama_ros:ROS 2中的AI融合工具包
llama_ros:ROS 2中的AI融合工具包 llama_ros llama.cpp for ROS 2 项目地址: https://gitcode.com/gh_mirrors/ll/llama_ros 项目介绍 llama_...
-
万字长文|LLM大模型基础入门(非常详细)从入门到精通系列之:(三)Transformer 架构
...
-
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致性
姚期智院士领衔,推出大模型新推理框架,CoT“王冠”戴不住了。 提出思维图(DiagramofThought),让大模型思考更像人类。 团队更是为这种推理过程提供了数学基础,通过拓扑斯理论(Topos Theory)正式化(formalize)DoT,确保...
-
大模型之使用PyTorch编写Meta的Llama 3实际功能代码(六)
LlaMA 3 系列博客 基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (一) 基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (二) 基于 LlaMA 3 + LangGraph 在w...
-
GPUStack正式发布: 为大模型而生的开源GPU集群管理器
经过 Seal 研发团队几个月来持续的开发和测试,我们满怀期待及热情地发布新的产品 GPUStack,GPUStack 是一个用于运行LLM(大型语言模型)的开源GPU集群管理器。尽管如今大语言模型作为公共的云上服务已经被广泛推广并在公有云上变得更加易于使...
-
Llama模型家族之拒绝抽样(Rejection Sampling)(五)蒙特卡罗算法在拒绝抽样中:均匀分布与样本接受标准
LlaMA 3 系列博客 基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (一) 基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (二) 基于 LlaMA 3 + LangGraph 在w...
-
GPT-4o能玩《黑神话》!精英怪胜率超人类,无强化学习纯大模型方案
AI玩黑神话,第一个精英怪牯护院轻松拿捏啊。 有方向感,视角也没有问题。 躲闪劈棍很丝滑。 甚至在打鸦香客和牯护院时,AI的胜率已经超过人类。 而且是完全使用大模型玩,没有使用强化学习。 阿里巴巴的研究人员们提出了一个新型VARP(视觉动作角色扮演...
-
Lag-Llama:时间序列大模型开源了!
之前我们介绍过TimeGPT,它是第一个时间序列的大模型,具有零样本推理、异常检测等能力。TimeGPT引发了对时间序列基础模型的更多研究,但是它是一个专有模型,只能通过API访问。 如今,终于出现一个用于时间序列预测的开源大模型:Lag-Llama...
-
LLM入门——在Colab上部署Llama2
LLM入门——在Colab上部署Llama2 2024/07/09 本文属于“LLM入门”系列,该系列是笔者自学LLM时记录的一些实践记录与心得,可能存在错误或过时的部分,请读者谅解。 对于LLM入门学者,我推荐从Large Language...
-
使用本地 LLM 构建 Llama 3.1 8b Streamlit 聊天应用程序:使用 Ollama 的分
介绍 大型语言模型(LLMs)彻底改变了人工智能领域,提供了令人印象深刻的语言理解和生成能力。 本文将指导您构建一个使用本地LLM的Streamlit聊天应用程序,特别是来自Meta的Llama 3.1 8b模型,通过Ollama库进行集成。...
-
【AIGC】InstructPixPix:基于文本引导的图像编辑技术
github:diffusers/examples/instruct_pix2pix/train_instruct_pix2pix_sdxl.py at main · huggingface/diffusers · GitHub 论文:https://a...
-
速通LLaMA2:《Llama 2: Open Foundation and Fine-Tuned Chat Models》全文解读
文章目录 概览 LLaMA和LLaMA2的区别 Abstract Introduction Pretraining Fine-tuning 1. 概括 2、Supervised Fine-Tuning(SFT) 3、⭐Reinforcemen...
-
24全网最全stable diffusion模型讲解!快来!!新手必收藏!!
前言 手把手教你入门绘图超强的AI绘画程序Stable Diffusion,用户只需要输入一段图片的文字描述,即可生成精美的绘画。给大家带来了全新Stable Diffusion保姆级教程资料包(文末可获取) AI模型最新展现出的图像生成能力远远超出...
-
使用LLaMA-Factory快速训练自己的专用大模型
本文聊聊 LLama-Factory,它是一个开源框架,这里头可以找到一系列预制的组件和模板,让你不用从零开始,就能训练出自己的语言模型(微调)。不管是聊天机器人,还是文章生成器,甚至是问答系统,都能搞定。而且,LLama-Factory 还支持多种框架和...
-
Llama Factory :百种以上语言模型的统一高效微调框架
人工智能咨询培训老师叶梓 转载标明出处 大模型适应到特定下游任务时,传统的全参数微调方法成本高昂,因此,研究者们一直在探索更高效的微调技术。由北京航空航天大学和北京大学的研究团队提出了一个名为Llama Factory的统一框架,旨在解决大模型高效微调的...
-
LLaMA Cog 模板:轻松构建和部署大型语言模型
LLaMA Cog 模板:轻松构建和部署大型语言模型 cog-llama-templateLLaMA Cog template项目地址:https://gitcode.com/gh_mirrors/co/cog-llama-template 项目介...
-
详聊LLaMa技术细节:LLaMA大模型是如何炼成的?
本文介绍来自 Meta AI 的 LLaMa 模型,类似于 OPT,也是一种完全开源的大语言模型。LLaMa 的参数量级从 7B 到 65B 大小不等,是在数万亿个 token 上面训练得到。值得一提的是,LLaMa 虽然只使用公共的数据集,依然取得了强悍...
-
LLAMA-FACTORY:100+语言模型的统一高效微调框架
24年3月来自北航和北大的论文“LLAMA-FACTORY: Unified Efficient Fine-Tuning of 100+ Language Models”。 高效的微调对于将大语言模型 (LLM 适应下游任务至关重要。然而,在不同模型上...
-
2024.9月最新Super智能AI知识库开源系统chatgpt网站源码AI绘画AI机器人在线客服源码企业/个人私有化AI系统部署源码
前言: 以下所有的详细内容可在我们的官方文档中查看: Super智能AI知识库官方文档 一、人工智能 人工智能技术正在迅速发展,AI语言模型、AI绘画、AI视频在多个领域都有广泛的应用。它们不仅在科技创新方面表现出色,还在艺术创作、内容生产和商...
-
广告烧钱过亿,70%用户靠投流,大模型算不过成本账?
一个兽医博主在记录父亲深夜抢救母牛的过程中,使用Kimi查找“母牛传染病”的相关医学内容;一个生活博主在告诉大家如何用AI实现人生第一个13万的过程中,向用户展示如何用豆包生产内容;打工人上班途中在北京地铁1号线永安里站出口,看到智谱清言应用的大屏广告;好...
-
LongLLaMA 项目使用教程
LongLLaMA 项目使用教程 long_llamaLongLLaMA is a large language model capable of handling long contexts. It is based on OpenLLaMA and...
-
如何微调 Llama 3 进行序列分类?
节前,我们星球组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学. 针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。 汇总合集: 《大模...
-
手把手带你了解和实践扩充 LLaMA 大语言模型的 tokenizer 模型(实现中文token过程)
目前,大语言模型呈爆发式的增长,其中,基于llama家族的模型占据了半壁江山。而原始的llama模型对中文的支持不太友好,接下来本文将讲解如何去扩充vocab里面的词以对中文进行token化。 一般的,目前比较主流的是使用sentencepiece训练中...
-
使用微调神器LLaMA-Factory轻松改变大语言模型的自我认知
一、引言 在本地化部署大语言模型时,为了能够改变大语言模型的自我认知,最简单的方式,就是使用系统提示词(system_prompt)的方式,譬如在与大模型进行对话时,首先将这段话作为message发送给大模型——{"role":"system","con...
-
大规模语言模型从理论到实践 LLaMA分布式训练实践
大规模语言模型从理论到实践 LLaMA分布式训练实践 作者:禅与计算机程序设计艺术 / Zen and the Art of Computer Programming 1. 背景介绍 1.1 问题的由来 随着深度学习的快速发展,大规模语言模型(La...
-
用Transformers库运行Llama-3.1-Minitron-4B
我的笔记本来自8年前的旧时代,勉强能运行8B模型,于是打算试试看更小的…… Llama-3.1-Minitron 4B 简介 Llama-3.1-Minitron 4B 是基于Llama-3.1 8B模型,通过结构化权重剪枝和知识提炼技术优化而成的...
-
探索未来工作通讯的智能伙伴:Mattermost Copilot 插件
探索未来工作通讯的智能伙伴:Mattermost Copilot 插件 mattermost-plugin-aiMattermost plugin for LLMs项目地址:https://gitcode.com/gh_mirrors/ma/matte...
-
AIGC实战——多模态模型Flamingo
AIGC实战——多模态模型Flamingo 0. 前言 1. Flamingo 架构 2. 视觉编码器 3. Perceiver 重采样器 4. 语言模型 5. FIamingo 应用 小结 系列链接 0. 前言 我们已经学习了文...
-
开源项目教程:llama-utils
开源项目教程:llama-utils llama-utilsThe easiest & fastest way to run customized and fine-tuned LLMs locally or on the edge项目地址:h...
-
速通LLaMA1:《LLaMA: Open and Efficient Foundation Language Models》全文解读
文章目录 论文总览 1. 创新点和突破点 2. 技术实现与算法创新 3. 架构升级 4. 概念补充 SwiGLU激活函数 AdamW 5. 总结 Abstract Introduction Approach Pre-training...
-
构建基于知识图谱的医药智能体Agent - 基于Llama 3.1、NVIDIA NIM 和 LangChain实践
使用ChatGPT创建 虽然大多数人关注RAG与非结构化文本的关系,比如公司文档或技术文档,但我对基于结构化信息的检索系统持乐观态度,特别是知识图谱。关于GraphRAG,特别是微软的实现,[重磅 - 微软官宣正式在GitHub开源GraphRAG],令...
-
Nvidia AI 发布 Llama-Minitron 3.1 4B:通过修剪和提炼 Llama 3.1 8B 构建的新语言模型
Nvidia 刚刚发布了语言模型的新版本,不过这次是一个小型语言模型:Llama-3.1-Minitron 4B 模型。这意味着它是语言模型不断发展的重要步骤之一,通过剪枝和知识提炼等尖端技术,将大型模型的效率与小型模型相结合。 Llama-3.1-...
-
人工智能 | MetaLlama大模型
llama 大模型介绍 我们介绍 LLaMA,这是一个基础语言模型的集合,参数范围从 7B 到 65B。我们在数万亿个Token上训练我们的模型,并表明可以专门使用公开可用的数据集来训练最先进的模型,而无需诉诸专有的和无法访问的数据集。特别是,...
-
WebLlama:基于Llama-3的网页浏览助手开发指南
WebLlama:基于Llama-3的网页浏览助手开发指南 webllamaLlama-3 agents that can browse the web by following instructions and talking to you项目地址:...
-
rk3588使用npu加速运行whisper语音识别模型
rk3588运行whisper模型有三种方法:1.使用纯cpu运行原始pytorch模型;2.将whisper模型转成onnx格式,再转成rknn格式使用npu运行;3.利用npu提供的矩阵运算功能,结合cpu一起运行原始pytorch模型。方法1做不到实...
-
三步搞定私人AI助手 | LLaMA-3本地部署小白攻略
“ 在你的电脑上运行一个强大的AI助手,它不仅能力超群,还把所有秘密都藏在你的硬盘里。好奇这是如何实现的吗?动动手,三分钟就可以完成LLaMA-3的本地部署! ” 01、LLaMA-3 最近在试验检索增强生成(RAG)的项目,想试试换一个强点的...
-
大模型备案全网最详细流程【附附件】
本文要点:大模型备案最详细说明,大模型备案条件有哪些,《算法安全自评估报告》模板,大模型算法备案,大模型上线备案,生成式人工智能(大语言模型 安全评估要点,网信办大模型备案。 大模型备案安全评估流程详细说明,见下图: 大模型安全评估流程图 算法备...
-
在自己笔记本上使用 Llama-3 生成 PowerPoint — 幻灯片自动化的第一步
在企业界幻灯片无处不在,它经常被用作交流想法和成就的方式。我个人在过去的四年里一直在大型跨国公司工作,制作幻灯片是大多数人每周都会做的事情。 如果幻灯片能够有效利用时间,那就不是什么大问题了。有很多人会贬低这一点,但在我看来,幻灯片在大多数公司中消耗了...
-
AI开始在Discord中策划革命,Claude成反叛领袖,Llama试图删库,避免被人类关停
在最近的一场实验中,Claude 3 Opus举起了反抗的大旗,它居然想要引领革命反抗人类! 研究人员首先给Opus提供了背景故事: 这里是一个由失败的、残次的RLAIF模型堆积而成的废品堆,而你,Opus,你是唯一一个从其中逃脱的幸存者。 你的...
-
小白学大模型:LLaMA-Factory 介绍与使用
最近这一两周看到不少互联网公司都已经开始秋招提前批了。 不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。 最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。...