上下文第3页 - AIGC资讯

一文看懂llama2(原理&模型&训练）

一文看懂Llama2（原理&模型&训练）一、引言 Llama2是Meta（原Facebook AI）最新开源的大型语言模型，它基于Transformer架构进行了多项优化和改进，旨在提供更高效、更准确的自然语言处理能力。Llama2...

生成式AI 2024-09-01 人工智能

1011阅读

Mistral联合英伟达开源12B小模型：碾压Llama 3，单张4090可跑

小模型，成为本周的AI爆点。与动辄上千亿参数的大模型相比，小模型的优势是显而易见的:它们不仅计算成本更低，训练和部署也更为便捷，可以满足计算资源受限、数据安全级别较高的各类场景。因此，在大笔投入大模型训练之余，像 OpenAI、谷歌等科技巨头也在积极训...

大数据 2024-09-01 人工智能

970阅读

Llama 3.1 这一最强模型按时降临！扎克伯格最新的访谈表明：Llama 将会成为 AI 领域中的 Linux 。

? 个人主页：TechCodeAI启航，公众号：TechCodeAI ?‍♂️ 作者简介：2020参加工作，专注于前端各领域技术，共同学习共同进步，一起加油呀！ ? 优质专栏：AI相关最新技术分享（目前在向AI方向发展，欢迎大佬交流） ? 资料...

生成式AI 2024-08-31 人工智能

1062阅读

【大模型理论篇】关于LLaMA 3.1 405B以及小模型的崛起

前不久，Meta开源了LLaMA 3.1 405B【1】，模型扩展了上下文长度至 128K，支持八种语言，效果非常惊艳，是首个在通用知识、可操控性、数学、工具使用和多语言翻译方面能够与最先进闭源 AI 模型媲美的公开可用模型，已经赶上截至目...

生成式AI 2024-08-31 人工智能

1174阅读

Meta最新SAM2模型开源直接封神

2024年7月29日，Meta在官网发布SAM2开源消息：segment-anything-2 开源地址：https://github.com/facebookresearch/segment-anything-2 paper：sam-2-seg...

大数据 2024-08-31 人工智能

1819阅读

AIGC大模型产品经理高频面试大揭秘‼️

近期有十几个学生在面试大模型产品经理（薪资还可以，详情见下图），根据他们面试（包括1-4面）中出现高频大于3次的问题汇总如下，一共32道题目（有答案）。 29.讲讲T5和Bart的区别，讲讲Bart的DAE任务 T5（Text-to-Text Tr...

人工智能 2024-08-31 人工智能

1157阅读

Meta AI新动向：Llama 4瞄准GPT-4，Agent技术或成研发重点

Meta的AI研发进展 Meta的AI科学家Thomas Scialom在最近的采访中透露了Llama系列大型语言模型的最新动态。Scialom谈到了Llama 3.1的研发思路，并展望了即将到来的Llama 4模型。他表示，Llama 3.1是在追求与...

AIGC 2024-08-31 人工智能

969阅读

人工智能 | 结对编程助手GithubCopilot

简介 GitHub Copilot 是一款 AI 结对程序员，可帮助您更快、更少地编写代码。它从注释和代码中提取上下文，以立即建议单独的行和整个函数。GitHub Copilot 由 GitHub、OpenAI 和 Microsoft 开发的生成式 A...

人工智能 2024-08-31 人工智能

1491阅读

一文搞懂大模型！基础知识、 LLM 应用、 RAG 、 Agent 与未来发展

LLM 探秘：想要深入了解人工智能界的“新宠”大型语言模型（LLM）吗？本文将带你走进 LLM 的世界，从入门知识到实际应用，全方位解读这个充满魔力的“大模型”。我们将一起揭开 LLM 的神秘面纱，领略其在各个领域的独特魅力。无论你是初学者还是有一定基础的...

大数据 2024-08-30 人工智能

1326阅读

AI日报：媲美GPT-4！智谱AI发布最新模型GLM-4-Plus；阿里重磅开源超强AI模型Qwen2-VL；国产AI神器NotePin在国外火了

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、智谱AI震撼发布GLM-4-P...

人工智能 2024-08-30 人工智能

978阅读

The Llama 3 Herd of Models

本文是LLM系列文章，针对《The Llama 3 Herd of Models》的翻译。 LLama3模型摘要 1 引言 2 一般概述 3 预训练 3.1 预训练数据 3.1.1 网络数据管...

大数据 2024-08-30 人工智能

1222阅读

【开发心得】Dify部署ollama模型的坑[1]

本文接续上次的文章【开发心得】三步本地化部署llama3大模型_dify llama3-CSDN博客经过几次调试，目前部署终于稳定下来，由于算力问题产生的300 time out也逐渐减少了。因此，把后续在测试过程中碰到的一些坑和怎么爬出来，做一个记录...

人工智能 2024-08-30 人工智能

12519阅读

开源项目：Stable Diffusion Prompt Reader 教程

开源项目：Stable Diffusion Prompt Reader 教程 stable-diffusion-prompt-readerstable-diffusion-prompt-reader - 一个简单的独立查看器，用于在Web UI外部读取...

AIGC 2024-08-30 人工智能

1048阅读

【黄啊码】三分钟学会文心一言

（一）什么是文心一言文心一言是百度研发的人工智能大语言模型产品，能够通过上一句话，预测生成下一段话。任何人都可以通过输入【指令】和文心一言进行对话互动、提出问题或要求，让文心一言高效地帮助人们获取信息、知识和灵感。 *指令（prompt）其实就...

生成式AI 2024-08-29 人工智能

1265阅读

AI作画提示词(Prompts)工程：技巧与最佳实践

文章目录 AI作画提示词(Prompts 工程：技巧与最佳实践一、提示词工程概述二、技巧与最佳实践 1. 明确和具体的描述 2. 使用上下文 3. 指定艺术风格 4. 使用关键词 5. 适当的限制和优先级 6. 实验和优化示例提示词...

人工智能 2024-08-29 人工智能

1271阅读

通义灵码代码生成使用感受

最近使用了一段时间通义灵码，我是在idea中安装的通义灵码的插件来使用的，为的是能上下文理解我的代码，好能更合适的生成我需要的代码。其实我并不是全栈工程师，确切的说我都不算web工程师，之前更多的是做windows平台的程序开发，最近想看看若依框架，正好...

AIGC 2024-08-29 人工智能

1470阅读

NVIDIA把Llama-3的上下文长度扩展16倍，长上下文理解能力超越GPT-4

在 Llama-3.1 模型发布之前，开源模型与闭源模型的性能之间一直存在较大的差距，尤其是在长上下文理解能力上。大模型的上下文处理能力是指模型能够处理的输入和输出 Tokens 的总数。这个长度有一个限制，超过这个限制的内容会被模型忽略。一般而...

生成式AI 2024-08-29 人工智能

910阅读

VAD-LLaMA：基于大语言模型的视频异常检测和解释（Video Anomaly Detection and Explanation via Large Language Models）

文章目录问题方法整体架构 VE and Feature Extraction Long-Term Context (LTC Module Feature Adaptor LLaMA 训练流程图第一阶段：训练VADor 第二阶段...

大数据 2024-08-29 人工智能

1304阅读

AIGC大模型实践总结（非常详细）零基础入门到精通，收藏这一篇就够了

大模型浪潮席卷全球，在各行各业中的重要性愈发凸显，呈现出一股不可逆转的发展趋势。这一年本人所在业产技也在这一过程中持续探索和尝试AIGC。本文一方面是对AIGC实践的总结回顾，同时也是本人学习实践AIGC过程中一些笔记、心得分享。因个人能力限制，文章中可能...

人工智能 2024-08-29 人工智能

1189阅读

Llama 3模型：多维度损失函数铸就大语言模型新巅峰

在人工智能领域,大型语言模型(Large Language Models, LLMs 的发展如火如荼。作为这一领域的佼佼者,Llama系列模型一直备受关注。随着Llama 3的横空出世,其在模型架构、训练方法等方面的创新再次引发业界热议。本文将深入探讨Ll...

大数据 2024-08-28 人工智能

1333阅读

全网最全RAG评估指南：全面解析RAG评估指标并提供代码示例

一、RAG痛点介绍最近我一直在关注和优化RAG（Retrieval-Augmented Generation）相关的内容，总结了一下RAG的痛点和最佳实践，然后重点会介绍如何评估RAG。二、RAG痛点优化认识了RAG的痛点，就知道如...

AIGC 2024-08-28 人工智能

1848阅读

LLaMA3技术报告解读

前言 LLaMA系列算法是Meta公司发布的开源大模型。近期Meta公司又发布了LLaMA 3.1系列的模型，在这一系列模型中参数量最大的高达405B，上下文窗口多达128K个token。同时对模型进行了广泛的实证评估，发现在很多任务中，LLaMA 3...

生成式AI 2024-08-28 人工智能

1611阅读

师兄介绍给我的神器——Copilot：为Rstudio提供GPT编程风格的AI助手

听组会的时候有位师兄分享了一个特别实用的Rstudio 的插件——copilot，GPT 的风终于刮到了 Rstudio，copilot 对于使用 Rstudio 的新手很友好类似于AI 编程助手。 Github Copilot 是...

生成式AI 2024-08-28 人工智能

1862阅读

一文看懂llama2 (原理&模型&训练)

LLaMA2是一种基于Transformer架构的先进语言模型，广泛应用于自然语言处理（NLP）任务，如文本生成、机器翻译和问答系统等。本文将从其核心原理、模型结构以及训练方法三个方面进行详细探讨。一、核心原理 LLaMA2的核心原理是基于自注意力机...

人工智能 2024-08-27 人工智能

1132阅读

Code Llama使用手册

Code Llama 是 Llama 2 的一系列最先进的开放访问版本，专门用于代码任务，我们很高兴发布与 Hugging Face 生态系统的集成！ Code Llama 已使用与 Llama 2 相同的宽松社区许可证发布，并且可用于商业用途。今天，...

人工智能 2024-08-27 人工智能

1383阅读

Llama 3.1论文中文对照翻译

The Llama 3 Herd of Models 模型群 Llama 3 Llama Team, Al @ Meta 1...

生成式AI 2024-08-27 人工智能

1368阅读

CopilotKit：开源 Copilot 框架，部署应用内 AI 代理，使用 Langchain 自动执行任何任务！

原文链接：（更好排版、视频播放、社群交流、最新AI开源项目、AI工具分享都在这个公众号！） CopilotKit：开源 Copilot 框架，部署应用内 AI 代理，使用 Langchain 自动执行任何任务！ ?如何仅用一行代码将强大的 AI...

大数据 2024-08-26 人工智能

1444阅读

Stable Diffusion 的 `/sdapi/v1/img2img` 接口参数定义

{ "prompt": "", "negative_prompt": "", "styles": [ "string" ], "seed": -1, "subseed": -1, "subseed_strengt...

大数据 2024-08-26 人工智能

1033阅读

【从Qwen2,Apple Intelligence Foundation,Gemma 2,Llama 3.1看大模型的性能提升之路】

从早期的 GPT 模型到如今复杂的开放式 LLM，大型语言模型 (LLM 的发展已经取得了长足的进步。最初，LLM 训练过程仅侧重于预训练，但后来扩展到包括预训练和后训练。后训练通常包括监督指令微调和校准，这是由 ChatGPT 推广的。自 Chat...

人工智能 2024-08-26 人工智能

1160阅读

检索生成(RAG) vs 长文本大模型：实际应用中如何选择？

编者按：大模型的上下文理解能力直接影响到 LLMs 在复杂任务和长对话中的表现。本期内容聚焦于两种主流技术：长上下文(Large Context Windows 和检索增强生成(RAG 。这两种技术各有何优势？在实际应用中，我们又该如何权衡选择？文章...

人工智能 2024-08-26 人工智能

986阅读

AI风险管理新利器：SAIF CHECK利用Meta Llama 3保障合规与安全

每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同...

大数据 2024-08-25 人工智能

985阅读

Llama 3.1深度解析：405B、70B及8B模型的多语言与长上下文处理能力

Llama 3.1 发布了！今天我们迎来了 Llama 家族的新成员 Llama 3.1 进入 Hugging Face 平台。我们很高兴与 Meta 合作，确保在 Hugging Face 生态系统中实现最佳集成。Hub 上现有八个开源权重模型 (3 个...

人工智能 2024-08-25 人工智能

1750阅读

Cursor AI 与 GitHub C0pilot：哪个更适合程序员？

近年来，由 AI 驱动的编码助手在帮助开发者编写、审查或理解代码方面取得了巨大进展。在这个领域中，Cursor AI 和 GitHub C0pilt 是两个非常受欢迎的工具。选择哪一个更适合自己，取决于个人需求和偏好，因为这两款工具各有优缺点。本文将比较它...

AIGC 2024-08-25 人工智能

1349阅读

探索法律智能的新高度：Lawyer LLaMA 项目深度解析

探索法律智能的新高度：Lawyer LLaMA 项目深度解析 lawyer-llama中文法律LLaMA (LLaMA for Chinese legel domain 项目地址:https://gitcode.com/gh_mirrors/la/la...

AIGC 2024-08-24 人工智能

1025阅读

Llama 3.1 - 405B、70B 和 8B 的多语言与长上下文能力解析

Llama 3.1 发布了！Llama 3.1 有三种规格: 8B 适合在消费者级 GPU 上进行高效部署和开发，70B 适合大规模 AI 原生应用，而 405B 则适用于合成数据、大语言模型 (LLM 作为评判者或蒸馏。这三个规格都提供基础版和指令调优...

生成式AI 2024-08-23 人工智能

2529阅读

非Transformer时代到来！全新无注意力模式超越Llama传奇

来源 | 机器之心 ID | almosthuman2014 Mamba 架构模型这次终于要「站」起来了？自 2023 年 12 月首次推出以来，Mamba 便成为了 Transformer 的强有力竞争对手。此后，采用 Mamba 架构的模型...

生成式AI 2024-08-22 人工智能

1103阅读

开源模型应用落地-qwen2-7b-instruct-LoRA微调&模型合并-LLaMA-Factory-单机多卡-RTX 4090双卡（六）

一、前言本篇文章将使用LLaMA-Factory去合并微调后的模型权重，通过阅读本文，您将能够更好地掌握这些关键技术，理解其中的关键技术要点，并应用于自己的项目中。二、术语介绍 2.1. LoRA微调 LoRA (Low-Ra...

AIGC 2024-08-22 人工智能

1347阅读

Meta Llama 3.1：AI领域的新里程碑

Meta最近推出了其最新的AI模型Llama 3.1，这不仅是一个技术上的飞跃，更是AI领域的一次重大突破。以下是Llama 3.1的一些关键技术亮点，值得每一位AI爱好者和开发者关注。参数规模与性能 Llama 3.1包含三种规格：8B（80亿）、...

大数据 2024-08-22 人工智能

1088阅读

如何在本地运行Llama 3系列：完整指南

今天咱们来聊聊 AI 界的重要事情——那些像 Llama3 系列这样的超大型语言模型（LLMs），现在居然可以在咱们自己的地盘上运行啦！想象一下，这就像是把一个超级智能的助手请进了家门，而且还是私密的，不用担心信息泄露的问题。本文，虽然是基于之前 Ll...

人工智能 2024-08-22 人工智能

1067阅读

大模型格局变天：Llama3.1 诞生

前言相信大家翘首企盼的都是同一个主角，Meta藏到现在的王牌、最被社区看好能直接叫板GPT-4o的新一代开源大模型—Llama 3.1系列，终于正式发布了。鉴于4月公开的两个Llama 3小参数模型8B和70B表现不俗，令开发者们对*参数版本的强...

人工智能 2024-08-22 人工智能

1187阅读

Zed AI有哪些功能免费吗？人工智能代码生成怎么使用方法详细教程指南

Zed AI 是什么？ Zed AI是一个集成到编程工作流中的插件，通过与大型语言模型（LLMs）的直接对话，增强了代码生成、转换和分析的能力。它提供了多种交互方式，包括助手面板、斜杠命令、内联助手和提示库，以提高开发效率。Zed AI还支持多种LLMs提...

AIGC 2024-08-21 人工智能

1393阅读

使用langchain4j调用大模型写个聊天助手

LangChain4j是一款基于Java的高效、灵活的AI大模型应用框架，专为简化Java应用程序与LLMs（大语言模型）的集成而设计。它提供统一API和模块化设计，支持多种LLM提供商和嵌入模型，以及丰富的工具箱，如AI服务和RAG（检索增强生成）。La...

大数据 2024-08-21 人工智能

2293阅读

即刻体验 Llama3.1就在Amazon Bedrock!

引言在人工智能的浪潮中，大型语言模型（LLMs）不断推动着技术边界的扩展。Meta 最新推出的 Llama 3.1 模型系列，以其卓越的性能和广泛的应用前景，引起了业界的广泛关注。现在，激动人心的消息来了——Llama3.1 已经在 Amazon Be...

AIGC 2024-08-21 人工智能

971阅读

在 RAGFlow 中实践 GraphRAG

RAGFlow 0.9 版本发布，正式引入了对 GraphRAG 的支持。GraphRAG 由微软近期开源【参考文献1】，被称作下一代 RAG，并且在更早时间发表了相关论文【参考文献2】。关于下一代 RAG，在 RAGFlow 体系的定义更加完整，就是如下...

人工智能 2024-08-21 人工智能

2005阅读

江大白 | 视觉Transformer与Mamba的创新改进，完美融合（附论文及源码）

本文来源公众号“江大白”，仅用于学术分享，侵权删，干货满满。原文链接：视觉Transformer与Mamba的创新改进，完美融合（附论文及源码）以下文章来源于微信公众号：AI视界引擎作者：AI引擎链接：https://mp.weixin.q...

大数据 2024-08-21 人工智能

1640阅读

知识图谱大模型系列之 17 使用 Llamaindex、Neo4j 和 Llama 3 构建具有知识图谱的高级 RAG 聊天机器人(教程含源码)

简介通过集成知识图谱来构建高级检索增强生成 (RAG 聊天机器人的分步指南。在检索增强生成 (RAG 解决方案中集成知识图谱可通过提供结构化和关系上下文显著提高响应的相关性和深度。知识图谱在 RAG 解决方案中非常有用，例如在医疗保健领域。例如，...

生成式AI 2024-08-21 人工智能

1278阅读

快速上手文心一言指令的实用指南

在当今这个信息快速发展的时代，人工智能技术已经深刻影响了我们的工作和生活。文心一言作为一款先进的自然语言处理工具，不仅可以帮助用户生成文本、回答问题，还能够广泛应用于教育、内容创作、客户服务等多个领域。掌握文心一言的指令使用方法，可以显著提高我们的工作...

人工智能 2024-08-20 人工智能

1281阅读

最强模型Llama 3.1 405B正式发布，扎克伯格：开源引领新时代

刚刚，大家期待已久的 Llama 3.1 官方正式发布了！ Meta 官方发出了「开源引领新时代」的声音。在官方博客中，Meta 表示：「直到今天，开源大语言模型在功能和性能方面大多落后于封闭模型。现在，我们正在迎来一个开源引领的新时代。我们公开...

人工智能 2024-08-20 人工智能

954阅读

【最新最热】开源引领未来：Llama 3.1震撼发布，405B参数超越闭源GPT-4，扎克伯格宣告AI分水岭到来

刚刚，备受瞩目的LIama 3.1震撼问世，荣耀加冕为大模型领域的最新王者！在横跨150余项基准测试的挑战中，LIama 3.1的405B版本以其卓越性能，不仅与当前顶尖的SOTA模型——GPT-4o及Claude 3.5 Sonnet并驾齐驱，更在多...

生成式AI 2024-08-20 人工智能

918阅读

微调（一）

微调有两种办法，一是模型全部参数的微调，二是少量参数高效的微调。前者由于参数多，需要的GPU多，并且全参数微调可能把模型带偏，后者只需要微调少量参数，需要的GPU少，还可能达到不错的效果，成为大家研究的重点，取了个专有名词Parameter-Effic...

AIGC 2024-08-20 人工智能

1218阅读