语言模型第10页

理财AI勇闯「无人区」：理解专家、成为专家

用十年时间成为全球在线服务数亿用户的财富管理平台后，摆在蚂蚁财富面前的是一段少有人走过的路: 这5亿活跃用户第一次动动手就能接触到各类普惠的理财产品，但真正理财行为成熟的仅占两成。而放眼中国7.2亿基金投资者里，每3600人才能分到1位传统理财顾问来服务。...

AIGC 2024-07-08 人工智能

933阅读

千呼万唤的可灵网页版来了！基础模型重磅升级，新功能“炸场”WAIC

“这可能是本届WAIC上欢呼声最多的一场发布” 在刚刚闭幕的世界人工智能大会（WAIC）上，快手晒出了可灵发布一个月以来的成绩单: “超50万人申请，已开放给超30万用户使用，生成超700万条短视频。” 作为全球首个用户可用的真实影像级视频生成大模型，可灵...

生成式AI 2024-07-08 人工智能

889阅读

大语言模型的底层原理，ChatGPT，文心一言等人工智能体是如何产生的？本文将详细讲解

文章目录基础介绍一、预训练 1.数据准备质量过滤敏感内容过滤数据去重数据预处理实践质量过滤去重隐私过滤 2.词元化 BPE 分词 WordPiece 分词 Unigram 分词 3.数据调度总结参考文献...

AIGC 2024-07-08 人工智能

1332阅读

AI+视频 | Nvidia 投资的AI公司，通过视频理解开创感知推理，获顶级风投5000万美元融资

在每天刷视频的时代，我们如何快速创作360度全方位理解的视频内容? Twelve Labs，一家旧金山初创公司，是由一支年轻的工程师团队Jae Lee 和 Aiden L 创立，该产品可在视频中提取特定视频瞬间，包括视觉、音频、文本和上下文信息，以实现语义...

生成式AI 2024-07-08 人工智能

1244阅读

llama_index 从 0 到 1：别再用传统方法处理数据了！LlamaIndex如何革新你的信息检索？

llama_index 从 0 到 1 llama_index 基础设施：数据连接、索引构建、查询接口高级特性：六大核心功能来增强语言模型处理和响应外部数据的能力数据连接器 Documents & Nodes (文档与节点 ...

大数据 2024-07-08 人工智能

1336阅读

[arxiv论文解读]LlamaFactory：100+语言模型统一高效微调

该文档是一篇关于LLAMAFACTORY的学术论文，这是一个用于高效微调大型语言模型（LLMs）的统一框架。这篇论文详细介绍了LLAMAFACTORY的设计、实现和评估，以及它在语言建模和文本生成任务中的应用。下面是对文档内容的详细解释：摘要（Abst...

AIGC 2024-07-08 人工智能

1796阅读

AI绘画模型，现在发展到哪一步？

随着人工智能技术的飞速发展，AI绘画已成为艺术创作领域的一股新势力。通过模拟人类的绘画技巧和风格，AI绘画模型能够生成令人惊叹的艺术作品。本文将介绍现阶段主流的AI绘画模型，并重点突出MJ绘画模型的优势与特点。一、AI绘画模型概述 AI绘画...

大数据 2024-07-07 人工智能

969阅读

传知代码-Llama 2：开放基础和微调聊天模型以及法律判决数据集分类实战(论文复现)

代码以及视频讲解本文所涉及所有资源均在传知代码平台可获取本文概述本文首先会介绍一下Llama2大模型，然后会使用一个公开的中文法律判决数据集（部分）进行Llama2提示学习的分类实战。论文主要内容这篇文章介绍了Llama 2，这是...

生成式AI 2024-07-07 人工智能

817阅读

全方位了解 Meta Llama 3

本文将为您提供 Llama 3 的全面概览，从其架构、性能到未来的发展方向，让您一文了解这一革命性大语言模型的所有要点。 Meta Llama 发展历程 Llama 1 Llama 是由 Meta(FaceBook AI 发布的一个开源项目...

AIGC 2024-07-06 人工智能

1217阅读

【AIGC】LangChain入门指南—第二章 LangChain入门指南

第二章 LangChain入门指南文章目录第二章 LangChain入门指南前言一、主要内容 1、初识LangChain 1.1 为什么需要LangChain 1.2 LLM应用开发的最后1公里 1.3 LangChain的...

人工智能 2024-07-06 人工智能

1725阅读

LLaMA 2-原理&模型&训练-你懂了吗?

LLaMA 2的原理 LLaMA 2是Meta AI开发的大型语言模型，它基于Transformer架构，采用了自注意力机制来处理输入序列中的长期依赖关系。LLaMA 2的核心原理包括自注意力机制、多头注意力、层归一化和残差连接等，这些技术共同使得模型...

大数据 2024-07-06 人工智能

1092阅读

大模型的实践应用24-LLaMA-Factory微调通义千问qwen1.5-1.8B模型的实例

大家好，我是微学AI，今天给大家介绍一下大模型的实践应用24-LLaMA-Factory微调通义千问qwen1.5-1.8B模型的实例, LLaMA-Factory是一个专门用于大语言模型微调的框架，它支持多种微调方法，如LoRA、QLoRA等，并提供了丰...

大数据 2024-07-05 人工智能

1507阅读

AI日报：百度文心4.0免费开放；AI lab开源超强多模态大模型；对标GPT-4o！商汤发布日日新5o

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、百度文心智能体平台免费开放文心...

大数据 2024-07-05 人工智能

881阅读

百度李彦宏称AI跑分刷榜乱象不止：今天震撼发布、明天史诗级更新

快科技7月5日消息，在2024年世界人工智能大会上，百度创始人李彦宏发表了演讲，认为业界过分关注模型的评测分数和规模，而忽视了AI技术真正的价值应用。李彦宏指出，当前AI领域存在一种不良风气，即各个公司竞相发布新一代大语言模型，宣称自己的模型参数规模和训...

AIGC 2024-07-05 人工智能

883阅读

【AIGC调研系列】MetaGpt与AutoGpt相比有哪些优势和劣势

MetaGPT与AutoGPT相比，具有以下优势和劣势：优势： MetaGPT采用了多智能体框架，通过角色专业化、工作流管理和灵活的消息机制，增强了大规模语言模型在多智能体协作上的能力[4]。这种设计使得MetaGPT能够处理更复杂的任务，并通过结...

大数据 2024-07-04 人工智能

1977阅读

视频多模态模型: VideoChat、Video-LLaMA、Video-ChatGPT、Video-LLaVA等

VideoChat VideoChat?: 基于视频指令数据微调的聊天机器人 https://arxiv.org/pdf/2305.06355.pdf https://github.com/OpenGVLab/Ask-Anything/tr...

人工智能 2024-07-04 人工智能

1075阅读

AIGC从入门到实战：只缘身在此山中：GPT 模型靠什么取胜和出圈？

AIGC从入门到实战：只缘身在此山中：GPT 模型靠什么取胜和“出圈”？作者：禅与计算机程序设计艺术 / Zen and the Art of Computer Programming / TextGenWebUILLM AIGC from Begi...

AIGC 2024-07-04 人工智能

902阅读

一文为你深度解析LLaMA2模型架构

本文分享自华为云社区《【云驻共创】昇思MindSpore技术公开课大咖深度解析LLaMA2 模型架构》，作者： Freedom123。一、前言随着人工智能技术的不断发展，自然语言处理（NLP）领域也取得了巨大的进步。在这个领域中，LLaMA展...

人工智能 2024-07-04 人工智能

1204阅读

全员i人？《大闹天宫》MBTI测试让全公司炸锅！最神秘国产大模型团队出手了

【新智元导读】最近，公司全体同事都在疯狂沉迷这款《大闹天宫MBTI》测试!各种直击打工人的灵魂拷问，让所有i人和e人在职场极限场景中反复拉扯。国产黑马和上影打造的原汁原味《大闹天宫》画风，简直让人一秒穿越回童年。就在最近，全公司都为这个大闹天宫MBTI测...

生成式AI 2024-07-04 人工智能

793阅读

【LLM教程-llama】如何Fine Tuning大语言模型？

今天给大家带来了一篇超级详细的教程,手把手教你如何对大语言模型进行微调(Fine Tuning ！（代码和详细解释放在后文）目录大语言模型进行微调(Fine Tuning 需要哪些步骤？大语言模型进行微调(Fine Tuning 训练过程及代码...

AIGC 2024-07-04 人工智能

1092阅读

央视点赞国产AI复活召唤术，兵马俑竟与宝石老舅对唱Rap？

沉睡了两千多年的兵马俑，苏醒了? 一句秦腔开场，将我们带到了黄土高原。如果不是亲眼所见，很多观众可能难以想象，有生之年还能看到兵马俑和宝石 Gem 同台对唱《从军行》。「青海长云暗雪山，孤城遥望玉门关。」古调虽存音乐变，声音依旧动人情: 这场表演背后的...

生成式AI 2024-07-04 人工智能

1118阅读

构建您的私人语音助手：在本地运行的Whisper + Ollama + Bark之旅

构建您的私人语音助手：在本地运行的Whisper + Ollama + Bark之旅在深入了解如何构建并本地运行自己的大型语言模型（RAG）后，今天我们将更进一步，不仅实现高级对话功能，还赋予其听和说的能力。想象一下拥有如电影《钢铁侠》中Jarvis或...

人工智能 2024-07-03 人工智能

1836阅读

llama-factory训练RLHF-PPO模型

理论上RLHF（强化学习）效果比sft好，也更难训练。ppo有采用阶段,步骤比较多,训练速度很慢. 记录下工作中使用llama-factory调试rlhf-ppo算法流程及参数配置,希望对大家有所帮助. llama-factory版本: 0.8.2...

AIGC 2024-07-03 人工智能

1335阅读

AIGC从入门到实战：ChatGPT 需要懂得写提示词的人

AIGC从入门到实战：ChatGPT需要懂得写提示词的人 1.背景介绍 1.1 人工智能新时代的到来人工智能(Artificial Intelligence, AI 已经成为当今科技领域最炙手可热的话题之一。随着计算能力的不断提升和算法的持续创新,...

生成式AI 2024-07-03 人工智能

925阅读

深入探索Llama 2：下一代开源语言模型的革新与影响

Llama 2是Meta AI发布的一款先进的开源大模型，属于大型语言模型（LLM）类别。它是Transformer架构的一种变体，经过预先训练并在多种文本和代码数据集上进行微调，旨在提升功能和安全性。Llama 2的关键特点包括：庞大的训练数据集...

AIGC 2024-07-03 人工智能

1052阅读

开源探索时刻！在LLaMA-Factory上实现GLM-4和Qwen2的工具格式化

众所周知，如今的大模型大多是使用通用数据训练得出，因此在不同场景和专业领域的效果还有待改进。于是就衍生出了现如今广泛使用的微调技术，由于笔者现在所在的项目同样是与大模型打交道，也就不可避免地盯上了LLaMA-Factory。那究竟什么是LLaMA-...

生成式AI 2024-07-03 人工智能

921阅读

AIGC 生成对抗网络、大型预训练模型 LLM ChatGPT Transformer LLaMA LangChain Prompt Engineering 提示工程

AIGC AIGC（Artificial Intelligence Generated Content）是指基于生成对抗网络、大型预训练模型等人工智能的技术方法，通过已有数据的学习和识别，以适当的泛化能力生成相关内容的技术。AIGC的爆发得益于GAN、...

人工智能 2024-07-03 人工智能

974阅读

LLaMA-Factory实战推理

LLaMA-Factory官网：https://github.com/hiyouga/LLaMA-Factory 安装环境 git clone https://github.com/hiyouga/LLaMA-Factory.git cd LLaM...

人工智能 2024-07-02 人工智能

1012阅读

本地离线模型搭建指南-LLaMA-Factory训练框架及工具

搭建一个本地中文大语言模型（LLM）涉及多个关键步骤，从选择模型底座，到运行机器和框架，再到具体的架构实现和训练方式。以下是一个详细的指南，帮助你从零开始构建和运行一个中文大语言模型。本地离线模型搭建指南将按照以下四个部分展开中文大语言模型底座选...

大数据 2024-07-02 人工智能

1639阅读

AI日报：Runway的Gen-3 Alpha正式开放使用；百度文心大模型4.0 Turbo限时免费；英伟达发布直播神器；爆火Character AI惨遭阉割

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、Runway的Gen-3 Al...

人工智能 2024-07-02 人工智能

890阅读

爆火AI惨遭阉割，1600万美国年轻人集体「失恋」？ Character AI被爆资金断裂，00后炸了

最近，在美国00后中爆火的Character AI，竟然把聊天机器人对话模型给「阉割」了?愤怒的年轻人们冲进社区，抱怨的声浪快要掀翻天了!而这背后，似乎还有谷歌或Meta的授意。美国当今最火爆的社交软件Character AI，竟然开始「阉割」自己的模型...

生成式AI 2024-07-02 人工智能

891阅读

Anthropic CEO Dario Amodei：大模型规模扩大影响若能停止，对世界反而有利

近日，美国人工智能初创公司 Anthropic将自家Claude大模型推进至3.5版本，并以Claude3.5Sonnet 模型保持其在中等规模模型市场的竞争力，号称“速度更快、成本更低”。截至2024年3月，Anthropic已筹集到73亿美元的资金，...

AIGC 2024-07-02 人工智能

949阅读

AI绘图软件midjourney的底层模型是什么？

生成式模型Midjourney如何工作： Midjourney 的底层模型是一个大型语言模型 (LLM ，它已经在海量图像和文本数据集上进行了训练。能够生成既逼真又富有创意的图像。Midjourney 的一些优势包括：准确性、创造力、速度。 LLM...

人工智能 2024-07-02 人工智能

1310阅读

LLM2Vec介绍和将Llama 3转换为嵌入模型代码示例

嵌入模型是大型语言模型检索增强生成(RAG 的关键组成部分。它们对知识库和用户编写的查询进行编码。使用与LLM相同领域的训练或微调的嵌入模型可以显著改进RAG系统。然而，寻找或训练这样的嵌入模型往往是一项困难的任务，因为领域内的数据通常是稀缺的。但...

大数据 2024-07-02 人工智能

879阅读

Llama模型家族之RLAIF 基于 AI 反馈的强化学习（三） RLAIF 的工作原理

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

大数据 2024-07-02 人工智能

914阅读

对比体验 ChatGPT，聊聊文心一言的优缺点

在昨天文心一言发布后，我第一时间拿到了体验的资格，但第一次使用后却不禁有些失望。他的逻辑能力极度缺乏、创造力也差点意思。不过，今天再次高强度使用后，却又让我对这款产品的想法有了些许改变。前言将 2023 年称为 AI 纪元在我看来也没什么不合适的：...

生成式AI 2024-07-02 人工智能

1771阅读

文心一言发展历史

文心一言（英文名：ERNIE Bot）的发展历史可以清晰地分为几个阶段，以下将结合参考文章中的相关数字和信息，以分点表示和归纳的形式呈现：一、早期研发历程 ERNIE 1.0的发布：时间：2019年3月16日内容：百度正式发布知识增强...

人工智能 2024-07-01 人工智能

2510阅读

使用LMDeploy部署和量化Llama 3模型

## 引言在人工智能领域，大型语言模型（LLMs）正变得越来越重要，它们在各种自然语言处理任务中发挥着关键作用。Llama 3是近期发布的一款具有8B和70B参数量的模型，它在性能和效率方面都取得了显著的进步。为了简化Llama 3的部署和量化过程，lm...

大数据 2024-07-01 人工智能

1171阅读

探索开源宝藏：LLaMA 2 模型的全面优势与实践指南

探索开源宝藏：LLaMA 2 模型的全面优势与实践指南引言在大型语言模型（LLM）的领域中，Meta AI 开发的 LLaMA 2 以其开源的优势和强大的性能，迅速成为研究和开发社区的新宠。本文将深入探讨 LLaMA 2 的优势，并提供详细的实...

AIGC 2024-06-30 人工智能

906阅读

上海一医院用AI自动生成病历效率提升30倍

快科技6月30日消息，对于眼科医生而言，工作节奏快、强度高，除了要进行日常手术和诊疗工作外，还需要处理大量繁琐却相似的病史书写工作。为此，上海市第一人民医院引入蚂蚁大模型能力进行提高病史书写效率的创新应用。通过关键信息的给定、语音输入等多种形式结合自动...

人工智能 2024-06-30 人工智能

766阅读

使用 llama.cpp 在本地部署 AI 大模型的一次尝试

对于刚刚落下帷幕的2023年，人们曾经给予其高度评价——AIGC元年。随着 ChatGPT 的火爆出圈，大语言模型、AI 生成内容、多模态、提示词、量化…等等名词开始相继频频出现在人们的视野当中，而在这场足以引发第四次工业革命的技术浪潮里，人们对于人工智能...

大数据 2024-06-29 人工智能

1056阅读

技术突破：llamafile一键部署大模型，释放AI潜力

目录一、引言二、什么是llamafile？ 1、设计目标 2、技术构成 3、与传统部署方式的对比 4、一键部署的优势三、核心特性 1、一键部署的便捷性 2、跨平台支持 3、独立可执行文件 4、简化的分发流程 5、技术细节 6、用户体...

生成式AI 2024-06-29 人工智能

973阅读

AI文本生成识别新突破！西湖大学推出Fast-DetectGPT

快科技6月28日消息，西湖大学工学院张岳教授领导的文本智能实验室开发了一种名为Fast-DetectGPT的新文本检测方法。据悉，该方法能高效识别AI生成的文本，并且Fast-DetectGPT无需训练，即可准确检测包括ChatGPT、GPT-4在内的多...

大数据 2024-06-28 人工智能

887阅读

每日AIGC最新进展(20)：基于树的长视频理解VideoTree、IBM研究院提出AI生成图片生成检测、蚂蚁集团提出AI生成视频检测工具、CMU提出大型视频-语言模型

Diffusion Models专栏文章汇总：入门与实战 VideoTree: Adaptive Tree-based Video Representation for LLM Reasoning on Long Videos 本文介绍了一种名...

人工智能 2024-06-28 人工智能

979阅读

AI日报：谷歌发布最强开源语言模型Gemma2；讯飞星火V4炸场；Glif作者创建meme梗图生成器风靡推特

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、谷歌发布最强开源语言模型Gem...

生成式AI 2024-06-28 人工智能

868阅读

Llama模型家族之拒绝抽样(Rejection Sampling)（二）均匀分布简介

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

人工智能 2024-06-28 人工智能

936阅读

文心一言4.0、智谱清言、MoonshotAI测评对比（下）

任务三：根据结构化提示词撰写小说感兴趣的朋友可在文末点击我的名片，备注“AI”免费领取AI学习基地 +AI交流群测试提示词 Markdown Role : 小说家 ## Profile : - writer: 李继刚 - versi...

生成式AI 2024-06-28 人工智能

903阅读

每日一看大模型新闻（2024.1.20-1.21）英伟达新对话QA模型准确度超GPT-4，却遭吐槽：无权重代码意义不大；Llama 2打败GPT-4！Meta让大模型自我奖励自迭代，再证合成数据是LL

1.产品发布 1.1韩国Kakao：推出多模态大模型Honeybee 发布日期：2024.1.20 Kakao unveils multimodal large language model Honeybee - The Korea Ti...

大数据 2024-06-27 人工智能

948阅读

AI日报：GPTs靠边站！Claude推全新功能Projects；Figma大更新！AI设计几秒成稿；阿里Qwen-2稳夺全球开源大模型榜首

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、Claude推类GPTs功能P...

AIGC 2024-06-27 人工智能

909阅读