llm 第7页 - AIGC资讯

OpenAI惨遭打脸！SearchGPT官方演示大翻车，源代码竟暴露搜索机制

【新智元导读】OpenAI再次上演了谷歌Bard出糗的一幕，SearchGPT官方震撼演示却被外媒曝出低级错误。另有神通广大的开发者甚至扒出内部源码，揭秘了背后搜索机制。网友最新一手实测，AI秒级回复让全网惊呆。 SearchGPT发布刚过两天，已有人灰度...

生成式AI 2024-07-29 人工智能

936阅读

Llama 对决 GPT：AI 开源拐点已至?｜智者访谈

Meta 发布 Llama3.1405B，开放权重大模型的性能表现首次与业内顶级封闭大模型比肩，AI 行业似乎正走向一个关键的分叉点。扎克伯格亲自撰文，坚定表明「开源 AI 即未来」，再次将开源与封闭的争论推向舞台中央。回望过去，OpenAI 从开源到封...

AIGC 2024-07-29 人工智能

813阅读

【AIGC】Llama-3 官方技术报告

Llama-3 技术报告（中文翻译）欢迎关注【youcans的AGI学习笔记】原创作品 0. 简介现代人工智能（AI）系统的核心驱动力来自于基础模型。本文介绍了一组新的基础模型，称为 Llama 3。它是一个语言模型系列，原生支持多语言...

大数据 2024-07-29 人工智能

1401阅读

国产系统上的 Copilot 初体验

2023年，微软发布了 Windows Copilot，到2024年更进一步，将 Copilot 深度集成到 Windows 11 系统中，免费供用户使用，这一举措震动了整个科技业界。然而，令人遗憾的是，Windows Copilot 并未对中国区用...

大数据 2024-07-28 人工智能

1377阅读

OpenAI模型年化收入10亿美元，百度发布文心一言新模型、比尔·盖茨：不要“过分担心”AI 用电

ChatGPT狂飙160天，世界已经不是之前的样子。更多资源欢迎关注 1、OpenAI AI模型销量超越微软同类产品！年化收入达10亿美元在2019年与微软建立合作伙伴关系后，AI初创公司OpenAI显示出了惊人的销售能力，根据最新两家...

大数据 2024-07-28 人工智能

774阅读

为什么AI数不清Strawberry里有几个 r？Karpathy：我用表情包给你解释一下

让模型知道自己擅长什么、不擅长什么是一个很重要的问题。还记得这些天大模型被揪出来的低级错误吗? 不知道9.11和9.9哪个大，数不清 Strawberry 单词里面有多少个 r…… 每每被发现一个弱点，大模型都只能接受人们的无情嘲笑。嘲笑之后，大家也...

大数据 2024-07-28 人工智能

2509阅读

实战解读：Llama Guard 3 & Prompt Guard

前序研究：实战解读：Llama 3 安全性对抗分析近日，腾讯朱雀实验室又针对 Llama 3.1 安全性做了进一步解读。 2024年7月23日晚，随着Llama3.1的发布，Meta正式提出了“Llama系统”的概念，通过系统级的安全...

生成式AI 2024-07-28 人工智能

1392阅读

AI多模态模型架构之LLM主干(3)：Llama系列

〔探索AI的无限可能，微信关注“AIGCmagic”公众号，让AIGC科技点亮生活〕本文作者：AIGCmagic社区刘一手前言 AI多模态大模型发展至今，每年都有非常优秀的工作产出，按照当前模型设计思路，多模态大模型的架构主要包括...

大数据 2024-07-28 人工智能

1284阅读

函数调用：在 xLAM 上微调 Llama 3得益于 QLoRA，速度快且内存高效

欢迎来到雲闪世界.最近的大型语言模型 (LLM 在大多数语言生成任务中都表现出色。然而，由于它们基于下一个标记预测进行操作，因此它们通常难以准确执行数学运算。此外...

生成式AI 2024-07-27 人工智能

943阅读

微调神器LLaMA-Factory官方保姆级教程来了，从环境搭建到模型训练评估全覆盖

编者注：之前一直用firefly做微调，最近切换到LLaMA-Factory，发现不但简单易用，而且非常全面，有点相见恨晚的感觉。使用过程中我主要参考2个文档，一个是github上的官方中文文档： https://github.com/hiyouga/L...

AIGC 2024-07-27 人工智能

1359阅读

自回归模型胜过扩散模型：用于可扩展图像生成的 Llama

? 文献卡 Autoregressive Model Beats Diffusion: Llama for Scalable Image Generation 作者: Peize Sun; Yi Jiang; Shoufa Chen; Shil...

人工智能 2024-07-27 人工智能

1144阅读

ChatGLM3-6B使用lora微调实体抽取，工具LLaMA-Factory，医学数据集CMeEE

一、下载ChatGLM3-6B 下载地址，需要魔法测试模型：新建文件predict.py。运行下面测试代码。建议这里的transformers包最好和LLaMA-Factory环境的transformers包版本保持一致或者直接用LLaMA-Fa...

AIGC 2024-07-26 人工智能

1352阅读

最强模型 Llama 3.1 如期而至！扎克伯格最新访谈：Llama 会成为 AI 界的 Linux

这是开源 AI 的里程碑时刻。文 | 王启隆出品丨AI 科技大本营（ID：rgznai100）本文为 CSDN 编辑整理，未经授权，禁止转载。今天，Meta AI 的最新最强模型 —— Llama 3.1 如期而至。不仅...

大数据 2024-07-26 人工智能

1055阅读

测试：ollama加载羊驼版本llama-3中文大模型

找了一个晚上各种模型，像极了当初找各种操作系统的镜像，雨林木风，深蓝、老毛桃…… 主要是官方的默认7B版本回答好多英文，而且回复的很慢，所以我是在ollama上搜索"chinese"找到了这个羊驼版本的， ollama run lgkt/llama3-...

生成式AI 2024-07-26 人工智能

1025阅读

【AIGC】AI-Agents最新成果-斯坦福AI小镇源码解读

写在前面的话：今年年初斯坦福和谷歌的研究人员创建了一个类似于《模拟人生》的微型 RPG 虚拟世界，其中 25 个角色由 GPT 和自定义代码控制，并在arxiv上提交了论文版本，引起了对AIGC+游戏的广泛讨论； 8月，该项目在GitHub上正式开源...

AIGC 2024-07-25 人工智能

1152阅读

手把手教你在autodl上部署llama模型

文章目录一、注册AutoDL账号、租用GPU 二、创建conda环境三、下载llama模型四、启动模型一、注册AutoDL账号、租用GPU 进入 AutoDL官网链接注册账号，需要先充点钱，如下创建新实例。随便选...

生成式AI 2024-07-25 人工智能

2449阅读

使用Llama3/Qwen2等开源大模型，部署团队私有化Code Copilot和使用教程

目前市面上有不少基于大模型的 Code Copilot 产品，部分产品对于个人开发者来说可免费使用，比如阿里的通义灵码、百度的文心快码等。这些免费的产品均通过 API 的方式提供服务，因此调用时均必须联网、同时需要把代码、提示词等内容作为 API 的入参在...

人工智能 2024-07-25 人工智能

1365阅读

AI训AI惨遭投毒9次大崩溃，牛津剑桥等惊天发现登Nature封面！

9次迭代后，模型开始出现诡异乱码，直接原地崩溃!就在今天，牛津、剑桥等机构的一篇论文登上了Nature封面，称合成数据就像近亲繁殖，效果无异于投毒。有无破解之法?那就是——更多使用人类数据! 用AI生成的数据训练AI，模型会崩溃? 牛津、剑桥、帝国理工、多...

人工智能 2024-07-25 人工智能

923阅读

【大语言模型LLMs】Llama系列简介

【大语言模型LLMs】Llama系列简介文章目录【大语言模型LLMs】Llama系列简介 1. LLaMa 1.1 引言 1.2 方法 1.2.1 预训练数据 1.2.2 架构 1.2.3 优化器 1.2.4 效率 2....

大数据 2024-07-24 人工智能

1229阅读

【大模型】微调实战—使用 ORPO 微调 Llama 3

ORPO 是一种新颖微调（fine-tuning）技术，它将传统的监督微调（supervised fine-tuning）和偏好对齐（preference alignment）阶段合并为一个过程。这减少了训练所需的计算资源和时间。此外，实证结果表明，ORP...

大数据 2024-07-24 人工智能

1124阅读

AI日报：Llama3.1重磅上线；可灵上线国际版1.0并开启付费计划；腾讯PhotoMaker V2升级

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/ 1、最强开源模型来了!Llama3...

生成式AI 2024-07-24 人工智能

997阅读

基于Llama Index构建RAG应用(Datawhale AI 夏令营)

前言 Hello，大家好，我是GISer Liu?，一名热爱AI技术的GIS开发者，本文参与活动是2024 DataWhale AI夏令营；? 在本文中作者将通过： Gradio、Streamlit和LlamaIndex介绍 Ll...

AIGC 2024-07-24 人工智能

1610阅读

长上下文能力只是吹牛？最强GPT-4o正确率仅55.8%，开源模型不如瞎蒙

【新智元导读】当今的LLM已经号称能够支持百万级别的上下文长度，这对于模型的能力来说，意义重大。但近日的两项独立研究表明，它们可能只是在吹牛，LLM实际上并不能理解这么长的内容。大数字一向吸引眼球。千亿参数、万卡集群，——还有各大厂商一直在卷的超长上下...

大数据 2024-07-23 人工智能

894阅读

2024-06-21 问AI: 在大语言模型中，什么是LLama Index

文心一言 LLama Index是一个针对基于LLM（大型语言模型）的应用程序的数据框架，旨在提供RAG（检索增强生成，Retrieval-Augmented Generation）能力。以下是关于LLama Index的清晰概述：定义与功能：...

AIGC 2024-07-23 人工智能

1245阅读

首个超越GPT4o级开源模型！Llama 3.1泄密：4050亿参数，下载链接、模型卡都有了

Llama3.1终于现身了，不过出处却不是 Meta 官方。今日，Reddit 上新版 Llama 大模型泄露的消息遭到了疯传，除了基础模型，还包括8B、70B 和最大参数的405B 的基准测试结果。下图为 Llama3.1各版本与 OpenAI G...

生成式AI 2024-07-23 人工智能

770阅读

苹果开源7B大模型，训练过程数据集一口气全给了，网友：开放得不像苹果

苹果最新杀入开源大模型战场，而且比其他公司更开放。推出7B模型，不仅效果与Llama38B相当，而且一次性开源了全部训练过程和资源。要知道，不久前Nature杂志编辑Elizabeth Gibney还撰文批评: 而苹果这次竟然来真的!! 就连NLP...

生成式AI 2024-07-23 人工智能

806阅读

Llama也能做图像生成？文生图模型已开源

导读基于next-token prediction的图像生成方法首次在ImageNet benchmark超越了LDM, DiT等扩散模型，证明了最原始的自回归模型架构同样可以实现极具竞争力的图像生成性能。 Llama也能做图像生成？文生图模型已开源...

生成式AI 2024-07-23 人工智能

1343阅读

Windows下安装LLama-Factory

在进行安装前，请先确认你的GPU能支撑起训练的显存。如果和可怜的我一样是4GB可以选择上云或者换一个好一点的显卡。并且确定你安装了显卡驱动版本在官方给的版本以上，如果没有安装，详细参考我的另一篇文章：LLama-Factory运行异常，CU...

大数据 2024-07-22 人工智能

2451阅读

视频大语言模型调研论文《Video-LLaMA: An Instruction-tuned Audio-Visual Language Model for Video Understanding》解读

本文是关于论文《Video-LLaMA: An Instruction-tuned Audio-Visual Language Model for Video Understanding》的简要介绍。Video-LLaMA是阿里达摩院的一个多模态大语言模型...

大数据 2024-07-22 人工智能

985阅读

AIGC领域综述

AIGC领域综述 2023 1. A Survey of Large Language Models 2. A Complete Survey on Generative AI (AIGC : Is ChatGPT from GPT-4 to...

生成式AI 2024-07-22 人工智能

1023阅读

AI日报：微软推设计神器Microsoft Designer；苹果开源小模型 DCLM-Baseline-7B；小爱宣布新增AI文档问答等功能

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/ 1、微软推设计神器Microsof...

AIGC 2024-07-22 人工智能

918阅读

首轮嘉宾阵容公布，GOTC 2024 即将开启！

8 月 15 日至 16 日，GOTC 2024 将在上海张江科学会堂盛大开启。 GOTC 2024 与上海浦东软件园联合举办，并结合 “GOTC（全球开源技术峰会）” 与 “GOGC（全球开源极客嘉年华）”，是一场面向全球开发者的全新的开源技术盛会。期...

大数据 2024-07-22 人工智能

1068阅读

OpenAI掀小模型血战！苹果DCLM强势登场，碾压Mistral 7B全开源

【新智元导读】小模型时代来了?OpenAI带着GPT-4o mini首次入局小模型战场，Mistral AI、HuggingFace本周接连发布了小模型。如今，苹果也发布了70亿参数小模型DCLM，性能碾压Mistral-7B。小模型的战场，打起来了!...

生成式AI 2024-07-22 人工智能

864阅读

llama.cpp

文章目录一、关于 llama.cpp 支持的模型： Multimodal models: Bindings: UI: Tools: 二、Demo 1、Typical run using LLaMA v2 13B on M2 Ultra...

大数据 2024-07-22 人工智能

1393阅读

自动炼丹基于Llama-factory改写--学习记录

最近在使用llama-factory微调LLM，但是一个个手动修改基本的学习率，学习轮次有太麻烦了。在寻找有没有什么自动调参的办法，在github上看到Llama-factory支持Weights & Biases 记录实验数据自动微调，尝试了一下...

人工智能 2024-07-22 人工智能

1286阅读

[机器学习]-如何在 MacBook 上安装 LLama.cpp + LLM Model 运行环境

如何在 MacBook 上安装 LLama.cpp + LLM Model 运行环境 1. 问题与需求近段时间想学习一下大语言模型的本地化部署与应用。首先遇到的就是部署硬件环境的问题。我自己的笔记本是一台 MacBook Pro M3，没有 Nv...

AIGC 2024-07-21 人工智能

1281阅读

比肩Midjourney-v6！没有GPU也能跑可图Kolors

比肩Midjourney-v6，快手的文生图开源模型可图Kolors一发布，开源社区就炸开了锅。短短几天，可图在Github上收获2k Star，Huggingface模型下载热榜第一。 7月6日，快手宣布开源数十亿参数的文生图模型可图Ko...

生成式AI 2024-07-21 人工智能

1355阅读

llama-factory微调工具使用入门

一、定义环境配置案例： https://zhuanlan.zhihu.com/p/695287607 chatglm3 案例多卡训练deepspeed llama factory 案例Qwen1.5 报错二、实现环境配置 git cl...

人工智能 2024-07-21 人工智能

1350阅读

专访诺奖得主：大模型是记忆还是理解？

物理学家理查德·费曼曾将自然世界比作众神的游戏，比如国际象棋——我们不知道游戏规则，但却可以观察棋盘，也许只是其中的一角，然后根据这些观察，试图找出游戏规则。费曼的比喻，道出了科学研究的核心，也生动描绘了许多经济学家的工作，他们同样致力于从纷繁复杂的经济...

AIGC 2024-07-21 人工智能

874阅读

LLaMA-Factory/scripts/length_cdf.py 源码解析

这段代码定义了一个函数 length_cdf，用来计算和打印数据集样本长度的累积分布函数（CDF），并在脚本直接运行时通过 fire 库将该函数暴露为命令行接口。我们逐行解释这段代码： python 复制 from llmtuner.data imp...

大数据 2024-07-21 人工智能

1170阅读

Llama模型家族之拒绝抽样(Rejection Sampling)（九）强化学习之Rejection Sampling

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

大数据 2024-07-21 人工智能

1681阅读

给｢大模型初学者｣的 LLaMA 3 核心技术剖析

编者按：本文旨在带领读者深入了解 LLaMA 3 的核心技术 —— 使用 RMSNorm 进行预归一化、SwiGLU 激活函数、旋转编码（RoPE）和字节对编码（BPE）算法。RMSNorm 技术让模型能够识别文本中的重点，SwiGLU 激活函数则如同“...

生成式AI 2024-07-21 人工智能

1172阅读

【AIGC调研系列】VILA-1.5版本的视频理解功能如何

VILA-1.5版本的视频理解功能表现出色，具有显著的突破。这一版本不仅增强了视频理解能力，还提供了四种不同规模的模型供用户选择，以适应不同的应用需求和计算资源限制[1][2][3]。此外，VILA-1.5支持在笔记本等边缘设备上部署，这得益于其高效的模型...

AIGC 2024-07-20 人工智能

1546阅读

甲骨文首次将LLMs引入数据库，集成Llama 3和Mistral，和数据库高效对话

信息时代，数据为王。数据库作为数据存储&管理的一种方式，正在以势不可挡的趋势与AI结合。前有OpenAI 收购了数据库初创公司 Rockset，引发广泛关注；Oracle公司（甲骨文）作为全球最大的信息管理软件及服务供应商，近日发布新产品Hea...

人工智能 2024-07-20 人工智能

806阅读

大模型应用开发之业务架构和技术架构（从AI Embedded 到 Copilot,再到Agent）_embedding、copilot、agents

前言截止到目前，我们已经从大模型的定义概念，应用层涉及的一些概念做了些了解。在大模型的应用开发中，RAG、Agent等概念我们之前也做了些简述，没有看过的可以粗略回顾一下：[大模型06-大模型应用开发之准备篇。本文我们重点讲的就是伴随着大模型的广...

AIGC 2024-07-20 人工智能

1649阅读

LLaMA-Factory：开源的低代码大模型训练框架

LLaMA-Factory 是一个由零隙智能（SeamLessAI）开源的低代码大模型训练框架，它集成了业界最广泛使用的微调方法和优化技术，并支持众多开源模型的微调和二次训练。一、功能特点支持多种开源模型：LLaMA-Factory支持包括...

大数据 2024-07-20 人工智能

2335阅读

本地私有化部署开源大模型完整教程：LangChain + Streamlit+ Llama 【LLM大模型】

在过去的几个月里，大型语言模型(llm 获得了极大的关注，这些模型创造了令人兴奋的前景，特别是对于从事聊天机器人、个人助理和内容创作的开发人员。大型语言模型(llm 是指能够生成与人类语言非常相似的文本并以自然方式理解提示的机器学习模型。这些模型使...

生成式AI 2024-07-19 人工智能

1518阅读

Llama - 微调

本文翻译整理自：https://llama.meta.com/docs/how-to-guides/fine-tuning 文章目录微调实验跟踪 Recipes PEFT LoRA torchtune Hugging Face PE...

AIGC 2024-07-19 人工智能

877阅读

每日AIGC最新进展(46)：上海AI Lab发布多模态大模型InternLM-XComposer-2.5、阿里发布视频生成大模型EasyAnimate-V3、快手发布人像模型LivePortrait

Diffusion Models专栏文章汇总：入门与实战 InternLM-XComposer-2.5: A Versatile Large Vision Language Model Supporting Long-Contextual Input...

生成式AI 2024-07-19 人工智能

808阅读

Streaming local LLM with FastAPI, Llama.cpp and Langchain

题意：使用FastAPI、Llama.cpp和Langchain流式传输本地大型语言模型问题背景： I have setup FastAPI with Llama.cpp and Langchain. Now I want to enable...

大数据 2024-07-18 人工智能

930阅读