llm 第15页 - AIGC资讯

文心一言4.0、智谱清言、MoonshotAI实测对比（上）

前言前两天看到这张图，又刚好拿到了文心一言的4.0内测号，就想着把新版国内御三家横向对比测评一下。文末领取免费领取AI学习基地 +AI交流群前一段时间也一直在研究复杂提示词（结构化提示词）向国内大模型迁移适配的问题，索性一起做了。...

人工智能 2024-05-29 人工智能

1452阅读

使用 LLaMA Factory 微调 Llama-3 中文对话模型

原文：https://colab.research.google.com/drive/1d5KQtbemerlSDSxZIfAaWXhKr30QypiK?usp=sharing#scrollTo=gf60HoT633NY 请申请一个免费 T4 GPU 来...

人工智能 2024-05-29 人工智能

1778阅读

基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）

基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二） #Options local_llm = 'llama3' llm = ChatOllama(model=local_llm, format="json", tempe...

人工智能 2024-05-29 人工智能

1438阅读

llama-factory SFT系列教程 (三)，chatglm3-6B 大模型命名实体识别实战

文章目录文章列表：简介装包数据集 lora 微调 API 部署大模型预测评估缺少数据集文章列表： llama-factory SFT系列教程 (一，大模型 API 部署与使用 llama-factory SFT...

生成式AI 2024-05-28 人工智能

1306阅读

AI大模型日报#0422：深扒「全球TOP 10大模型团队」、扎克伯格 Llama 3访谈

导读：欢迎阅读《AI大模型日报》，内容基于Python爬虫和LLM自动生成。目前采用“文心一言”生成了每条资讯的摘要。标题: 文本生成8K、360度全景世界！Model 3重磅发布摘要: Blockade Labs发布了新模型Model 3，...

人工智能 2024-05-28 人工智能

1028阅读

在树莓派上运行语音识别和LLama-2 GPT!

目前，绝大多数大模型运行在云端服务器，终端设备通过调用api的方式获得回复。但这种方式有几个缺点：首先，云api要求设备始终在线，这对于部分需要在无互联网接入的情况运行的设备很不友好；其次，云api的调用需要消耗流量费，用户可能不想支付这部分费用；最后，如...

人工智能 2024-05-28 人工智能

1111阅读

AI智能体的炒作与现实：GPT-4都撑不起，现实任务成功率不到15%

随着大语言模型的不断进化与自我革新，性能、准确度、稳定性都有了大幅的提升，这已经被各个基准问题集验证过了。但是，对于现有版本的 LLM 来说，它们的综合能力似乎并不能完全支撑得起 AI 智能体。多模态、多任务、多领域俨然已成为 AI 智能体在公共...

大数据 2024-05-28 人工智能

805阅读

不影响输出质量还能追踪溯源，「大模型无偏水印」入选ICLR 2024 Spotlight

本文通讯作者为马里兰大学计算机系的博士生胡正冕，其导师为 Heng Huang。他的主要研究方向是采样与机器学习理论，曾在ICML、NeurIPS、ICLR等顶级会议上发表多篇论文。邮箱: huzhengmian@gmail.com 随着大语言模型（LL...

人工智能 2024-05-28 人工智能

1068阅读

独角兽被微软挖角，新团队首曝光！情感AI嵌入机器人，超大内存升级情感体验

今年 3 月，人工智能领域的领军人物Mustafa Suleyman离开Inflection AI，转而领导微软的人工智能部门。微软在如火如荼的人工智能人才争夺战中获胜的消息在科技界引起热议，但很少有人讨论这次离职对Inflection AI的影响。...

人工智能 2024-05-28 人工智能

866阅读

仅用250美元，Hugging Face技术主管手把手教你微调Llama 3

ChatGPT狂飙160天，世界已经不是之前的样子。新建了免费的人工智能中文站https://ai.weoknow.com 新建了收费的人工智能中文站https://ai.hzytsoft.cn/ 更多资源欢迎关注大语言模型的微...

AIGC 2024-05-28 人工智能

917阅读

AIGC学习：（一）langchain介绍

一、LangChain介绍 langChain是用于快速构建AI应用的框架(第三方开源库。这里是官网，这里是Github 源码。 “一句话”介绍：类似于Angular、React、Vue 等快速构建Web应用的前端框架. 类似于ReactNati...

AIGC 2024-05-28 人工智能

1166阅读

AI日报：百度发布文心大模型学习机；Open-Sora 1.1可生成21秒视频；Canva可以自动剪辑视频了；超牛ComfyUI节点AnyNode来了

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、百度文心大模型学习机“小度学习...

大数据 2024-05-28 人工智能

927阅读

文字生成手语视频大模型SignLLM 帮助听障人群实现无障碍沟通

站长之家（ChinaZ.com）5月28日消息近日，一款名为SignLLM的多语言手语模型引起了广泛关注。据称，这是第一个可以从输入文本生成手语手势的模型。 SignLLM利用了丰富的"Prompt2Sign"多语言手语数据集，确保生成的手语视频动作自...

AIGC 2024-05-28 人工智能

773阅读

Llama 3 模型家族构建安全可信赖企业级AI应用之使用 Llama Guard 保护大模型对话（八）

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

大数据 2024-05-28 人工智能

908阅读

AI可以生成手语手势视频了！SignLLM通过文字描述即可生成手语视频

SignLLM是一个创新的多语言手语模型，它具有通过文字描述生成手语视频的能力。这项技术对于听力障碍者来说是一个巨大的进步，因为它能够提供一种新的沟通方式。以下是SignLLM的一些关键特点: 文本到手语视频的转换:SignLLM模型能够将输入的文本或...

人工智能 2024-05-28 人工智能

933阅读

TigerGraph CoPilot如何实现图形增强式AI

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 通过对比其他商用LLM的缺陷，本文详细介绍了TigerGraph CoPilot的主要功能、优点、以及两个关键用例。近年来，数据作为...

人工智能 2024-05-28 人工智能

852阅读

一文读懂本地运行 LLM 的优秀实践方法

Hello folks，我是 Luga，今天我们来聊一下人工智能(AI 生态领域相关的技术 - LLM -常见的本地运行 LLM 方法。众所周知，如今使用 ChatGPT 等大型模型工具变得异常简单，只需通过浏览器在线访问即可。然而，需要注意的是，...

大数据 2024-05-28 人工智能

830阅读

超牛ComfyUI节点AnyNode来了！要啥功能让AI帮你编写

AnyNode是ComfyUI中一个令人印象深刻的新节点，它利用了大型语言模型（LLMs）的能力，允许用户通过输入提示词来创建具有特定功能的节点。以下是AnyNode节点的主要特点和使用方法: 功能编写:AnyNode可以根据用户的要求编写Pytho...

人工智能 2024-05-28 人工智能

994阅读

什么是Token？为什么大模型要计算Token数

本文分享自华为云社区《【技术分享】什么是Token？为什么GPT基于Token定价》，作者：开天aPaaS小助手Tracy。在使用LLM大模型时，我们经常会遇到一个关键词，叫：Token。比如：最新版 GPT-4 Turbo 模型最高支持 12...

人工智能 2024-05-28 人工智能

1139阅读

从大模型（LLM）、检索增强生成（RAG）到智能体（Agent）的应用

引言随着人工智能技术的飞速发展，大型语言模型（LLM）、检索增强生成（RAG）和智能体（Agent）已经成为推动该领域进步的关键技术，这些技术不仅改变了我们与机器的交互方式，而且为各种应用和服务的开发提供了前所未有的可能性。正确理解这三者的概念及其之间...

人工智能 2024-05-28 人工智能

1027阅读

【AIGC调研系列】CogVLM2:第二代视觉大模型

CogVLM2是智谱AI推出的新一代多模态大模型，继承并优化了上一代模型的经典架构。CogVLM2采用了一个拥有50亿参数的强大视觉编码器，并创新性地在大语言模型中整合了一个70亿参数的视觉专家模块[1]。这一设计使得CogVLM2在视觉和语言理解方面实现...

人工智能 2024-05-28 人工智能

1671阅读

百度文心一言用户破 2 亿，李彦宏：文心大模型已成中国最领先的 AI 基础模型

过去，开发者用代码来改变世界，未来，自然语言将成为通用的编程语言。用代码书写历史的程序员会被 AI 取代吗？一个全知全能的大模型能适配一切吗？大模型成本过高怎么办？在这个 AI 时代，什么样的工具才能被称为最好用的工具？这些问题，并非空中楼阁，而是...

AIGC 2024-05-28 人工智能

895阅读

如何在本地搭建集成大语言模型Llama 2的聊天机器人并实现无公网IP远程访问

文章目录 1. 拉取相关的Docker镜像 2. 运行Ollama 镜像 3. 运行Chatbot Ollama镜像 4. 本地访问 5. 群晖安装Cpolar 6. 配置公网地址 7. 公网访问 8. 固定公网地址随着ChatGPT...

AIGC 2024-05-28 人工智能

1063阅读

ChatGPT如何「思考」？心理学和神经科学破解AI大模型，Nature发文

美国东北大学的计算机科学家 David Bau 非常熟悉这样一个想法：计算机系统变得如此复杂，以至于很难跟踪它们的运行方式。「我做了 20 年的软件工程师，研究非常复杂的系统。这个问题总是存在的。」Bau 说。但 Bau 说，使用传统软件，具有内部知...

人工智能 2024-05-27 人工智能

851阅读

LLaMA-Factory+qwen多轮对话微调测评

目录训练的时间和效果数据准备数据样例数据配置环境搭建模型微调训练模型预测运行成功的web UI LLaMA-Factory地址：https://github.com/hiyouga/LLaMA-Factory/blo...

大数据 2024-05-27 人工智能

1586阅读

GPT-4被证实具有「人类心智」登Nature！AI比人类更好察觉讽刺和暗示

AI发展到今天，其智能水平与人类相比已经不遑多让了，没有一个人可以像AGI一样「包罗万象、吐纳自如」。这个时候，我们如何还能守住人之为人的尊严？有的人说，至少人类是社会性的存在，我们可以听得懂同类的「弦外之音」，可以与他人产生共情，而机器是冰冷的。...

生成式AI 2024-05-27 人工智能

976阅读

一文读懂 Arthur Bench LLM 评估框架

Hello folks，我是 Luga，今天我们来聊一下人工智能(AI 生态领域相关的技术 - LLM 评估。众所周知，LLM 评估是人工智能领域的一个重要议题。随着 LLM 在各个场景中的广泛应用,评估它们的能力和局限性变得越来越重要。作为一款新兴...

生成式AI 2024-05-27 人工智能

825阅读

全面超越DPO：陈丹琦团队提出简单偏好优化SimPO，还炼出最强8B开源模型

为了将大型语言模型（LLM）与人类的价值和意图对齐，学习人类反馈至关重要，这能确保它们是有用的、诚实的和无害的。在对齐 LLM 方面，一种有效的方法是根据人类反馈的强化学习（RLHF）。尽管经典 RLHF 方法的结果很出色，但其多阶段的过程依然带来了一些...

大数据 2024-05-27 人工智能

878阅读

港大字节提出多模态大模型新范式，模拟人类先感知后认知，精确定位图中物体

当前，多模态大模型（MLLM）在多项视觉任务上展现出了强大的认知理解能力。然而大部分多模态大模型局限于单向的图像理解，难以将理解的内容映射回图像上。比如，模型能轻易说出图中有哪些物体，但无法将物体在图中准确标识出来。定位能力的缺失直接限制了多模态...

AIGC 2024-05-27 人工智能

854阅读

模块化重构LLaVA，替换组件只需添加1-2个文件，开源TinyLLaVA Factory来了

TinyLLaVA 项目由清华大学电子系多媒体信号与智能信息处理实验室 (MSIIP 吴及教授团队和北京航空航天大学人工智能学院黄雷老师团队联袂打造。清华大学 MSIIP 实验室长期致力于智慧医疗、自然语言处理与知识发现、多模态等研究领域。北航团队长期...

人工智能 2024-05-27 人工智能

986阅读

CoT提出者Jason Wei：大模型评估基准的「七宗罪」

在 CV 领域，研究者一直把李飞飞等人创建的 ImageNet 奉为模型在下游视觉任务中能力的试金石。在大模型时代，我们该如何评估 LLM 性能？现阶段，研究者已经提出了诸如 MMLU、GSM8K 等一些评估基准，不断有 LLM 在其上刷新得分。但这...

生成式AI 2024-05-27 人工智能

790阅读

LLaMA-Factory微调LLama2

LLaMA-Factory(0.6.2版本微调LLama2 1.下载安装 git clone https://github.com/hiyouga/LLaMA-Factory.git cd LLaMA-Factory pip install -e...

生成式AI 2024-05-27 人工智能

1047阅读

芝大论文证明GPT-4选股准确率高达60%，人类股票分析师要下岗？AI大牛质疑数据污染

最近，各位业内大咖都被芝大的一篇论文震惊了。研究者发现，由GPT-4帮忙选择的股票，直接击败了人类！同时也pk掉了许多其他针对金融训练的机器学习模型。最让他们震惊的是，LLM可以在没有任何叙述上下文的情况下，就成功分析财务报表中的数字！图片论文地...

生成式AI 2024-05-27 人工智能

874阅读

只需单卡RTX 3090，低比特量化训练就能实现LLaMA-3 8B全参微调

自 2010 年起，AI 技术历经多个重大发展阶段，深度学习的崛起和 AlphaGo 的标志性胜利显著推动了技术前进。尤其是 2022 年底推出的 ChatGPT，彰显了大语言模型（LLM）的能力达到了前所未有的水平。自此，生成式 AI 大模型迅速进入高...

AIGC 2024-05-27 人工智能

800阅读

自定义数据集使用llama_factory微调模型并导入ollama

本文所有操作均在linux系统下完成 llama_factory安装参考github的安装命令 git clone https://github.com/hiyouga/LLaMA-Factory.git conda create -n llama...

生成式AI 2024-05-27 人工智能

2134阅读

NL2SQL进阶系列(3)：Data-Copilot、Chat2DB、Vanna Text2SQL优化框架开源应用实践详解[Text2SQL]

NL2SQL进阶系列(3 ：Data-Copilot、Chat2DB、Vanna Text2SQL优化框架开源应用实践详解[Text2SQL] NL2SQL基础系列(1 ：业界顶尖排行榜、权威测评数据集及LLM大模型（Spider vs BIRD）全面...

生成式AI 2024-05-27 人工智能

1078阅读

谷歌 CEO 承认 AI 摘要功能存在“幻觉”问题：尚无解决方案

5 月 26 日消息，谷歌搜索新推出的“AI 摘要（AI Overviews）”功能近日备受诟病，原因是该功能经常提供严重错误的搜索结果信息，例如，该功能曾建议用户使用胶水来防止披萨上的奶酪滑落。本周早些时候，据科技媒体 The Verge 报道，谷...

人工智能 2024-05-27 人工智能

756阅读

教程：利用LLaMA_Factory微调llama3:8b大模型

一、安装llama模型文件下载地址（魔塔）：https://modelscope.cn/models/LLM-Research/Meta-Llama-3-8B-Instruct/files 点击下载模型，复制git命令： git clone htt...

AIGC 2024-05-27 人工智能

1738阅读

Meta LlaMA 3模型深度解析

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 拉玛的故事 “在安第斯山脉崎岖的山区，生活着三种非常美丽的生物——里约、洛基和塞拉。它们有着光泽的皮毛和闪闪发光的眼睛，是力量和韧性的...

大数据 2024-05-27 人工智能

887阅读

为何说小语言模型是AI界的下一大热门？

译者 | 布加迪审校 | 重楼在AI领域，科技巨头们一直在竞相构建越来越庞大的语言模型，如今出现了一个令人惊讶的新趋势：小就是大。随着大语言模型（LLM）方面的进展出现了停滞的迹象，研究人员和开发人员日益开始将注意力转向小语言模型（SLM）。这种紧凑...

生成式AI 2024-05-27 人工智能

830阅读

LLM大模型推理加速实战：vllm、fastllm与llama.cpp使用指南

随着人工智能技术的飞速发展，大型语言模型（LLM）在诸如自然语言处理、智能问答、文本生成等领域的应用越来越广泛。然而，LLM模型往往具有庞大的参数规模，导致推理过程计算量大、耗时长，成为了制约其实际应用的关键因素。为了解决这个问题，一系列大模型推理加速工具...

生成式AI 2024-05-27 人工智能

1536阅读

在个人 Linux 机器 (GPU/CPU) 上本地运行 LLaMA-3(Docker+Ollama+Open WebUI+LLama3教程含详细步骤)

在当今快速发展的人工智能环境中，部署开源大型语言模型 (LLM 通常需要复杂的计算基础设施。然而，Ollama 的创新平台正在改变这一规范，支持在标准个人计算机上使用这些强大的模型，支持CPU和GPU配置。本指南介绍了如何使用 Ollama 在您自己的设...

大数据 2024-05-27 人工智能

1590阅读

Shortened LLaMA：针对大语言模型的简单深度剪枝法

? CSDN 叶庭云：https://yetingyun.blog.csdn.net/ 论文标题 & 发表会议：Shortened LLaMA: A Simple Depth Pruning for Large Language Model...

生成式AI 2024-05-27 人工智能

1056阅读

MacOS使用ollama部署codellama+openui以及llama.cpp部署

现在AI这么火，你是不是也渴望能够在本地部署并运行属于自己的大模型，然而，高昂的硬件成本又往往成了一大障碍，限制了你继续在AI领域去探索和创新。如果告诉你，无需换电脑，无需额外花钱买GPU或换显卡，你现在的电脑就可以本地跑一些大模型，那将是多么酷的一...

大数据 2024-05-27 人工智能

1664阅读

Llama模型下载

最近llama模型下载的方式又又变了，所以今天简单更新一篇文章，关于下载的，首先上官网，不管在哪里下载你都要去官网登记一下信息：https://llama.meta.com/llama2 然后会出现下面的信息登记网页：我这里因为待业所以or...

大数据 2024-05-26 人工智能

1096阅读

AI大模型日报#0418：Stable Diffusion 3开放API、Meta新研究让AI Agent理解物理世界

导读：欢迎阅读《AI大模型日报》，内容基于Python爬虫和LLM自动生成。目前采用“文心一言”生成了每条资讯的摘要。标题: 微软刚发布了VASA-1 这个人工智能可以让单张图像具有生动的说话和歌唱能力摘要: 微软发布了VASA-1人工智能，...

生成式AI 2024-05-26 人工智能

964阅读

如何本地运行Llama 2大语言模型并实现无公网IP远程访问

文章目录 1. 拉取相关的Docker镜像 2. 运行Ollama 镜像 3. 运行Chatbot Ollama镜像 4. 本地访问 5. 群晖安装Cpolar 6. 配置公网地址 7. 公网访问 8. 固定公网地址随着ChatGPT...

AIGC 2024-05-26 人工智能

894阅读

llama-factory SFT系列教程 (二)，大模型在自定义数据集 lora 训练与部署

文章目录简介支持的模型列表 2. 添加自定义数据集 3. lora 微调 4. 大模型 + lora 权重，部署问题参考资料简介文章列表： llama-factory SFT系列教程 (一，大模型 API 部署与...

AIGC 2024-05-26 人工智能

1249阅读

Llama 3大模型发布！快速体验推理及微调

Meta，一家全球知名的科技和社交媒体巨头，在其官方网站上正式宣布了一款开源的大型预训练语言模型——Llama-3。据了解，Llama-3模型提供了两种不同参数规模的版本，分别是80亿参数和700亿参数。这两种版本分别针...

大数据 2024-05-26 人工智能

1127阅读

llama-factory SFT系列教程 (一)，大模型 API 部署与使用

文章目录背景简介难点前置条件 1. 大模型 api 部署下一步阅读背景本来今天没有计划学 llama-factory，逐步跟着github的文档走，发现这框架确实挺方便，逐渐掌握了一些。最近想使用 SFT 微调大模...

AIGC 2024-05-26 人工智能

1977阅读