llama 第30页 - AIGC资讯

摆脱依赖NVIDIA！Meta第二代自研AI芯片正式投产

快科技2月11日消息，据媒体报道，Meta第二代自研AI芯片Artemis今年正式投产。据了解，新的芯片将被应用于数据中心的推理任务，与英伟达等供应商的GPU一起协同工作。 Meta发言人之前表示：我们相信，我们自主开发的加速器将与市面上的GPU相得益彰...

人工智能 2024-02-11 人工智能

550阅读

上海人工智能实验室发布LLaMA-Adapter | 如何1小时训练你的多模态大模型用于下游任务

本文首发于微信公众号 CVHub，未经授权不得以任何形式售卖或私自转载到其它平台，违者必究！ Title: LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-...

人工智能 2024-02-11 人工智能

780阅读

微软开源 SliceGPT:大模型体量压缩25%左右，性能保持不变

微软和苏黎世联邦理工学院的研究人员联合开源了 SliceGPT，该技术可以极限压缩大模型的权重矩阵，将模型体量压缩25% 左右，同时保持性能不变。实验数据显示，在保持零样本任务性能的情况下，SliceGPT 成功应用于多个大型模型，如 LLAMA-270B...

AIGC 2024-02-11 人工智能

564阅读

【Unity】如何在Unity里使用文心一言AI

想要使用文心一言，首先要登录百度智能云千帆控制台 https://cloud.baidu.com/product/wenxinworkshop?track=developer_qianfan_tanchuang 1.在控制台找到应用接入 - 然后点...

生成式AI 2024-02-11 人工智能

791阅读

WhisperBot：整合了Mistral大型语言模型的实时语音转文本系统

项目简介欢迎来到 WhisperBot。WhisperBot 基于 WhisperLive 和 WhisperSpeech 的功能而构建，在实时语音到文本管道之上集成了大型语言模型 Mistral (LLM 。WhisperLive 依赖于 OpenA...

AIGC 2024-02-11 人工智能

832阅读

羊驼2:开放的基础和微调聊天模型--Llama 2论文阅读

论文地址：https://arxiv.org/pdf/2307.09288.pdfd 代码地址：GitHub - facebookresearch/llama-recipes: Examples and recipes for Llama 2 model...

大数据 2024-02-10 人工智能

1275阅读

详解各种LLM系列｜LLaMA 1 模型架构、预训练、部署优化特点总结

作者 | Sunnyyyyy 整理 | NewBeeNLP https://zhuanlan.zhihu.com/p/668698204 后台留言『交流』，加入 NewBee讨论组 LLaMA 是Meta在2...

生成式AI 2024-02-10 人工智能

1478阅读

Llama-7b-hf和vicuna-7b-delta-v0合并成vicuna-7b-v0

最近使用pandagpt需要vicuna-7b-v0，重新过了一遍，前段时间部署了vicuna-7b-v3，还是有不少差别的，transforms和fastchat版本更新导致许多地方不匹配，出现很多错误，记录一下。更多相关内容可见Fastchat实战...

AIGC 2024-02-10 人工智能

841阅读

中文LLaMa和Alpaca大语言模型开源方案 | 扩充中文词表 & 针对中文语料进行高效编码

欢迎关注『CVHub』官方微信公众号！ Title: Efficient and Effective Text Encoding for Chinese Llama and AlpacaPDF: https://arxiv.org/pdf/23...

大数据 2024-02-10 人工智能

659阅读

Could not build wheels for llama-cpp-python, which is required to install pyproject.toml-based proj

安装llama-cpp-python包时，出现下述问题： Collecting llama-cpp-python Using cached llama_cpp_python-0.2.28.tar.gz (9.4 MB Installing bu...

AIGC 2024-02-09 人工智能

1166阅读

使用 Amazon SageMaker 和 Amazon CodeWhisperer，解锁数据见解

关键字: [Amazon Web Services re:Invent 2023, Amazon Kendra, Generative Ai, Amazon Sagemaker, Amazon Kendra, Amazon Bedrock, Vector...

大数据 2024-02-09 人工智能

638阅读

llama/llama2论文解读

llama 摘要 llama在约1.4T的token上，训练出参数量7B到65B的模型，其模型规模如下在仅使用开源数据集的情况下，llama-13B在多数benchmarks上与GPT-3效果相当；llama-65B也与最好的模型（Chin...

AIGC 2024-02-09 人工智能

947阅读

每周AI新闻（2024年第3周）Meta研发Llama 3 | 苹果Vision Pro预售 | 智谱AI发布GLM-4

我是陌小北，一个正在研究硅基生命的、有趣儿的碳基生命。每周日20:00，准时解读每周AI大事件。大厂动向【1】Meta研发Llama 3，构建开源AGI Meta公司CEO马克·扎克伯格（Mark Zuckerberg）=宣布公司将对两个关键A...

AIGC 2024-02-09 人工智能

653阅读

2023年的深度学习入门指南(19) - LLaMA 2源码解析

2023年的深度学习入门指南(19 - LLaMA 2源码解析上一节我们学习了LLaMA 2的补全和聊天两种API的使用方法。本节我们来看看LLaMA 2的源码。补全函数text_completion源码解析上一节我们讲了LLaMA 2的...

大数据 2024-02-09 人工智能

779阅读

（2023.12.6）解决部署privateGPT中，安装依赖llama-cpp-python失败。

问题描述-1（gcc编译器问题） CMake Error: CMAKE_C_COMPILER not set, after EnableLanguage CMake Error: CMAKE_CXX_COMPILER not set, after E...

生成式AI 2024-02-09 人工智能

819阅读

本地运行LlaMA 2的简易指南

大家好，像LLaMA 2这样的新开源模型已经变得相当先进，并且可以免费使用。可以在商业上使用它们，也可以根据自己的数据进行微调，以开发专业版本。凭借其易用性，现在可以在自己的设备上本地运行它们。本文将介绍如何下载所需的文件和LLaMA 2模型，以运行C...

人工智能 2024-02-09 人工智能

859阅读

【candle】（2）：使用hf-mirror镜像下载TheBloke/Llama-2-7B-GGML的q4_0.bin文件，并设置HF_HOME，example模块可以识别下载的模型

1，视频演示地址 https://www.bilibili.com/video/BV1Dc41117wT/?vd_source=4b290247452adda4e56d84b659b0c8a2 【candle】（2）：使用hf-mir...

生成式AI 2024-02-08 人工智能

997阅读

无需RLHF显著提升GPT-4/Llama2性能，北大团队提出Aligner对齐新范式

背景大语言模型（LLMs）虽展现出了强大的能力，但也可能产生不可预测和有害的输出，例如冒犯性回应、虚假信息和泄露隐私数据，给用户和社会造成伤害。确保这些模型的行为与人类意图和价值观相对齐，是一个紧迫的挑战。尽管基于人类反馈的强化学习（RLHF）提供了...

AIGC 2024-02-07 人工智能

634阅读

三个Agent顶个GPT-4，基于开源小模型的那种

真·“三个臭皮匠，顶个诸葛亮”—— 基于开源小模型的三个Agent协作，比肩GPT-4的工具调用效果！话不多说，直接来看两个系统执行记录。用户表示自己是一个音乐爱好者，想探索不同的音乐流派以及音乐家。于是指定模型使用Deezer和Shazam的API...

AIGC 2024-02-07 人工智能

622阅读

7B开源数学模型干翻千亿GPT-4，中国团队出品

7B开源模型，数学能力超过了千亿规模的GPT-4！它的表现可谓是突破了开源模型的极限，连阿里通义的研究员也感叹缩放定律是不是失效了。无需借助任何外部工具，它就能在竞赛水平的MATH数据集上达到51.7%的准确率。在开源模型中，它第一个在该数据集上...

人工智能 2024-02-07 人工智能

663阅读

在2GB DAYU200上本地部署大语言模型

实现思路和步骤移植轻量级LLM模型推理框架InferLLM到OpenHarmony标准系统，编译出能在OpenHarmony运行的二进制产物。（InferLLM 是一个简单高效的 LLM CPU 推理框架，可以本地部署 LLM 中的量化模型）使用O...

大数据 2024-02-07 人工智能

645阅读

近屿智能引领行业前沿，精心打造AIGC大模型工程师和产品经理的进阶之路（附完整版学习路径图）

近屿智能，倾力打造了一套独特的AIGC大模型工程师和产品经理学习路径图。该路径图清晰地展示了从初学者到专家水平的技能进阶过程，为工程师和产品经理提供了明确的学习目标和成长路径。这套学习路径图适用于不同背景和经验的学习者，无论您是初涉AIGC领域的新...

AIGC 2024-02-07 人工智能

941阅读

大语言模型之LlaMA系列- LlaMA 2及LLaMA2_chat(上)

LlaMA 2是一个经过预训练与微调的基于自回归的transformer的LLMs，参数从7B至70B。同期推出的Llama 2-Chat是Llama 2专门为对话领域微调的模型。在许多开放的基准测试中Llama 2-Chat优于其他开源的聊天模型，此外...

生成式AI 2024-02-07 人工智能

1174阅读

通义千问再开源，Qwen1.5带来六种体量模型，性能超越GPT3.5

赶在春节前，通义千问大模型（Qwen）的 1.5 版上线了。今天上午，新版本的消息引发了 AI 社区关注。新版大模型包括六个型号尺寸：0.5B、1.8B、4B、7B、14B 和 72B，其中最强版本的性能超越了 GPT 3.5、Mistral-Medi...

大数据 2024-02-06 人工智能

959阅读

MedicalGPT：基于LLaMA-13B的中英医疗问答模型（LoRA）、实现包括二次预训练、有监督微调、奖励建模、强化学习训练[LLM:含Ziya-LLaMA]。

项目设计集合（人工智能方向）：助力新人快速实战掌握技能、自主完成项目设计升级，提升自身的硬实力（不仅限NLP、知识图谱、计算机视觉等领域）：汇总有意义的项目设计集合，助力新人快速实战掌握技能，助力用户更好利用 CSDN 平台，自主完成项目设计升级，提升自身...

生成式AI 2024-02-06 人工智能

702阅读

向完全自主性更进一步，清华、港大全新跨任务自我进化策略让智能体学会「以经验为鉴」

「以史为鉴，可以知兴替。」人类的进步史，可以看作是一个不断吸取过去经验、不断推进能力边界的自我演化过程。在这个过程中，我们吸取过去失败的教训以纠正错误，借鉴成功的经验以提升效率和效果。这种自我进化的过程在我们的生活中无所不在：从如何总结经验以更好地解决...

人工智能 2024-02-06 人工智能

528阅读

LLaVA：GPT-4V(ision) 的开源替代品

LLaVA（大型语言和视觉助理）（链接：：https://llava-vl.github.io/）是一个很有前途的开源生成式人工智能模型，它复制了OpenAI GPT-4在图像转换方面的一些功能。用户可以将图像添加到LLaVA聊天对话中，允许讨论这些图像...

生成式AI 2024-02-06 人工智能

744阅读

月之暗面 Moonshot AI 开放平台启动公开测试

月之暗面 Moonshot AI 开放平台正式启动了公开测试，这一重要进展标志着所有开发者都能够开始利用这一平台。此前，该平台已经历了一段时间的内测阶段。现在，开发者们只需访问 platform.moonshot.cn，便能创建自己的 API Key，进...

人工智能 2024-02-06 人工智能

972阅读

无需GPU，手机芯片也能运行多模态模型！面壁智能发布MiniCPM，性能超过Mistral-7B！

2月1日,面壁智能发布了旗舰端侧模型 MiniCPM，它以小博大的性能超越了 Mistral-7B，并在 MT-Bench 等榜单上表现出色。 MiniCPM 是一款能说会看、具备编程能力、拥有多模态能力的端侧模型。它不仅在性能上优秀，而且具有极低的成本...

人工智能 2024-02-05 人工智能

1156阅读

ChatGPT论文：大语言模型LLM之战:Dolly、LLaMA 、Vicuna、Guanaco、Bard、ChatGPT--在自然语言转SQL(NL2SQL、Text-to-SQL)的比较（一）

摘要 ChatGPT的成功引发了一场AI竞赛，研究人员致力于开发新的大型语言模型（LLMs），以匹敌或超越商业模型的语言理解和生成能力。近期，许多声称其性能接近GPT-3.5或GPT-4的模型通过各种指令调优方法出现了。作为文本到SQL解析的从业者，我...

大数据 2024-02-05 人工智能

793阅读

大模型系列——解读RAG

RAG 是2023年最流行的基于 LLM 的应用系统架构。有许多产品几乎完全建立在 RAG 之上，覆盖了结合网络搜索引擎和 LLM 的问答服务，到成千上万个数据聊天的应用程序。很多人将RAG和Agent 作为大模型应用的两种主流架构，但什么是RAG呢？R...

生成式AI 2024-02-05 人工智能

1799阅读

比OpenAI官方提示词指南更全，这26条黄金准则让LLM性能飙升50%以上

论文地址: https://arxiv.org/abs/2312.16171 Github地址: https://github.com/VILA-Lab/ATLAS 论文标题：Principled Instructions Are All You...

大数据 2024-02-05 人工智能

670阅读

ChatLaw：基于LLaMA微调的法律大模型

文章目录动机数据组成模型框架模型评估北大团队发布首个的中文法律大模型落地产品ChatLaw，为大众提供普惠法律服务。模型支持文件、语音输出，同时支持法律文书写作、法律建议、法律援助推荐。 github地址：https://g...

大数据 2024-02-05 人工智能

1130阅读

如何使用单个指令微调GPT-3.5或Llama 2

由于在各种任务中的通用性，像ChatGPT和Llama 2这样的大型语言模型(LLM 广受欢迎。然而，有些应用程序需要使用自定义数据对这些模型进行微调，以获得更好的性能。不幸的是，针对特定应用程序对大型语言模型(LLM 进行微调通常是复杂和令人沮丧的...

生成式AI 2024-02-05 人工智能

618阅读

Eagle7B: 基于RWKV-v5架构、跨足100多种语言的7.52B参数AI模型

随着人工智能的发展，大型语言模型在各个领域开始受到广泛关注和应用。这些模型在数十亿级别的数据规模上进行训练，涵盖了健康、金融、教育、娱乐等多个领域，从自然语言处理和翻译到其他任务都发挥着重要作用。最近，研究人员开发了Eagle7B，这是一个具有惊人75...

大数据 2024-02-05 人工智能

561阅读

超简单，不用GPU，3步教你轻松在笔记本上部署聊天大模型 LLaMA

大家好啊，我是董董灿。今天带大家在自己的电脑(笔记本上部署一个类似于 chatGPT 的 AI 聊天大模型。部署完之后，你就拥有了一个私人 AI 聊天机器人，无需联网，随时进行实时对话。 0. 简单说下背景大模型我们都不陌生了，但是以...

AIGC 2024-02-05 人工智能

803阅读

NLP国内外大模型汇总列表[文心一言、智谱、百川、星火、通义千问、盘古等等]

国内外大模型汇总列表中国大模型列表大全，全面收集有明确来源的大模型情况，包括机构、来源信息和分类等，随时更新。 Awesome family related to LLMS includes: https://github.com/wgwang...

大数据 2024-02-04 人工智能

1011阅读

【部署LLaMa到自己的Linux服务器】

部署LLaMa到自己的Linux服务器一、官方方法（知道就好，具体操作用不上这个） 1、Llama2 项目获取方法1：有git可以直接克隆到本地方法2：直接下载 2、LLama2 项目部署 3、申请Llama2许可 4、下载模型权重...

生成式AI 2024-02-04 人工智能

1155阅读

打破MoE训练效率与性能瓶颈，华为盘古稀疏大模型全新架构LocMoE出炉

2023 年 12 月，首个开源 MoE 大模型 Mixtral 8×7B 发布，在多种基准测试中，其表现近乎超越了 GPT-3.5 和 LLaMA 2 70B，而推理开销仅相当于 12B 左右的稠密模型。为进一步提升模型性能，稠密 LLM 常由于其参数...

生成式AI 2024-02-04 人工智能

621阅读

开源版GPTs人人免费用！Hugging Face发布定制个人助手，点两下轻松创建

去年，OpenAI发布GPTs之后，短短几个月，全网诞生了300万+个GPT。而现在，「开源低配版」的GPTs来了！最近，世界最大的开源社区Hugging Face推出了开源、可定制的AI 助手——Hugging Chat Assistants。图...

人工智能 2024-02-04 人工智能

749阅读

抱抱脸正面挑战OpenAI，推出开源版GPT商店！完全免费、支持六大开源模型当底座

OpenAI的GPT商店有开源平替了—— 来自抱抱脸（Hugging Face）。它新推出的“Hugging Chat Assistant”，也瞄准了让用户免费制定自定义聊天机器人。图片是的，完全免费，无需像OpenAI那样不开会员就被拒之门外。...

生成式AI 2024-02-04 人工智能

681阅读

大模型没有护城河？OpenAI的“LLM城池”如何攻破，如何防守

作者 | Ben Dickson 译者 | 李睿审校 | 重楼出品 | 51CTO技术栈（微信号：blog51cto）小模型、开源模型正在猛攻GPT-4，OpenAI需要更完善的措施来构建技术方面的护城河，以保护其LLM业务。 2023年5月，...

生成式AI 2024-02-04 人工智能

634阅读

开源AI拯救Meta一夜飙升1960亿刀，39岁小扎爬出元宇宙深坑！年分红7个亿，靠Llama赢麻了

谁能想到，把小扎从元宇宙的泥坑里拯救出来的，竟然是开源AI？在Facebook 20周年之际，Meta在2月4日公布了季度报告后，市值瞬间飙涨1900亿美元。同时，这张图片也开始在网上疯传。可以看到，小扎狂砸300亿美元做的元宇宙，把Meta的股价...

生成式AI 2024-02-04 人工智能

578阅读

史上首个100%开源大模型重磅登场！破纪录公开代码/权重/数据集/训练全过程，AMD都能训

多年来，语言模型一直是自然语言处理（NLP）技术的核心，考虑到模型背后的巨大商业价值，最大最先进的模型的技术细节都是不公开的。现在，真·完全开源的大模型来了！来自艾伦人工智能研究所、华盛顿大学、耶鲁大学、纽约大学和卡内基梅隆大学的研究人员，联合发表了...

人工智能 2024-02-04 人工智能

549阅读

图领域首个通用框架来了！入选ICLR'24 Spotlight，任意数据集、分类问题都可搞定

能不能有一种通用的图模型—— 它既能够根据分子结构预测毒性，又能够给出社交网络的朋友推荐？或者既能预测不同作者的论文引用，还可以发现基因网络中的人类衰老机制？你还真别说，被ICLR 2024接收为Spotlight的“One for All（OFA）...

生成式AI 2024-02-04 人工智能

622阅读

匿名论文提出奇招，增强大模型长文本能力居然还能这么做

一提到提高大模型长文本能力，就想到长度外推或者上下文窗口扩展? 不行，这些都太费硬件资源了。来看一个奇妙新解: 和长度外推等方法使用KV缓存的本质不同，它用模型的参数来存储大量上下文信息。具体办法就是建一个临时Lora模块，让它仅在长文本生成过程中“流...

生成式AI 2024-02-04 人工智能

582阅读

详解“小而优”的大语言模型Zephyr 7B

Zephyr是Hugging Face发布的一系列大语言模型，使用蒸馏监督微调(dSFT 在更庞大的模型上进行训练，显著提高了任务准确性。 2023年是属于大语言模型(LLM 和开源的一年。许多初创公司和企业开放了模型和权重的源代码，以应对ChatGPT...

人工智能 2024-02-04 人工智能

615阅读

像人类一样在批评中学习成长，1317条评语让LLaMA2胜率飙升30倍

现有的大模型对齐方法包括基于示例的监督微调（SFT）和基于分数反馈的强化学习（RLHF）。然而，分数只能反应当前回复的好坏程度，并不能明确指出模型的不足之处。相较之下，我们人类通常是从语言反馈中学习并调整自己的行为模式。就像审稿意见不仅仅是一个分数，还包...

人工智能 2024-02-04 人工智能

586阅读

基于LLaMA Factory，单卡3小时训练专属大模型 Agent

大家好，今天给大家带来一篇 Agent 微调实战文章 Agent（智能体）是当今 LLM（大模型）应用的热门话题 [1]，通过任务分解（task planning）、工具调用（tool using）和多智能体协作（multi-agent cooperat...

大数据 2024-02-03 人工智能

1140阅读

LLaMA、Baichuan、ChatGLM、Qwen、天工等大模型对比

12.10更新：Qwen技术报告核心解读 Baichuan Baichuan 2: Open Large-scale Language Models 数据处理：数据频率和质量，使用聚类和去重方法，基于LSH和dense embedding方...

大数据 2024-02-03 人工智能

1637阅读