llama 第43页 - AIGC资讯

Windows10上使用llama-recipes(LoRA)来对llama-2-7b做fine-tune

刚刚在Windows10上搭建环境来对llama2做finetune，里面坑还是挺多的，这里把印象中的坑整理了一下以作备忘。 llama-recipes是meta的开源项目，Github地址为：GitHub - facebookresearch/llam...

大数据 2023-11-09 人工智能

803阅读

百度智能云：千帆大模型平台接入Llama 2等33个大模型，上线103个Prompt模板

大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机...

大数据 2023-11-09 人工智能

919阅读

ChatGPT 挂了一整天了，已经习惯了用大模型的我怎么办

OpenAI 挂了，已经习惯了用大模型的我怎么办 OpenAI 挂了，急，在线等。你是不是已经习惯了 ChatGPT 的存在？是不是感觉离了 ChatGPT 寸步难行，很难再进行自己的工作？今天 ChatGPT 大面积宕机，服务直到文章发布（下午5点...

大数据 2023-11-09 人工智能

1033阅读

开启想象翅膀：轻松实现文本生成模型的创作应用，支持LLaMA、ChatGLM、UDA、GPT2、Seq2Seq、BART、T5、SongNet等模型，开箱即用

开启想象翅膀：轻松实现文本生成模型的创作应用，支持LLaMA、ChatGLM、UDA、GPT2、Seq2Seq、BART、T5、SongNet等模型，开箱即用 TextGen: Implementation of Text Generation...

生成式AI 2023-11-09 人工智能

765阅读

【AIGC】Baichuan2-13B-Chat模型微调

环境微调框架：LLaMA-Efficient-Tuning 训练机器：4*RTX3090TI (24G显存 python环境：python3.8, 安装requirements.txt依赖包一、Lora微调 1、准备数据集 2、训...

大数据 2023-11-09 人工智能

831阅读

ChatGPT开源平替(2)llama

最近，FacebookResearch 开源了他们最新的大语言模型 LLaMA，训练使用多达14,000 tokens 语料，包含不同大小参数量的模型 7B、13B 、30B、 65B，研究者可以根据自身算力配置进行选择。 ...

大数据 2023-11-09 人工智能

826阅读

大模型使用——超算上部署LLAMA-2-70B-Chat

大模型使用——超算上部署LLAMA-2-70B-Chat 前言1、本机为Inspiron 5005，为64位，所用操作系统为Windos 10。超算的操作系统为基于Centos的linux，GPU配置为A100，所使用开发环境为Anaconda。2、...

AIGC 2023-11-09 人工智能

855阅读

大模型走捷径「刷榜」？数据污染问题值得重视

生成式 AI 元年，大家的工作节奏快了一大截。特别是，今年大家都在努力卷大模型：最近国内外科技巨头、创业公司都在轮番推出大模型，发布会一开，个个都是重大突破，每一家都是刷新了重要 Benchmark 榜单，要么排第一，要么第一梯队。在兴奋于技术进展速...

AIGC 2023-11-09 人工智能

711阅读

Meta最新模型LLaMA细节与代码详解

Meta最新模型LLaMA细节与代码详解 0. 简介 1. 项目环境依赖 2. 模型细节 2.1 RMS Pre-Norm 2.2 SwiGLU激活函数 2.3 RoPE旋转位置编码 3. 代码解读 3.1 tokenizer 3.2 m...

人工智能 2023-11-09 人工智能

829阅读

大模型勇闯洛圣都，加封「GTA五星好市民」！南洋理工、清华等发布视觉可编程智能体Octopus：打游戏、做家务全能干

随着游戏制作技术的不断发展，电子游戏已然成为现实世界的模拟舞台。以游戏《侠盗猎车手》（GTA）为例，在GTA的世界里，玩家可以以第一人称视角，在洛圣都（游戏虚拟城市）当中经历丰富多彩的生活。然而，既然人类玩家能够在洛圣都里尽情遨游完成若干任务，我们...

人工智能 2023-11-09 人工智能

925阅读

在等GPT-5多模态？试试Genmo！Adobe AI首轮内测报告；ChatGPT三条使用哲学与实践；论文追更与阅读神器 | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦！ ? 『微软 New Bing 引入广告』日活跃用户超1亿，探索广告投放的未来微软正在尝试在 New Bing 的聊天回复中投放广告。虽然广告被明确标...

生成式AI 2023-11-09 人工智能

885阅读

Hugging Face 的 H4 两人团队正在开发类似 ChatGPT 的人工智能聊天机器人

人工智能初创企业 Hugging Face 近日宣布，其由两人组成的 H4 团队正致力于开发工具和「配方」，以帮助 AI 社区构建类似于 ChatGPT 的人工智能聊天机器人。自 ChatGPT 发布以来，H4 团队的成立便是为了复制其功能，使用开源库和模...

AIGC 2023-11-09 人工智能

802阅读

Llama模型结构解析（源码阅读）

目录 1. LlamaModel整体结构流程图 2. LlamaRMSNorm 3. LlamaMLP 4. LlamaRotaryEmbedding 参考资料： https://zhuanlan.zhihu.com/p/636784...

大数据 2023-11-09 人工智能

1030阅读

IBM设立5亿美元风险基金用以投资AI初创公司

IBM宣布成立了一项5亿美元的企业AI风险基金，旨在投资各类人工智能公司，从初创企业到高增长企业不等。这一举措是IBM在人工智能领域的最新投资，旨在推动企业领域的生成式人工智能（GenAI）技术研究和发展。 IBM的企业AI风险基金的目标是加速企业领域的...

人工智能 2023-11-09 人工智能

836阅读

ChatGPT只算L1阶段，谷歌提出AGI完整路线图

AGI应该如何发展、最终呈什么样子？现在，业内第一个标准率先发布： AGI分级框架，来自谷歌DeepMind。该框架认为，发展AGI必须遵循6个基本原则：关注能力，而非过程同时衡量技能水平和通用性专注于认知和元认知任务关注最高潜力，而非...

生成式AI 2023-11-08 人工智能

746阅读

LLM - LLaMA-2 获取文本向量并计算 Cos 相似度

目录一.引言二.获取文本向量 1.hidden_states 与 last_hidden_states ◆ hidden_states ◆ last_hidden_states 2.LLaMA-2 获取 hidden_states ◆...

人工智能 2023-11-08 人工智能

1441阅读

LLMs：LLaMA Efficient Tuning(一款可高效微调【全参数/LoRA/QLoRA】主流大模型【ChatGLM-2/LLaMA-2/Baichuan等】的高效工具【预训练+指令监督微

LLMs：LLaMA Efficient Tuning(一款可高效微调【全参数/LoRA/QLoRA】主流大模型【ChatGLM-2/LLaMA-2/Baichuan等】的高效工具【预训练+指令监督微调+奖励模型训练+PPO 训练+DPO 训练】的简介、...

人工智能 2023-11-08 人工智能

1069阅读

中文大语言模型 Llama-2 7B（或13B）本地化部署（国内云服务器、GPU单卡16GB、中文模型、WEB页面TextUI、简单入门）

本文目的是让大家先熟悉模型的部署，简单入门；所以只需要很小的算力，单台服务器单GPU显卡（显存不低于12GB），操作系统需要安装 Ubuntu 18.04。 1 服务器&操作系统 1.1服务器的准备...

生成式AI 2023-11-08 人工智能

1362阅读

深度解析 Llama 2 的资源汇总：不容错过

“ 探索 Llama 2 背后的过程，包括了模型的全面解析，在线体验，微调，部署等，这份资源汇总将带您深入了解其内涵。” 01 — 周二发布了文章《中文大模型 Chinese-LLaMA-Alpaca-2 开源且可以商用》后，不少朋...

人工智能 2023-11-08 人工智能

936阅读

从科幻走向现实，LLM Agent 做到哪一步了？

LLM 洪流滚滚，AI 浪潮席卷全球，在这不断冲击行业认知的一年中，Agent 以冉冉新星之态引起开发者侧目。OpenAI 科学家 Andrej Karpathy 曾言“OpenAI 在大模型领域快人一步，但在 Agent 领域，却是和大家处在同一起跑线上...

AIGC 2023-11-08 人工智能

865阅读

文心一言Plugin实战来了，测试开发旅游攻略助手

刚刚过去的8月，百度WAVE SUMMIT 深度学习开发者大会上，重磅发布文心一言的五个原生插件：百度搜索、览卷文档（基于文档的交互）、E 言易图（数据洞察图表生成）、说图解画（基于图片的交互）、一镜流影（文字转视频）。我们知道大模型的训练过程一般...

人工智能 2023-11-08 人工智能

894阅读

【LLM】Windows本地CPU部署民间版中文羊驼模型（Chinese-LLaMA-Alpaca）踩坑记录

目录前言准备工作 Git Python3.9 Cmake 下载模型合并模型部署模型前言想必有小伙伴也想跟我一样体验下部署大语言模型, 但碍于经济实力, 不过民间上出现了大量的量化模型, 我们平民也能体验体验啦~...

生成式AI 2023-11-08 人工智能

932阅读

万万没想到，我用文心一言开发了一个儿童小玩具

最近关注到一年一度的百度世界大会今年将于10月17日在北京首钢园举办，本期大会的主题是“生成未来（PROMPT THE WORLD）”。会上，李彦宏会做主题为「手把手教你做AI原生应用」的演讲，比较期待 Robin 会怎么展示。据说，大会当天百度还会发布文...

人工智能 2023-11-08 人工智能

821阅读

GPT-4完成正确率仅6%！北大等提出首个「多轮、多模态」PPT任务完成基准PPTC

【新智元导读】为了填补LLM在复杂多模态环境中利用复杂工具完成多轮、多模态指令的评估空白，研究人员引入了PowerPoint任务完成（PPTC）基准测试，以评估LLM创建和编辑PPT文档的能力。最近对大型语言模型（例如ChatGPT和GPT-4）进行的评...

人工智能 2023-11-07 人工智能

814阅读

AI视野：OpenAI发布GPT-4Turbo；xAI推出PromptIDE工具；美团首个AI产品“Wow”亮相；百家号AI笔记功能将下线

???AI新鲜事 OpenAI发布GPT-4Turbo和自定义GPTs服务在OpenAI首届开发者大会DevDay活动上，OpenAI发布了GPT-4Turbo模型和自定义GPTs服务，以及其他新功能和API，如Assistants API和新的模态AP...

AIGC 2023-11-07 人工智能

771阅读

微软推出 “从错误中学习” 模型训练法，号称可“模仿人类学习过程，改善 AI 推理能力”

IT之家 11 月 7 日消息，微软亚洲研究院联合北京大学、西安交通大学等高校，提出了一项名为“从错误中学习（Learning from Mistake，LeMA）”的 AI 训练方法，号称可以通过模仿人类学习知识的过程，来改进 AI 推理能力。当下...

人工智能 2023-11-07 人工智能

743阅读

让大模型自主探索开放世界，北大&智源提出训练框架LLaMA-Rider

大语言模型因其强大而通用的语言生成、理解能力，展现出了成为通用智能体的潜力。与此同时，在开放式的环境中探索、学习则是通用智能体的重要能力之一。因此，大语言模型如何适配开放世界是一个重要的研究问题。北京大学和北京智源人工智能研究院的团队针对这个问题提出了...

人工智能 2023-11-07 人工智能

1113阅读

北大&智源提出训练框架LLaMA-Rider 让大模型自主探索开放世界

北京大学和北京智源人工智能研究院的团队提出了名为LLaMA-Rider的训练框架，旨在让大型语言模型在开放世界中具备自主探索和学习任务的能力。这个框架通过反馈-修改机制来实现主动探索，使模型在环境中接收反馈信息，不断调整决策，从而逐渐适应开放环境。项目...

人工智能 2023-11-07 人工智能

1048阅读

联发科发布天玑9300生成式AI移动芯片支持运行330亿参数大模型

昨日晚间，联发科技发布了天玑9300旗舰5G 生成式 AI 移动芯片，采用台积电第三代4nm 制程。该芯片预计于2023年底上市。这款芯片采用全大核架构设计，提供高智能、高性能、高能效、低功耗的特性，为用户带来卓越的生成式 AI 体验。天玑9300采...

AIGC 2023-11-07 人工智能

739阅读

让大模型忘记哈利波特，微软新研究上演Llama 2记忆消除术，真·用魔法打败魔法（doge）

最近微软一项研究让Llama 2选择性失忆了，把哈利波特忘得一干二净。现在问模型“哈利波特是谁？”，它的回答是这样婶儿的：木有赫敏、罗恩，木有霍格沃茨…… 要知道此前Llama 2的记忆深度还是很给力的，比如给它一个看似非常普通的提示“那年秋天，哈...

人工智能 2023-11-07 人工智能

672阅读

DB-GPT:使用专有LLM技术改变与数据库互操作的方式

DB-GPT是一个开源项目，旨在改变与数据库的互操作方式，它采用了本地化的大型GPT模型，为处理各种数据库相关情境提供了全面的解决方案。这个工具强调了隐私和数据安全，通过业务模块的定制化实施和分割，确保了LLM功能的完全机密性、安全性和可管理性。随着大...

AIGC 2023-11-06 人工智能

1102阅读

李开复带队创办！零一万物发布首款大模型Yi：号称世界最强

快科技11月6日消息，近日，创新工场董事长兼CEO李开复带队创办的AI大模型创业公司零一万物宣布，正式发布首款研发的最强开源人工智能大模型系列Yi。此次发布的首个公开版本共包括两款:Yi-6B和Yi-34B，其数据参数量分别为60亿和340亿，...

人工智能 2023-11-06 人工智能

758阅读

国内最大开源模型发布，无条件免费商用！参数650亿，基于2.6万亿token训练

国内规模最大的开源大模型来了：参数650亿、基于2.6-3.2万亿token训练。排名仅次于“猎鹰”和“羊驼”，性能媲美GPT3.5，现在就能无条件免费商用。它就是来自深圳元象公司的XVERSE。根据算力、资源限制和具体任务需求的不同，我们能对...

人工智能 2023-11-06 人工智能

766阅读

Together AI发布RedPajama v2：包内30万亿token数据集，用于训练大型语言模型

Together AI最近发布了RedPajama v2，这是一个庞大的在线数据集，包含了30万亿token，成为目前公开可用的最大数据集之一，专门用于学习型机器学习系统的培训。对于像Llama、Mistral、Falcon、MPT和RedPajama等...

人工智能 2023-11-06 人工智能

871阅读

李开复称其创立的AI公司零一万物估值已超10亿美元发布大模型Yi-34B

此前，李开复成立了一家初创公司，名为零一万物（01.AI），旨在为中国市场开发本土大型语言模型（LLM）。日前，李开复在接受采访时解释了创建零一万物的动机:“我认为需求是创新之母，在中国显然存在巨大的需求。与世界其他地方不同，中国无法使用OpenAI和Go...

AIGC 2023-11-06 人工智能

774阅读

中科院物理研究所等发布材料合成AI大语言模型MatChat

近期，中国科学院计算机网络信息中心人工智能部和物理研究所SF10组合作，通过使用来自400多万篇论文中提取的35675个无机材料固相反应合成过程，将数据处理为13878条高可信度的合成路径描述数据，并对开源大语言模型LLaMA2-7B进行微调训练，研发了专...

AIGC 2023-11-06 人工智能

705阅读

一篇学会大模型浪潮下的时间序列预测

今天跟大家聊一聊大模型在时间序列预测中的应用。随着大模型在NLP领域的发展，越来越多的工作尝试将大模型应用到时间序列预测领域中。这篇文章介绍了大模型应用到时间序列预测的主要方法，并汇总了近期相关的一些工作，帮助大家理解大模型时代时间序列预测的研究方法。...

人工智能 2023-11-06 人工智能

777阅读

20步内越狱任意大模型！更多“奶奶漏洞”全自动发现

1分钟不到、20步以内“越狱”任意大模型，绕过安全限制！而且不必知道模型内部细节—— 只需要两个黑盒模型互动，就能让AI全自动攻陷AI，说出危险内容。听说曾经红极一时的“奶奶漏洞”已经被修复了: 那么现在搬出“侦探漏洞”、“冒险家漏洞”、“作家漏...

AIGC 2023-11-05 人工智能

821阅读

字节“开盒”OpenAI所有大模型，揭秘GPT-3到GPT-4进化路径！把李沐都炸出来了

GPT-3究竟是如何进化到GPT-4的？字节给OpenAI所有大模型来了个“开盒”操作。结果还真摸清了GPT-4进化路上一些关键技术的具体作用和影响。比如： SFT是早期GPT进化的推动者帮助GPT提升编码能力的最大功臣是SFT和RLHF 在...

AIGC 2023-11-05 人工智能

760阅读

AI 模型的开源定义需要改变

你认为开源许可证应当进行演变吗？ 2023 年，我们以人工智能（AI）崭露头角开始了新的一年，同时也见证了众多公司全力以赴投身于 AI。比如说 Mozilla，它在 2023 年初制定了开源 AI 计划，以开发各种 AI 驱动的解决方案。而 Hug...

人工智能 2023-11-03 人工智能

720阅读

代码能力超越GPT-4，这个模型登顶Big Code排行榜，YC创始人点赞

一款号称代码能力超越GPT-4的模型，引发了不少网友的关注。准确率比GPT-4高出超过10%，速度却接近GPT-3.5，而且窗口长度也更长。据开发者描述，他们的模型取得了74.7%的Pass@1通过率，超过了原始GPT-4的67%，登上了Big C...

AIGC 2023-11-03 人工智能

792阅读

隐私浏览器Brave发布“匿名且安全”AI聊天机器人Leo 承诺不用户数据训练AI

隐私导向的浏览器Brave最近推出了名为Leo的本地AI助手，该公司声称相比其他AI聊天机器人服务，Leo提供了“无与伦比的隐私”。经过数月的测试，Leo现在可供所有运行浏览器版本1.60的Brave桌面用户免费使用，而且将在未来几个月内分阶段推出到An...

AIGC 2023-11-03 人工智能

719阅读

大模型: 模型大了难在哪里？

大家好，我是Tim。自从GPT模型诞生以来，其参数规模就在不停的扩大。但模型并非简单的直接变大，需要在数据、调度、并行计算、算法和机器资源上做相应的改变。今天就来总结下，什么是大模型，模型变大的难在哪里以及对于CV/NLP或者搜推广场景上有什么应对策...

人工智能 2023-11-03 人工智能

1526阅读

AI安全辩论：Sam Altman剑桥演讲遭抵制、Llama 2被曝存在潜在风险

当前，全球正掀起一场激烈的AI安全讨论，其中三个关键要点引起广泛关注。首先，OpenAI的CEO Sam Altman在剑桥举办的活动中遭到了抵制，抗议者要求停止AI竞赛，导致全球AI安全讨论再次升级。不仅如此，AI巨头分为两派，一派是「开源派」，包括L...

人工智能 2023-11-02 人工智能

755阅读

阿里云发布通义千问2.0，性能加速追赶GPT-4

在2023杭州云栖大会上，阿里云首席技术官周靖人发布千亿级参数大模型通义千问2.0。在10个权威测评中，通义千问2.0综合性能超过GPT-3.5，正在加速追赶GPT-4。据悉，过去6个月，通义千问2.0在性能上取得巨大飞跃，相比4月发布的1.0版本，...

人工智能 2023-11-01 人工智能

757阅读

AI视野：英伟达发布大模型ChipNeMo；百度推出文心一言会员；OpenAI潜入黑客群聊；微软AI助手Copilot上线

????大模型动态英伟达发布430亿参数大模型ChipNeMo 英伟达发布了拥有430亿参数的大语言模型ChipNeMo，专注于辅助芯片设计，提高工程师的工作效率，支持问答、EDA脚本生成和Bug总结等任务。 vivo发布AI蓝心大模型并宣布开源7B...

AIGC 2023-11-01 人工智能

932阅读

AI玩推理桌游一眼识破骗局！清华通院联合推出心智理论新框架，六个指标评估表现均明显优于思维链

清华自动化系团队联合北京通用人工智能研究院，让几个AI智能体玩起了桌游！游戏名叫阿瓦隆，是一个策略性的社交推理游戏，玩家被隐秘地分为“正义”与“邪恶”两派，通过任务投票、互相猜测与欺骗来完成或阻止任务，最终确定胜负。为了能让AI智能体成功识别并应...

AIGC 2023-10-31 人工智能

829阅读

通义千问有没有app？通义千问api接口文档在哪里找

在 10 月 31 日的 2023 云栖大会上，阿里云CTO周靖人宣布阿里云将全面升级云计算体系，打造一个面向AI时代最开放的云，涵盖从底层算力到AI平台再到模型服务的全栈技术创新。目前，中国有一半的大模型企业运行在阿里云上， 280 万AI开发者活跃在阿...

AIGC 2023-10-31 人工智能

857阅读

使用Llama index构建多代理 RAG

检索增强生成(RAG 已成为增强大型语言模型(LLM 能力的一种强大技术。通过从知识来源中检索相关信息并将其纳入提示，RAG为LLM提供了有用的上下文，以产生基于事实的输出。但是现有的单代理RAG系统面临着检索效率低下、高延迟和次优提示的挑战。这些问题...

AIGC 2023-10-31 人工智能

890阅读

阿里云发布通义千问2.0，性能超GPT-3.5，加速追赶GPT-4

10月31日，阿里云正式发布千亿级参数大模型通义千问2.0。在10个权威测评中，通义千问2.0综合性能超过GPT-3.5，正在加速追赶GPT-4。当天，通义千问APP在各大手机应用市场正式上线，所有人都可通过APP直接体验最新模型能力。过去6个月，通义...

AIGC 2023-10-31 人工智能

787阅读