llm 第45页 - AIGC资讯

使用 LoRA 技术对 LLaMA 65B 大模型进行微调及推理

前几天，Meta 发布了 LIMA 大模型，在LLaMA-65B的基础上，无需使用 RLHF，只用了 1000 个精心准备的样本数据进行微调，就达到了和 GPT-4 相媲美的程度。这激发了我探索 LLaMA 65B 大模型的兴趣。之前的一系列大模型相...

生成式AI 2023-11-27 人工智能

918阅读

Llama 2 论文《Llama 2: Open Foundation and Fine-Tuned Chat Models》阅读笔记

文章目录 Llama 2: Open Foundation and Fine-Tuned Chat Models 1.简介 2.预训练 2.1 预训练数据 2.2 训练详情 2.3 LLAMA 2 预训练模型评估 3. 微调 3.1 s...

AIGC 2023-11-27 人工智能

1538阅读

比「让我们一步一步思考」这句咒语还管用，提示工程正在被改进

大型语言模型（LLM）已经是许多自然语言处理任务的强大工具，只要能给出正确的提示。然而，由于模型的敏感性，找到最优提示通常需要进行大量手动尝试和试错努力。此外，一旦将初始提示部署到生产环境中，可能会出现意想不到的边缘情况，需要更多轮的手动调整来进一步完善...

生成式AI 2023-11-26 人工智能

871阅读

预测token速度翻番！Transformer新解码算法火了，来自小羊驼团队

小羊驼团队的新研究火了。他们开发了一种新的解码算法，可以让模型预测100个token数的速度提高1.5-2.3倍，进而加速LLM推理。比如这是同一个模型（LLaMa-2-Chat 7B）面对同一个用户提问（苏格拉底采用了哪些方法来挑战他那个时代的主...

人工智能 2023-11-26 人工智能

913阅读

模型杂谈：使用 IN8 量化推理运行 Meta “开源泄露”的大模型（LLaMA）

接着之前文章《模型杂谈：快速上手元宇宙大厂 Meta “开源泄露”的大模型（LLaMA）》一文中的话题，继续聊聊如何使用 INT8 量化的方式来让低显存的设备能够将模型运行起来。写在前面前几天，在知乎上看到《如何评价 LLaMA 模型泄露？》问题...

人工智能 2023-11-26 人工智能

951阅读

每日学术速递1.30

CV - 计算机视觉 | ML - 机器学习 | RL - 强化学习 | NLP 自然语言处理更多Ai资讯：今天带来的arXiv上最新发表的3篇文本图像的生成论文。 Subjects: cs.LG、cs.Cv、cs.AI、c...

生成式AI 2023-11-26 人工智能

852阅读

为什么微软必须拯救OpenAI

雇佣 CEO，雇佣团队，派遣 CEO 回去，坐上董事会——微软将不惜一切代价让 OpenAI 保持运行。译自Why Microsoft Has to Save OpenAI。生成式AI明星公司OpenAI的混乱瓦解，就像一个提前的感恩节家庭争吵，起初...

AIGC 2023-11-26 人工智能

894阅读

三分钟快速构建大语言模型AI知识库

FastGPT FastGPT 是一个基于 LLM 大语言模型的知识库问答系统，提供开箱即用的数据处理、模型调用等能力。同时可以通过 Flow 可视化进行工作流编排，从而实现复杂的问答场景！知识库核心流程图图片图片来源：https://doc.fa...

大数据 2023-11-26 人工智能

1203阅读

【类ChatGPT】中文LLaMA-2、Alpaca-2 二代羊驼大模型体验

前言 Meta发布的一代LLaMA已经掀起了一股开源大模型热潮，也有很多相关工作不断涌现。最近Meta全新发布了Llama-2，效果更上一层楼。而且最重要的是模型可以相对随意分发了，不像一代一样，meta不让开发者发布基于llama模型训...

大数据 2023-11-26 人工智能

1032阅读

LLMs之Chinese-LLaMA-Alpaca-2：源码解读(run_clm_sft_with_peft.py文件)—模型训练前置工作(参数解析+配置日志)→模型初始化(检测是否存在训练过的che

LLMs之Chinese-LLaMA-Alpaca-2：源码解读(run_clm_sft_with_peft.py文件 —模型训练前置工作(参数解析+配置日志 →模型初始化(检测是否存在训练过的checkpoint+加载预训练模型和tokenizer →数...

大数据 2023-11-26 人工智能

953阅读

Chatbot开发三剑客：LLAMA、LangChain和Python

聊天机器人（Chatbot）开发是一项充满挑战的复杂任务，需要综合运用多种技术和工具。在这一领域中，LLAMA、LangChain和Python的联合形成了一个强大的组合，为Chatbot的设计和实现提供了卓越支持。首先，LLAMA是一款强大的自然语...

大数据 2023-11-25 人工智能

934阅读

人类考92分的题，GPT-4只能考15分：测试一升级，大模型全都现原形了

AutoGPT 的得分也凉凉。 GPT-4自诞生以来一直是位「优等生」，在各种考试（基准）中都能得高分。但现在，它在一份新的测试中只拿到了15分，而人类能拿92。这套名叫「GAIA」的测试题由来自 Meta-FAIR、Meta-GenAI、Hugging...

AIGC 2023-11-25 人工智能

959阅读

OpenAI神秘Q毁灭人类？爆火「Q假说」竟牵出世界模型，全网AI大佬长文热议

Q* 【新智元导读】传闻中OpenAI的Q*，已经引得AI大佬轮番下场。AI2研究科学家Nathan Lambert和英伟达高级科学家Jim Fan都激动的写下长文，猜测Q*和思维树、过程奖励模型、AlphaGo有关。人类离AGI，已是临门一脚了? Ope...

人工智能 2023-11-25 人工智能

835阅读

ChatGPT、Google Bard、Claude2、新BING哪一款人工智能聊天机器人适合自己

人工智能聊天机器人正在提高数无数专业人士的工作效率。下面我们就来看看目前最流行的几款强大的人工智能工具，以及它们具体如何帮助到你。今年7月AI圈最大的动静之一便是AI初创公司Anthropic发布了其AI聊天机器人Claude最新版本——Claud...

生成式AI 2023-11-25 人工智能

944阅读

LLMs：Chinese-LLaMA-Alpaca-2(基于deepspeed框架)的简介、安装、案例实战应用之详细攻略

LLMs：Chinese-LLaMA-Alpaca-2(基于deepspeed框架的简介、安装、案例实战应用之详细攻略导读：2023年07月31日，哈工大讯飞联合实验室，发布Chinese-LLaMA-Alpaca-2，本项目基于Meta发布的...

大数据 2023-11-25 人工智能

1422阅读

通义千问, 文心一言, ChatGLM, GPT-4, Llama2, DevOps 能力评测

引言 “克隆 dev 环境到 test 环境，等所有服务运行正常之后，把访问地址告诉我”，“检查所有项目，告诉我有哪些服务不正常，给出异常原因和修复建议”，在过去的工程师生涯中，也曾幻想过能够通过这样的自然语言指令来完成运维任务，如今 AI 助手 Ap...

大数据 2023-11-25 人工智能

1241阅读

使用QLoRA对Llama 2进行微调的详细笔记

使用QLoRA对Llama 2进行微调是我们常用的一个方法，但是在微调时会遇到各种各样的问题，所以在本文中，将尝试以详细注释的方式给出一些常见问题的答案。这些问题是特定于代码的，大多数注释都是针对所涉及的开源库以及所使用的方法和类的问题。导入库...

生成式AI 2023-11-25 人工智能

802阅读

AI视野：ElevenLabs发布“语音转语音”；realme GT5Pro 12月7日发布；Claude2.1被指严重虚标；清华大学提出全新加速训练大模型方法SoT

???AI应用 ElevenLabs发布“语音转语音” ElevenLabs的语音生成式AI平台发布了“语音转语音”功能，用户可上传语音并自动转换为不同音色，实现声音的自由切换，为用户带来全新的语音生成体验。免费体验地址:https://elevenl...

AIGC 2023-11-24 人工智能

1045阅读

研究显示 ChatGPT 可为科学假说生成虚假数据集，对学术诚信造成威胁

11 月 24 日消息，据《自然》杂志当地时间周三报道，本月初发表在《美国医学会眼科学杂志》上的一篇论文中，作者使用了聊天机器人 GPT-4 和高级数据分析工具 ADA 创建了一个虚假的临床试验数据集，从而支持一个“未经证实”的科学主张。 IT之家注：...

AIGC 2023-11-24 人工智能

771阅读

LeCun发文质疑LLM推理能力大模型涌现离不开上下文学习

近期，LeCun在推特上引发了关于大语言模型（LLM）推理能力的讨论，强调LLM缺乏真正的规划推理能力，其涌现能力实际上是上下文学习的结果。研究通过多个实验验证LLM在复杂规划任务上表现不佳，强调其能力受限于任务复杂度。研究团队在GPT-4上进行的实验显...

大数据 2023-11-24 人工智能

884阅读

最新Claude 200K严重「虚标」？大神壕掷1016美元实测，90K后性能急剧下降

OpenAI正忙着政变的时候，他们在硅谷最大的竞争对手Anthropic，则悄悄地搞了个大新闻——发布了支持200K上下文的Claude 2.1。看得出来，Claude 2.1最大的升级就是将本就很强大的100K上下文能力，又提升了一倍！ 200K的...

生成式AI 2023-11-24 人工智能

892阅读

Hugging Face最受欢迎15大AI机构出炉！清华第五，OpenAI第十，冠军竟是它？

【新智元导读】Hugging Face作为开源AI社区的代表，总结了社区最欢迎的前15个公司和机构。让我们看看在开源社区眼里，哪些机构对于开源AI贡献最大。 Hugging Face上最受欢迎的15个AI公司出炉了! 目前的冠军，是Stability AI...

生成式AI 2023-11-24 人工智能

919阅读

ChatDev官方下载地址 AI聊天机器人创建工具推荐

ChatDev软件开发平台是一款基于大型语言模型（LLM）的创新软件开发工具，可以通过自然语言交流来统一和简化软件开发的关键过程，也可以用于开发AI聊天机器人。那么ChatDev在哪里可以体验呢?这里就给大家带来ChatDev官网体验入口。 >&g...

AIGC 2023-11-24 人工智能

1614阅读

“大模型本质就是两个文件！”特斯拉前AI总监爆火LLM科普，时长1小时，面向普通大众

特斯拉前AI总监Andrej Karpathy的新教程火了。这次，他专门面向普通大众做了一个关于大语言模型的科普视频。时长1小时，全部为“非技术介绍”，涵盖模型推理、训练、微调和新兴大模型操作系统以及安全挑战，涉及的知识全部截止到本月（非常新）。...

人工智能 2023-11-24 人工智能

806阅读

OpenAI内斗时，Karpathy在录视频：《大型语言模型入门》上线

OpenAI 的风波暂时告一段落，员工也忙着「干活了」。年初回归 OpenAI 的 Andrej Karpathy 最近做了一场关于大型语言模型（LLM）的 30 分钟入门讲座，但该讲座当时没录制。因此，他基于这场讲座重新录制了一个长达 1 小时的视频...

生成式AI 2023-11-24 人工智能

812阅读

这项AI研究引入 Atom：一种低位量化技术，可实现高效、准确LLM)服务

大型语言模型（LLM）是人工智能领域最新的引入，已经席卷全球。这些模型以其令人难以置信的能力，被人们广泛使用，无论是研究人员、科学家还是学生。凭借其仿人潜力回答问题、生成内容、概括文本、完成代码等方面，这些模型已经走过了很长的路程。 LLM 在情感分析、智...

人工智能 2023-11-24 人工智能

891阅读

牛津大学AI研究员发出警告:大语言模型对科学真相构成风险

在最新的一篇研究中，牛津大学互联网研究所的人工智能研究员发出了对大语言模型（LLMs）对科学真相构成威胁的警告。由Brent Mittelstadt、Chris Russell和Sandra Wachter等研究员在《自然人类行为》期刊上发表的论文中，他们...

人工智能 2023-11-24 人工智能

824阅读

清华大学提出全新加速训练大模型方法SoT

近日，微软研究和清华大学的研究人员共同提出了一种名为“Skeleton-of-Thought（SoT）”的全新人工智能方法，旨在解决大型语言模型(LLMs 生成速度较慢的问题。尽管像GPT-4和LLaMA等LLMs在技术领域产生了深远影响，但其处理速度的...

大数据 2023-11-24 人工智能

812阅读

免费获取GPT-4的五种工具

译者 | 陈峻审校 | 重楼不可否认，由OpenAI带来的GPT-4已是全球最受欢迎的、功能最强大的大语言模型（LLM）之一。大多数人都需要使用ChatGPT Plus的订阅服务去访问GPT-4。为此，他们通常需要每月支付20美元。那么问题来了，如果...

生成式AI 2023-11-24 人工智能

1568阅读

淘天集团联合爱橙科技开源大模型训练框架Megatron-LLaMA

9月12日，淘天集团联合爱橙科技正式对外开源大模型训练框架——Megatron-LLaMA，旨在让技术开发者们能够更方便地提升大语言模型训练性能，降低训练成本，并保持和LLaMA社区的兼容性。测试显示，在32卡训练上，相比HuggingFace上直接获得的...

生成式AI 2023-11-24 人工智能

927阅读

LLMs之LLaMA-2：源码解读之所有py文件(包括example_text_completion.py/example_chat_completion.py+model.py/generation

LLMs之LLaMA-2：源码解读之所有py文件(包括example_text_completion.py/example_chat_completion.py+model.py/generation.py/tokenizer.py 目录一、l...

AIGC 2023-11-24 人工智能

808阅读

拒绝996低效率：ChatGPT助你轻松搞定代码注释和文档

良好的注释对于任何成功的Python项目来说都至关重要。在实际操作中，编写注释是一件困难且耗时费力的工作，因此一些开发人员并不喜欢这样做。幸运的是，借助大型语言模型（LLMs）和像ChatGPT这样的工具，您可以迅速为您的Python代码和项目编写注释...

生成式AI 2023-11-23 人工智能

866阅读

Real AI发布欧洲首个人本主义开源大语言模型项目HOMINIS

在贝尔格莱德于2023年11月23日举办的数据科学大会上，Real AI宣布成功中标ISCRA项目。Real AI将建设欧洲首个基于LEONARDO超级计算机的人本主义大语言模型（LLM）。 LEONARDO超级计算机位于博洛尼亚的CINECA数据中心，是...

AIGC 2023-11-23 人工智能

901阅读

OpenAI的危机已消除，人工智能的未来何去何从？

OpenAI是一个致力于创造和推广人工智能（AI）的非营利组织，它的愿景是建立一个能够与人类智能相匹配或超越的通用人工智能（AGI），并确保它对人类和自然有益。然而近期，OpenAI的内部发生了一场震惊世界的政变，其首席执行官Sam Altman被董事会...

人工智能 2023-11-23 人工智能

1055阅读

提前对齐，视频问答新SOTA！北大全新Video-LLaVA视觉语言大模型，秒懂视频笑点

【新智元导读】最近，来自北京大学等机构研究者提出了一种全新视觉语言大模型——Video-LLaVA，使得LLM能够同时接收图片和视频为输入。Video-LlaVA在下游任务中取得了卓越的性能，并在图片、视频的13个基准上达到先进的性能。这个结果表明，统一L...

AIGC 2023-11-23 人工智能

902阅读

AI 聊天机器人 Claude 2.1 版本公布，支持输入 20 万个 Token 超 GPT-4 Turbo

IT之家 11 月 23 日消息，OpenAI 竞争对手 Anthropic 日前推出了 Claude 2.1 聊天机器人及对应同名 AI 模型，Claude 2.1 支持输入多达 20 万个 Token，并改善了准确度，同时新增系统预设提示词（Syst...

AIGC 2023-11-23 人工智能

878阅读

OpenAI新模型曝重大飞跃：AGI雏形或威胁人类，也成Altman被解雇导火索！

Sam Alman被解雇，又曝出最新内幕！据路透社报道，就在他被解雇的前四天，OpenAI内部的研究员曾向董事会发了一封警告信，称发现了一个可能威胁人类的强大人工智能。知情人士表示，这封此前从未报道过的信，也是董事会最终罢免Altman的导火索之一。...

大数据 2023-11-23 人工智能

810阅读

消息称阿尔特曼遭罢免原因在于 OpenAI 认为 Q* 技术突破将威胁人类

IT之家 11 月 23 日消息，随着萨姆・阿尔特曼（Sam Altman）重返 OpenAI 担任首席执行官，这场闹得沸沸扬扬的“OpenAI 宫斗剧”似乎也终于要落下帷幕，现在开始有人深挖这次事件的一些细节。路透社援引两位知情人士的话透露，在 Op...

人工智能 2023-11-23 人工智能

728阅读

Llama 2：开放基础和微调聊天模型

介绍大型语言模型(llm 作为高能力的人工智能助手，在复杂的推理任务中表现出色，这些任务需要广泛领域的专家知识，包括编程和创意写作等专业领域。它们可以通过直观的聊天界面与人类进行交互，这在公众中得到了迅速而广泛的采用。法学硕士的能力是显著的考虑到训...

AIGC 2023-11-23 人工智能

855阅读

微调 Code Llama 完整指南

一、前言今天这篇文章将向大家详细介绍如何对 Code Llama 进行微调，让它变成适合 SQL 开发的有利工具。对于编程开发任务，经过适当微调后的 Code Llama 的性能通常都会比普通的 Llama 强很多，特别是当我们针对具体任务进行优化时:...

生成式AI 2023-11-23 人工智能

1083阅读

如何使用LangChain和OpenAI API分析文档？

译者 | 布加迪审校 | 重楼从文档和数据中提取洞察力对于您做出明智的决策至关重要。然而在处理敏感信息时，会出现隐私问题。结合使用LangChain与OpenAI API，您就可以分析本地文档，无需上传到网上。它们通过将数据保存在本地、使用嵌入和向...

人工智能 2023-11-23 人工智能

1261阅读

微软ChatGPT的投资在AI上赚的是名声大起，又爆新品微软Copilot

微软宣布向ChatGPT开发者OpenAI追加投资数十亿美元，这也是人工智能领域史上规模最大的一笔投资。微软公司周一公告称，这将是一项“多年、数十亿美元”的投资协议，下一阶段将专注于将各类工具推向市场。微软CEO纳德拉在公告中表示，“各行各业的...

大数据 2023-11-23 人工智能

925阅读

南开大学与字节跳动研究人员推出开源AI工具ChatAnything：用文本描述生成虚拟角色

南开大学与字节跳动研究人员合作推出了一项引人注目的研究，发布了一种名为ChatAnything的全新AI框架。该框架专注于通过在线方式生成基于大型语言模型（LLM）的角色的拟人化形象，从而创造具有定制视觉外观、个性和语调的人物。简答的说，ChatAnyt...

AIGC 2023-11-22 人工智能

1134阅读

LLMs之LLaMA：《LLaMA: Open and Efficient Foundation Language Models》翻译与解读

LLMs之LLaMA：《LLaMA: Open and Efficient Foundation Language Models》翻译与解读导读：该论文提出了一个开源的大规模语言模型LLaMA，2048个A100-80G训练21天。该...

大数据 2023-11-22 人工智能

1136阅读

KAUST研究团队推出大模型心智交互框架CAMEL 教AI Agents学会协作与竞争

近期，KAUST研究团队推出的CAMEL框架引起了广泛关注。该框架以角色扮演为基础，使AI Agents在复杂任务中能够协作和竞争，产生惊人的群体智能效果。NeurIPS2023录用的这一项目探索了大型语言模型（LLMs）领域的新方向。项目地址:htt...

生成式AI 2023-11-22 人工智能

913阅读

AI视野：ChatGPT语音旁白功能免费开放；文心一言率先实现收费；Claude2.1长下文长度扩展至200K；拼多多成立大模型团队

???AI新鲜事 ChatGPT语音旁白功能现已向所有免费用户开放 OpenAI宣布将ChatGPT with voice语音功能免费对所有用户开放，用户只需下载应用程序，点击耳机图标即可进行语音对话，此功能于今年9月推出，最初仅面向Plus和Enterp...

人工智能 2023-11-22 人工智能

880阅读

尝试Google Bard并对比OpenAI ChatGPT，一个擅长创造性，一个擅长事实查询？

文章目录尝试Google Bard并对比OpenAI ChatGPT，一个擅长创造性，一个擅长事实查询？ Google Bard 的自我介绍 Google Bard 暂时不支持中文 Google Bard除了支持英语外，还支持日语 Goog...

生成式AI 2023-11-22 人工智能

906阅读

用深度催眠诱导LLM「越狱」，香港浸会大学初探可信大语言模型

尽管大语言模型 LLM (Large Language Model 在各种应用中取得了巨大成功，但它也容易受到一些 Prompt 的诱导，从而越过模型内置的安全防护提供一些危险 / 违法内容，即 Jailbreak。深入理解这类 Jailbreak 的...

大数据 2023-11-22 人工智能

794阅读

LLMs之Colossal-LLaMA-2：源码解读(train.py文件)基于给定数据集实现持续预训练LLaMA-2—解析命令行参数→初始化配置(分布式训练环境colossalai+训练日志+加速插

LLMs之Colossal-LLaMA-2：源码解读(train.py文件基于给定数据集实现持续预训练LLaMA-2—解析命令行参数→初始化配置(分布式训练环境colossalai+训练日志+加速插件 →数据预处理(初始化分词器+数据处理器+数据加载器 ...

大数据 2023-11-22 人工智能

792阅读

挑战OpenAI！Claude 2.1 LLM长下文窗口可达200K

Anthropic最新发布的大型语言模型Claude2.1LLM引起了广泛关注，该模型的上下文窗口长度可达200K，是对当前市场主流模型的一次重要突破。这一消息是在OpenAI推出128K上下文窗口的GPT-4之后发布的，导致超过100个企业OpenAI用...

生成式AI 2023-11-22 人工智能

874阅读