lms 第12页 - AIGC资讯

腾讯与悉尼大学联手打造GPT4Video:显著提升大语言模型视频生成能力

在多模态大型语言模型（MLLMs）领域取得显著进展的同时，尽管在输入端多模态理解方面取得了显著进展，但在多模态内容生成领域仍存在明显的空白。为填补这一空白，腾讯人工智能实验室与悉尼大学联手推出了GPT4Video，这是一个统一的多模态框架，赋予大型语言模型...

大数据 2023-12-07 人工智能

974阅读

使用 Diffusers 通过 DreamBooth来训练 Stable Diffusion

邀请参与我们的 DreamBooth 微调编程马拉松活动！ DreamBooth 是一种使用专门的微调形式来训练 Stable Diffusion 的新概念技术。一些人用他仅仅使用很少的他们的照片训练出了一个很棒的照片，有一些人用他去尝试新的风格。?...

人工智能 2023-12-07 人工智能

913阅读

大模型免微调解锁对话能力，RLHF没必要了！一作上交大校友：节省大量成本和时间

要搞大模型AI助手，像ChatGPT一样对齐微调已经是行业标准做法，通常分为SFT+RLHF两步走。来自艾伦研究所的新研究却发现，这两步都不是必要的？？？新论文指出，预训练完成刚出炉的基础模型已经掌握了遵循指令的能力，只需要提示工程就能引导出来，引起...

AIGC 2023-12-06 人工智能

849阅读

使用 AI 越狱 AI 模型：新方法可系统地探测 GPT-4 等大型语言模型的弱点，从而使其行为异常

上个月，OpenAI 董事会突然解雇了该公司的首席执行官，这引发了人们的猜测：董事会成员对人工智能突飞猛进的发展速度以及过快寻求技术商业化可能带来的风险感到震惊。 Robust Intelligence 是一家成立于 2020 年的初创公司，与耶鲁大学的...

大数据 2023-12-06 人工智能

814阅读

调查显示，仅10%企业在过去一年采用生成式AI解决方案

近日，由cnvrg.io进行的2023ML Insider调查显示，生成式AI（GenAI）应用虽然备受期待，但在过去一年中仅有10%的企业将其纳入生产中。这一结果或许引起人们对这一趋势的矛盾看法。这项年度调查对全球430名技术专业人士进行了全面分析，了...

AIGC 2023-12-06 人工智能

830阅读

新AI框架DreamSync:结合图像理解模型的反馈改善文本到图像合成

来自南加州大学、华盛顿大学、巴伊兰大学和谷歌研究团队的研究人员推出了DreamSync，这是一种新型人工智能框架，致力于解决扩散型文本到图像（T2I）模型中对齐和审美吸引力的问题，而无需进行人工标注、修改模型架构或使用强化学习。 DreamSync的方法是...

生成式AI 2023-12-06 人工智能

910阅读

【stable diffusion 小白最全详细使用教程+大模型资源】

文章目录一、前言二、安装 1.解压后点击启动器运行依赖，然后点击A启动器 2.更新本体和扩展 3.把controlnet1.1放入stable diffusion 中三、使用界面参数 1.提示词 2.采样和迭代步数 3.修...

大数据 2023-12-06 人工智能

2024阅读

GPT-4 未通过图灵测试，GPT-3.5 还败给六十年前的老 AI 系统，最新研究出炉！

过去一年间，能说会道的ChatGPT、最新的 GPT-4大模型，其能力也已超乎很多人的想象，一场由 OpenAI 引领推动的 AIGC 浪潮席卷全球各大科技公司。但是从学术研究的角度来看，其表现力距离人类智能究竟还有多远? 近日，一篇由加州大学圣迭戈分校的...

大数据 2023-12-05 人工智能

826阅读

Mozilla 让人们将 AI LLM 变成单文件可执行文件，简化大型语言模型的分发和运行

供本地使用的 LLM（大型语言模型）通常作为一组权重分布在数 GB 文件中。这些软件不能直接单独使用，这通常使得它们比其他软件更难分发和运行。给定的模型也可能经历了更改和调整，如果使用不同的版本，则会导致不同的结果。 Mozilla 的创新团队最近发布了...

人工智能 2023-12-05 人工智能

811阅读

【极客技术】真假GPT-4？微调 Llama 2 以替代 GPT-3.5/4 已然可行！

近日小编在使用最新版GPT-4-Turbo模型（主要特点是支持128k输入和知识库截止日期是2023年4月）时，发现不同商家提供的模型回复出现不一致的情况，尤其是模型均承认自己知识库达到2023年4月，但当我们细问时，Fake GPT4-Turbo（暂且这...

人工智能 2023-12-05 人工智能

904阅读

LLMs之LLaMA-2：源码解读(tokenizer.py文件)基于SentencePiece库执行文本的分词和编码/解码操作—在文本生成和处理过程中，将文本字符串与token ID列表之间进行相互

LLMs之LLaMA-2：源码解读(tokenizer.py文件基于SentencePiece库执行文本的分词和编码/解码操作—在文本生成和处理过程中，将文本字符串与token ID列表之间进行相互转换，以便与深度学习模型进行交互目录...

生成式AI 2023-12-05 人工智能

774阅读

开源语言大模型演进史：向LLaMA 2看齐

本文是开源 LLM 发展史系列文章的第三部分。此前，第一部分《开源语言大模型演进史：早期革新》回顾了创建开源 LLM 的最初尝试。第二部分《开源语言大模型演进史：高质量基础模型竞赛》研究了目前可用的最受欢迎的开源基础模型（即已进行预训练但尚未微...

大数据 2023-12-05 人工智能

899阅读

Stable Diffusion（Huggingface的方式安装）

Huggingface的方式安装在Huggingface个人目录下有一个token号，这个tokens号要在服务器登陆的过程中进行添加； 1，在服务器登陆要输入huggingface登陆： huggingface-cli login # READ...

AIGC 2023-12-04 人工智能

897阅读

一言不合就跑分，国内AI大模型为何沉迷于“刷榜”

“不服跑个分”这句话，相信关注手机圈的朋友一定不会感到陌生。诸如安兔兔、GeekBench等理论性能测试软件，由于能够在一定程度上反映手机的性能，因此备受玩家的关注。同理在PC处理器、显卡上，同样也有相应的跑分软件来衡量它们的性能。既然“万物皆可跑分”，...

大数据 2023-12-03 人工智能

857阅读

LLMs之Colossal-LLaMA-2：Colossal-LLaMA-2的简介(基于LLaMA-2架构+中文优化+扩充词表+仅千美元成本)、安装、使用方法之详细攻略

LLMs之Colossal-LLaMA-2：Colossal-LLaMA-2的简介(基于LLaMA-2架构+中文优化+扩充词表+仅千美元成本、安装、使用方法之详细攻略导读：2023年9月25日，Colossal-AI团队推出了开源模型Colos...

AIGC 2023-12-02 人工智能

1080阅读

快速上手midjourney绘画：个人头像篇

这段时间，AI技术发展迅猛，gpt的语言表达已经可以看出来了，而AI绘画技术也非常厉害，不需要懂得太多美术知识，只需要使用一些工具，就可以轻松地制作出个性化的图片。今天，橘子想和大家分享一些个人头像制作的内容，你可以使用自己的照片和选择不同的风格和背景...

人工智能 2023-12-01 人工智能

1003阅读

亚马逊的 Trainium2 AI 芯片配备 96GB HBM，训练性能提高四倍

本周，亚马逊网络服务（AWS）推出了其新的人工智能（AI）加速器芯片 Trainium2，相比其前身，它显著提升了性能，使 AWS 能够训练具有高达数万亿参数的基础模型（FMs）和大型语言模型（LLMs）。此外，AWS 还为自己设定了一个宏伟目标，即使其客...

大数据 2023-12-01 人工智能

983阅读

22LLMSecEval数据集及其在评估大模型代码安全中的应用：GPT3和Codex根据LLMSecEval的提示生成代码和代码补全，CodeQL进行安全评估【网安AIGC专题11.22】

LLMSecEval: A Dataset of Natural Language Prompts for Security Evaluations 写在最前面主要工作课堂讨论大模型和密码方向（没做，只是一个idea）相关研究提示集目...

人工智能 2023-11-30 人工智能

1100阅读

GAIA基准测试揭示人类胜过GPT-4的惊人差距

近日，来自FAIR Meta、HuggingFace、AutoGPT和GenAI Meta的研究人员共同致力于解决通用人工智能助手在处理需要基本技能，如推理和多模态处理的现实问题上所面临的挑战。他们推出了GAIA，这是一个旨在通过定位人类级别的鲁棒性来实现...

生成式AI 2023-11-29 人工智能

1087阅读

【网安AIGC专题】46篇前沿代码大模型论文、24篇论文阅读笔记汇总

网安AIGC专题写在最前面一些碎碎念课程简介 0、课程导论 1、应用 - 代码生成 2、应用 - 漏洞检测 3、应用 - 程序修复 4、应用 - 生成测试 5、应用 - 其他 6、模型介绍 7、模型增强 8、数据集 9、模型安全...

大数据 2023-11-29 人工智能

899阅读

Visual chatgpt多模态大模型的前菜

刚开始感觉这就是一篇工程类文章，把各种的模型做了整合，把最近很热的两个方向chatgpt和文本生成图、图文提问整合在一起。看完文章发现自己太自傲了，绝对轻视了微软亚研院大佬们的实力。表面看起来这是一个用chatgpt做意图理解、对话管理，然后用...

生成式AI 2023-11-29 人工智能

864阅读

当下最强的 AI art 生成模型 Stable Diffusion 最全面介绍

目录模型生成效果展示（prompt 全公开）如何注册 Stable Diffusion 使用 SD（dreamstudio.ai ）的收费标注如何 SD 提供哪些参数可以设置如何使用种子来改进一张作品我用 SD 创作的图片著作权如何归属...

生成式AI 2023-11-28 人工智能

1344阅读

Llama-Factory的baichuan2微调

Llama-Factory：https://github.com/hiyouga/LLaMA-Factory/tree/main 请使用 --quantization_bit 4/8 来启用 QLoRA 训练。默认模块应作...

人工智能 2023-11-28 人工智能

1260阅读

Stable Diffusion作图

使用stable diffusion作图 1安装stable diffusion（Windows）前置环境git、python10（低于此版本会导致部分py模块无法导入） 1.1 下载 stable diffusion webui （通过...

生成式AI 2023-11-28 人工智能

965阅读

TS版LangChain实战：基于文档的增强检索（RAG） | 京东云技术团队

LangChain LangChain是一个以 LLM （大语言模型）模型为核心的开发框架，LangChain的主要特性：可以连接多种数据源，比如网页链接、本地PDF文件、向量数据库等允许语言模型与其环境交互封装了Model I/O（输...

人工智能 2023-11-28 人工智能

861阅读

中文版LLaMA：Chinese-LLaMA-Alpaca

GitHub：GitHub - ymcui/Chinese-LLaMA-Alpaca: 中文LLaMA&Alpaca大语言模型+本地CPU/GPU训练部署 (Chinese LLaMA & Alpaca LLMs 以ChatGPT、GP...

人工智能 2023-11-27 人工智能

867阅读

LLMLingua:集成LlamaIndex，对提示进行压缩，提供大语言模型的高效推理

大型语言模型(llm 的出现刺激了多个领域的创新。但是在思维链(CoT 提示和情境学习(ICL 等策略的驱动下，提示的复杂性不断增加，这给计算带来了挑战。这些冗长的提示需要大量的资源来进行推理，因此需要高效的解决方案，本文将介绍LLMLingua与专有的...

生成式AI 2023-11-27 人工智能

835阅读

OpenAI内乱之害远未止

继OpenAI最近的争议后，AI工程师和公司开始减少乃至完全摆脱对其API的依赖。译自Pivot! AI Devs Move to Switch LLMs, Reduce OpenAI Dependency，作者 Richard MacManus 是...

大数据 2023-11-27 人工智能

956阅读

如何使用GPTQ量化使LLM更轻

译者 | 李睿审校 | 重楼大型语言模型(LLM 应用的一大挑战是其耗费巨大的内存和计算需求，通常需要数十GB的GPU内存。这使得它们不仅昂贵而且难以运行。为了缓解这些问题，研究人员开发了几种LLM压缩技术，其中包括“量化”。量化通过改变参数的存...

AIGC 2023-11-27 人工智能

1278阅读

LLMs之Code：大语言模型纵向赋能场景—垂直行业场景应用之大模型代码场景的简介、主流LLMs(SQLCoder/Code Llama/Ziya-Coding/CodeShell等)及其评估

LLMs之Code：大语言模型纵向赋能场景—垂直行业场景应用之大模型代码场景的简介、主流LLMs(SQLCoder/Code Llama/Ziya-Coding/CodeShell等及其评估基准(包括数据集、案例应用之详细攻略目录大模...

AIGC 2023-11-27 人工智能

822阅读

Llama 2 论文《Llama 2: Open Foundation and Fine-Tuned Chat Models》阅读笔记

文章目录 Llama 2: Open Foundation and Fine-Tuned Chat Models 1.简介 2.预训练 2.1 预训练数据 2.2 训练详情 2.3 LLAMA 2 预训练模型评估 3. 微调 3.1 s...

AIGC 2023-11-27 人工智能

1537阅读

比「让我们一步一步思考」这句咒语还管用，提示工程正在被改进

大型语言模型（LLM）已经是许多自然语言处理任务的强大工具，只要能给出正确的提示。然而，由于模型的敏感性，找到最优提示通常需要进行大量手动尝试和试错努力。此外，一旦将初始提示部署到生产环境中，可能会出现意想不到的边缘情况，需要更多轮的手动调整来进一步完善...

生成式AI 2023-11-26 人工智能

869阅读

Stable Diffusion搭建全过程记录，生成自己的专属艺术照

引言最近硅星人多次报道过 AI 图片生成技术，提到过 DALL·E、Midjourney、DALL·E mini（现用名 Craiyon）、Imagen、TikTok AI绿幕等知名产品。实际上，Stable Diffusion 有着强大的生成...

生成式AI 2023-11-26 人工智能

1066阅读

【类ChatGPT】中文LLaMA-2、Alpaca-2 二代羊驼大模型体验

前言 Meta发布的一代LLaMA已经掀起了一股开源大模型热潮，也有很多相关工作不断涌现。最近Meta全新发布了Llama-2，效果更上一层楼。而且最重要的是模型可以相对随意分发了，不像一代一样，meta不让开发者发布基于llama模型训...

大数据 2023-11-26 人工智能

1031阅读

LLMs之Chinese-LLaMA-Alpaca-2：源码解读(run_clm_sft_with_peft.py文件)—模型训练前置工作(参数解析+配置日志)→模型初始化(检测是否存在训练过的che

LLMs之Chinese-LLaMA-Alpaca-2：源码解读(run_clm_sft_with_peft.py文件 —模型训练前置工作(参数解析+配置日志 →模型初始化(检测是否存在训练过的checkpoint+加载预训练模型和tokenizer →数...

大数据 2023-11-26 人工智能

953阅读

Chatbot开发三剑客：LLAMA、LangChain和Python

聊天机器人（Chatbot）开发是一项充满挑战的复杂任务，需要综合运用多种技术和工具。在这一领域中，LLAMA、LangChain和Python的联合形成了一个强大的组合，为Chatbot的设计和实现提供了卓越支持。首先，LLAMA是一款强大的自然语...

大数据 2023-11-25 人工智能

932阅读

【腾讯云 HAI域探秘】——Stable Diffusion预装环境生成AIGC图片——必会技能【微调】

目录 Stable Diffusion基本使用方法学术加速测试配置中文插件 Prompt与Negative prompt 采样器说明人像生成水光效果微调的使用图像生成种子/seed使用附加/Extra 微调实例测试图...

AIGC 2023-11-25 人工智能

1006阅读

首个ChatGPT开发的应用上线；ChatMind思维导图工具；中文提示词大全；Copilot平替 | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦！ ? 『一本与众不同的AI绘本』ChatGPT 编写故事 + Midjourney 绘制插图作者的女儿特别喜欢迪士尼动画《海洋奇缘》里的主人公莫阿娜，...

大数据 2023-11-25 人工智能

950阅读

LLMs：Chinese-LLaMA-Alpaca-2(基于deepspeed框架)的简介、安装、案例实战应用之详细攻略

LLMs：Chinese-LLaMA-Alpaca-2(基于deepspeed框架的简介、安装、案例实战应用之详细攻略导读：2023年07月31日，哈工大讯飞联合实验室，发布Chinese-LLaMA-Alpaca-2，本项目基于Meta发布的...

大数据 2023-11-25 人工智能

1420阅读

OpenAI内斗时，Karpathy在录视频：《大型语言模型入门》上线

OpenAI 的风波暂时告一段落，员工也忙着「干活了」。年初回归 OpenAI 的 Andrej Karpathy 最近做了一场关于大型语言模型（LLM）的 30 分钟入门讲座，但该讲座当时没录制。因此，他基于这场讲座重新录制了一个长达 1 小时的视频...

生成式AI 2023-11-24 人工智能

811阅读

牛津大学AI研究员发出警告:大语言模型对科学真相构成风险

在最新的一篇研究中，牛津大学互联网研究所的人工智能研究员发出了对大语言模型（LLMs）对科学真相构成威胁的警告。由Brent Mittelstadt、Chris Russell和Sandra Wachter等研究员在《自然人类行为》期刊上发表的论文中，他们...

人工智能 2023-11-24 人工智能

823阅读

清华大学提出全新加速训练大模型方法SoT

近日，微软研究和清华大学的研究人员共同提出了一种名为“Skeleton-of-Thought（SoT）”的全新人工智能方法，旨在解决大型语言模型(LLMs 生成速度较慢的问题。尽管像GPT-4和LLaMA等LLMs在技术领域产生了深远影响，但其处理速度的...

大数据 2023-11-24 人工智能

812阅读

Stable Diffusion教程

什么是Stable Diffusion Stable Diffusion是一种潜在扩散模型（Latent Diffusion Model），能够从文本描述中生成详细的图像。它还可以用于图像修复、图像绘制、文本到图像和图像到图像等任务。简单地说，我们只要...

大数据 2023-11-24 人工智能

1015阅读

LLMs之LLaMA-2：源码解读之所有py文件(包括example_text_completion.py/example_chat_completion.py+model.py/generation

LLMs之LLaMA-2：源码解读之所有py文件(包括example_text_completion.py/example_chat_completion.py+model.py/generation.py/tokenizer.py 目录一、l...

AIGC 2023-11-24 人工智能

807阅读

拒绝996低效率：ChatGPT助你轻松搞定代码注释和文档

良好的注释对于任何成功的Python项目来说都至关重要。在实际操作中，编写注释是一件困难且耗时费力的工作，因此一些开发人员并不喜欢这样做。幸运的是，借助大型语言模型（LLMs）和像ChatGPT这样的工具，您可以迅速为您的Python代码和项目编写注释...

生成式AI 2023-11-23 人工智能

865阅读

如何使用LangChain和OpenAI API分析文档？

译者 | 布加迪审校 | 重楼从文档和数据中提取洞察力对于您做出明智的决策至关重要。然而在处理敏感信息时，会出现隐私问题。结合使用LangChain与OpenAI API，您就可以分析本地文档，无需上传到网上。它们通过将数据保存在本地、使用嵌入和向...

人工智能 2023-11-23 人工智能

1258阅读

Debug Stable Diffusion webui

文章目录 SD 前期预备一些惊喜 TorchHijackForUnet Txt2Img 搭配 Lora 使用单独运行 txt2img.py 获取所有资源代码地址参数 sd model 主程序代码地址参数(同上模型Infe...

人工智能 2023-11-22 人工智能

962阅读

南开大学与字节跳动研究人员推出开源AI工具ChatAnything：用文本描述生成虚拟角色

南开大学与字节跳动研究人员合作推出了一项引人注目的研究，发布了一种名为ChatAnything的全新AI框架。该框架专注于通过在线方式生成基于大型语言模型（LLM）的角色的拟人化形象，从而创造具有定制视觉外观、个性和语调的人物。简答的说，ChatAnyt...

AIGC 2023-11-22 人工智能

1134阅读

LLMs之LLaMA：《LLaMA: Open and Efficient Foundation Language Models》翻译与解读

LLMs之LLaMA：《LLaMA: Open and Efficient Foundation Language Models》翻译与解读导读：该论文提出了一个开源的大规模语言模型LLaMA，2048个A100-80G训练21天。该...

大数据 2023-11-22 人工智能

1135阅读

KAUST研究团队推出大模型心智交互框架CAMEL 教AI Agents学会协作与竞争

近期，KAUST研究团队推出的CAMEL框架引起了广泛关注。该框架以角色扮演为基础，使AI Agents在复杂任务中能够协作和竞争，产生惊人的群体智能效果。NeurIPS2023录用的这一项目探索了大型语言模型（LLMs）领域的新方向。项目地址:htt...

生成式AI 2023-11-22 人工智能

912阅读