数据集第42页 - AIGC资讯

Stability AI开年首个大模型：专写代码，支持18种编程语言，上下文100K，苹果笔记本离线就能跑

Stability AI开年第一个大模型来了！名为Stable Code 3B，参数27亿，专为写代码而生。 Stable Code 3B可理解处理18种不同的编程语言，上下文长度100K token。且它对硬件要求也不高，用MacBook Air...

人工智能 2024-01-17 人工智能

815阅读

【论文简介】Stable Diffusion的基础论文:2112.High-Resolution Image Synthesis with Latent Diffusion Models

稳定扩散生成模型(Stable Diffusion 是一种潜在的文本到图像扩散模型，能够在给定任何文本输入的情况下生成照片般逼真的图像 Stable Diffusion 是基于latent-diffusion 并与 Stability AI and Run...

大数据 2024-01-17 人工智能

1275阅读

【论文笔记 · PFM】Lag-Llama: Towards Foundation Models for Time Series Forecasting

Lag-Llama: Towards Foundation Models for Time Series Forecasting 摘要本文提出Lag-Llama，在大量时间序列数据上训练的通用单变量概率时间序列预测模型。模型在分布外泛化能力上取...

生成式AI 2024-01-17 人工智能

1202阅读

Tokenization 指南：字节对编码，WordPiece等方法Python代码详解

在2022年11月OpenAI的ChatGPT发布之后，大型语言模型(llm 变得非常受欢迎。从那时起，这些语言模型的使用得到了爆炸式的发展，这在一定程度上得益于HuggingFace的Transformer库和PyTorch等库。计算机要处理语言，...

AIGC 2024-01-17 人工智能

904阅读

用大模型帮程序员找Bug，中科院剖析102篇论文总结出这些方案

中科院对“找Bug”下手了，一口气总结了N种方案！法宝就是大模型。大模型由于其卓越的自然语言理解、推理等能力，已经被应用于各种场景，取得了前所未有的效果。类似的，软件测试领域也受益于其强大的能力，能够帮助生成逼真且多样化测试输入，模拟各种异常，加...

人工智能 2024-01-17 人工智能

910阅读

Stability AI发布全新代码模型Stable Code 3B！媲美70亿Code Llama，没GPU也能跑

今天，Stability AI发布了自家在2024年的第一个模型——Stable Code 3B。图片顾名思义，Stable Code 3B专注于代码能力，实际的表现也是非常亮眼。在仅仅3B参数的规模之下，达到了比肩Code Llama 7B的效果...

人工智能 2024-01-17 人工智能

898阅读

【AIGC】Controlnet:基于扩散模型的文生图的可控性

前言 controlnet可以让stable diffusion的生图变得可控。文章连接：https://arxiv.org/pdf/2302.05543.pdf 摘要冻结了stable diffusion的预训练模型并重用它的预训练...

AIGC 2024-01-17 人工智能

1324阅读

Stable Diffusion模型概述

Stable Diffusion 1. Stable Diffusion能做什么？ 2. 扩散模型 2.1 正向扩散 2.2 反向扩散 3. 训练如何进行 3.1 反向扩散 3.2 Stable Diffusion模型 3.3 潜在扩散模...

大数据 2024-01-17 人工智能

1480阅读

语音识别whisper的介绍、安装、错误记录

介绍 Whisper是OpenAI于2022年9月份开源的通用的语音识别模型。它是在各种音频的大型数据集上训练的模型，也是一个可以执行多语言语音识别、语音翻译和语言识别的多任务模型。论文链接：https://arxiv.org/abs/2212.04...

人工智能 2024-01-17 人工智能

1585阅读

Stability AI发布Stable Code 3B模型，没有GPU也能本地运行

在文生图领域大火的 Stability AI，今天宣布了其 2024 年的第一个新 AI 模型：Stable Code 3B。顾名思义，Stable Code 3B 是一个拥有 30 亿参数的模型，专注于辅助代码任务。无需专用 GPU 即可在笔记本电...

大数据 2024-01-17 人工智能

839阅读

机器人领域首个开源视觉-语言操作大模型，RoboFlamingo框架激发开源VLMs更大潜能

近年来，大模型的研究正在加速推进，它逐渐在各类任务上展现出多模态的理解和时间空间上的推理能力。机器人的各类具身操作任务天然就对语言指令理解、场景感知和时空规划等能力有着很高的要求，这自然引申出一个问题：能不能充分利用大模型能力，将其迁移到机器人领域，直接...

大数据 2024-01-17 人工智能

924阅读

Animate Anyone体验入口 AI生成动漫图像视频软件工具免费使用地址

Animate Anyone是一款革命性的AI工具，它利用扩散模型的力量，从静态图像生成角色视频。我们专门为角色动画设计了一个新框架，通过ReferenceNet和空间注意力技术来保持复杂外观特征的一致性。此外，我们还引入了高效的姿势指导器和有效的时间建模...

生成式AI 2024-01-17 人工智能

1257阅读

大型语言模型检索增强生成利器——向量搜索引擎

译者 | 朱先忠审校 | 重楼简介随着大型语言模型（LLM）席卷全球，向量搜索引擎也紧随其后。同时，向量数据库也构成大型语言模型长期记忆系统的基础。通过有效的算法找到相关信息并使其作为上下文传递给语言模型，向量搜索引擎可以提供超出训练截止值的最...

AIGC 2024-01-17 人工智能

987阅读

ReSimAD：如何在没有真实数据的情况下，提升感知模型的泛化性能

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解自动驾驶车辆传感器层面的域变化是很普遍的现象，例如在不同场景和位置的自动驾驶车辆，处在不同光照、天气条件下的自动驾驶车辆，搭载了不同传感器设备的自动驾驶车辆，上述这些...

大数据 2024-01-17 人工智能

949阅读

ChatGPT vs 文心一言: 两大AI助手的较量

文章目录每日一句正能量前言 ChatGPT ChatGPT的优点 ChatGPT的劣势文心一言文心一言的优势文心一言的劣势后记每日一句正能量无所不能的人实在一无所能，无所不专的专家实在是一无所专。...

大数据 2024-01-17 人工智能

904阅读

【AIGC】IP-Adapter：文本兼容图像提示适配器，用于文本到图像扩散模型

前言 IPAdapter能够通过图像给Stable Diffusion模型以内容提示，让其生成参考该图像画风，可以免去Lora的训练，达到参考画风人物的生成效果。摘要通过文本提示词生成的图像，往往需要设置复杂的提示...

生成式AI 2024-01-17 人工智能

1590阅读

使用 DPO 微调 Llama 2

简介基于人类反馈的强化学习 (Reinforcement Learning from Human Feedback，RLHF 事实上已成为 GPT-4 或 Claude 等 LLM 训练的最后一步，它可以确保语言模型的输出符合人类在闲聊或安全...

生成式AI 2024-01-17 人工智能

934阅读

【stable diffusion原理解读通俗易懂，史诗级万字爆肝长文，喂到你嘴里】

文章目录一、前言（可跳过）二、stable diffusion 1.clip 2.diffusion model forward diffusion （前向扩散）逆向扩散（reverse diffusion）采样图阶段小结 3....

人工智能 2024-01-16 人工智能

881阅读

请查收使用OpenAI的Whisper进行语音识别的攻略

Whisper是一种令人激动的新型语言模型，采用了全新的语音识别方法，即使是低质量的音频，Whisper也能产生高质量的结果，并且对各种声音和语言的适应性极强，无需进行微调。 Whisper是开源的，有一系列可用的模型尺寸，可以作为众多语音转文字应用的有...

AIGC 2024-01-16 人工智能

1431阅读

Stable Diffusion VAE：改善图像质量的原理、选型与使用指南

VAE Stable Diffusion（稳定扩散）是一种用于生成模型的算法，结合了变分自编码器（Variational Autoencoder，VAE）和扩散生成网络（Diffusion Generative Network）的思想。它通过对变分自编码器...

大数据 2024-01-16 人工智能

1511阅读

Bard和ChatGPT的一些比较

大数据 2024-01-16 人工智能

946阅读

LLama Factory 实操记录（一）

1. api端口参数说明： src/api -h, --help 显示帮助信息并退出 --model_name_or_path MODEL_NAME_OR_PATH 模型权重的路径或标识...

人工智能 2024-01-16 人工智能

2533阅读

扩散模型图像理解力刷新SOTA！字节复旦团队提出全新「元提示」策略

Text-to-image（T2I）扩散模型在生成高清晰度图像方面显示出了卓越的能力，这一成就得益于其在大规模图像-文本对上的预训练。这引发了一个自然的问题：扩散模型是否可以用于解决视觉感知任务？近期，来自字节跳动和复旦大学的技术团队提出了一种简单...

生成式AI 2024-01-16 人工智能

836阅读

AI视野：智谱AI发布大模型GLM-4；腾讯发布PhotoMaker；GPT Store现多款违规AI女友；Deepfake音视频检测技术亮相CES

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ ????大模型动态智谱AI发布大...

生成式AI 2024-01-16 人工智能

911阅读

Yann LeCun发来肯定：腾讯人像照片生成可以随便玩了

这一次，Yann LeCun 首次跻身「百变大咖」。身穿钢铁侠的衣服、戴着酷酷的墨镜面无表情地注视着你，一身古装在故宫门前打卡留念…… 就连本人也出来转发并喊话，「左下角这幅文艺复兴时期的画，是我的最爱。」性感女神寡姐身穿紫色巫师服注视着远方，还可...

生成式AI 2024-01-16 人工智能

769阅读

互联网新时代要来了（二）什么是AIGC？

什么是AIGC？最近，又火了一个词“**AIGC”**2022年被称为是AIGC元年。那么我们敬请期待，AIGC为我们迎接人工智能的下一个时代。 TIPS:内容来自百度百科、知乎、腾讯、《AIGC白皮书》等网页什么是AIGC？ 1...

生成式AI 2024-01-16 人工智能

935阅读

OpenAI开源全新解码器和语音识别模型Whisper-v3

在11月7日OpenAI的首届开发者大会上，除了推出一系列重磅产品之外，还开源了两款产品，全新解码器Consistency Decoder（一致性解码器）和最新语音识别模型Whisper v3。据悉，Consistency Decoder可以替代Sta...

人工智能 2024-01-16 人工智能

1350阅读

开源模型新纪录：超越Mixtral 8x7B Instruct的模型来了

从 Llama、Llama 2 到 Mixtral 8x7B，开源模型的性能记录一直在被刷新。由于 Mistral 8x7B 在大多数基准测试中都优于 Llama 2 70B 和 GPT-3.5，因此它也被认为是一种「非常接近 GPT-4」的开源选项。...

生成式AI 2024-01-16 人工智能

883阅读

Stable Diffusion五问

一，什么是Stable diffusion？ Stable Diffusion" 是一种基于扩散模型的深度学习框架，用于生成高质量的图像。它是一种生成模型，通过模拟物理扩散过程，从随机噪声中逐步生成详细和结构化的图像。Stable Diffusion因其...

AIGC 2024-01-16 人工智能

972阅读

国产GPTs来了，基于智谱第4代大模型！模型性能均达GPT-4九成以上

国产大模型玩家智谱AI，交出最新成绩单—— 发布全自研第四代基座大模型GLM-4，且所有更新迭代的能力全量上线。作为国内唯一一个产品线全对标OpenAI的大模型公司，智谱年前攒了波大的：按官方说法，GLM-4性能相比GLM-3提升60%，逼近GPT...

AIGC 2024-01-16 人工智能

960阅读

鹅厂最新AI工具刷屏！杨幂寡姐多风格写真秒秒钟生成，LeCun点赞

大厂们在整活方面开始卷起来了！前脚字节阿里的工具火了，现在腾讯这个新照片生成应用PhotoMaker直接刷屏，瞧这阵仗…… 只需上传一张或以上照片，无需额外LoRA训练，就能快速可定制。任何人、任何风格，高保真那种。于是秒秒钟，LeCun化身钢铁侠...

AIGC 2024-01-16 人工智能

806阅读

人工智能在数据安全中的应用场景

场景一：数据资产梳理数据资产梳理是数据安全的基础。知道企业究竟有多少数据，这些数据在哪里？有哪些类型的数据？其中哪些是敏感数据？这些数据的敏感等级分别是什么？只有明确了保护的目标，才能有针对性的对安全风险进行防护。对于大数据来说，首先要做的一项工作就...

AIGC 2024-01-16 人工智能

823阅读

广义人工智能时代：通往通用人工智能（AGI）之路

人工智能(AI 将于2024年进一步改进，大型语言模型有望进一步发展。 2023年对于人工智能和生成式人工智能来说是激动人心的一年，特别是那些采用大型语言模型(LLM 架构的人工智能，比如来自开放人工智能(GPT 4 、Anthropic(Claud...

AIGC 2024-01-16 人工智能

935阅读

超越BEVFusion！又快又好的极简BEV融合部署方案

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解在算法开发中，激光雷达-相机3D目标检测遇到了过度拟合问题，这是由于违反了一些基本规则。在数据集构建的数据标注方面，本文参考了理论补充，并认为回归任务预测不应涉及来自...

大数据 2024-01-16 人工智能

1089阅读

AIGC｜一文梳理「AI视频生成」技术核心基础知识和模型应用

大家好，我是猫先生，AI技术爱好者与深耕者！！ 2022年是AIGC（生成式AI）元年！从这一年开始，可谓是百家争鸣，各种技术层出不穷，再次迸发出AI的活力。从DALL·E 2、Stable Diffusion、Midjourney等文生图应用点燃了大众...

人工智能 2024-01-16 人工智能

2165阅读

LLaMA的解读与其微调：Alpaca-LoRA/Vicuna/BELLE/中文LLaMA/姜子牙/LLaMA 2

前言近期，除了研究ChatGPT背后的各种技术细节不断看论文(至少100篇，100篇目录见此：ChatGPT相关技术必读论文100篇，还开始研究一系列开源模型(包括各自对应的模型架构、训练方法、训练数据、本地私有化部署、硬件配置要求、微调等细节 ...

大数据 2024-01-16 人工智能

1161阅读

[玩转AIGC]LLaMA2训练中文文章撰写神器（数据准备，数据处理，模型训练，模型推理）

目录一、下载并加载中文数据集二、中文数据集处理 1、数据格式 2、数据集处理之tokenizer训练格式 1）先将一篇篇文本拼凑到一起（只是简单的拼凑一起，用于训练tokenizer） 2）将数据集进行合并 3、数据集处理之模型（ll...

AIGC 2024-01-16 人工智能

899阅读

数据计算任务工具Fluid在AIGC模型推理场景中的优化方案

Fluid的介绍 Fluid是一个在Kubernetes环境中编排数据和使用数据的计算任务的工具。它的编排不仅涉及空间上的优化，还包括时间上的调度。从空间角度看，计算任务会优先被分配到存有缓存数据或靠近缓存的节点上，从而提升数据密集型应用的性能。从时间角...

大数据 2024-01-16 人工智能

1002阅读

AIGC for code(text-to-codeAIGC/AI生成代码/生成式AI之代码生成/AI编程工具/自动编程/自动生成代码/智能编程工具/智能编程系统)

AIGC，Artificial Intelligence Generated Content，人工智能生成内容 AIGC for code，AI生成代码 1 Github Copilot 1.1 简介 Copilot是由微软的子公司Github与o...

生成式AI 2024-01-15 人工智能

1059阅读

OpenAI Whisper论文笔记

OpenAI Whisper论文笔记 OpenAI 收集了 68 万小时的有标签的语音数据，通过多任务、多语言的方式训练了一个 seq2seq （语音到文本）的 Transformer 模型，自动语音识别（ASR）能力达到商用水准。本文为李沐老师论文精...

人工智能 2024-01-15 人工智能

965阅读

北大ChatLaw团队推出大模型恋爱神器Machine_Mindset 支持MBTI 16种人格

北大 ChatLaw 团队与 FarReel AI Lab 合作开发了一款大模型恋爱神器，可以让大模型具备 MBTI16种人格，实现自由定制。用户可以选择不同的性格类型，使大模型在回答问题时展现出不同的个性化回应。这项工作通过构建十万条 MBTI 数...

生成式AI 2024-01-15 人工智能

1044阅读

基于llama-index对embedding模型进行微调

QA对话目前是大语言模型的一大应用场景，在QA对话中，由于大语言模型信息的滞后性以及不包含业务知识的特点，我们经常需要外挂知识库来协助大模型解决一些问题。在外挂知识库的过程中，embedding模型的召回效果直接影响到大模型的回答效果，因此，在许多场景下，...

大数据 2024-01-15 人工智能

2121阅读

我们是怎么一步步被Hugging Face收购的：开源库Gradio构建者分享背后故事

不知大家是否还记得 2021 年年末，Hugging Face 宣布收购 Gradio 一事。两年过去了，Gradio 是如何成长起来的，又是如何被收购的，Gradio CEO 兼联合创始人 Abubakar Abid 说出了一些内幕故事。图源：ht...

AIGC 2024-01-15 人工智能

894阅读

GPT-5前瞻！GPT-5将具备哪些新能力？

Sam Altman在整个AI领域，乃至整个科技领域都被看作是极具影响力的存在，而2023年OpenAI无限反转的宫斗事件更是让Sam Altman刷足了存在感，他甚至被《时代》杂志评为“2023年度CEO”。也正因此， Sam Altman的一条推文，...

大数据 2024-01-15 人工智能

992阅读

Stable Diffusion 硬核生存指南：WebUI 中的 GFPGAN

本篇文章聊聊 Stable Diffusion WebUI 中的核心组件，强壮的人脸图像面部画面修复模型 GFPGAN 相关的事情。写在前面本篇文章的主角是开源项目 TencentARC/GFPGAN，和上一篇文章《Stable Diffusio...

AIGC 2024-01-15 人工智能

951阅读

WAIC2023| AIGC究竟在向善还是向恶而行？

目录一、常见图像篡改技术二、传统篡改图像检测方法 2.1、基于光源和噪声的拼接图像篡改检测方法 2.2、基于马尔科夫特征的检测方法三、基于深度学习的图像篡改检测方法 3.1、基于Fisher编码和SVM模型的方法 3.2、基于...

AIGC 2024-01-15 人工智能

1006阅读

深挖RLHF潜力，复旦语言和视觉团队创新奖励模型优化，让大模型更对齐

继第一份大模型对齐技术报告（Secrets of RLHF in Large Language Models Part I）获 NeurIPS 2023 workshop best paper 后，第二份报告强势归来，复旦语言和视觉团队联合推出的第二...

大数据 2024-01-15 人工智能

911阅读

【LLM】微调LLM：LoRA 还是全参数？Llama 2 的深入分析

?大家好，我是Sonhhxg_柒，希望你看完之后，能对你有所帮助，不足请指正！共同学习交流? ?个人主页－Sonhhxg_柒的博客_CSDN博客 ? ?欢迎各位→点赞? + 收藏⭐️ + 留言? ?系列专栏 - 机器学习【ML】自然语言...

人工智能 2024-01-15 人工智能

1914阅读

Transformer的无限之路：位置编码视角下的长度外推综述

在自然语言处理（Natural Language Processing，NLP）领域，Transformer 模型因其在序列建模中的卓越性能而受到广泛关注。然而，Transformer 及在其基础之上的大语言模型（Large Language Model...

大数据 2024-01-15 人工智能

909阅读

大模型伪装「潜伏特工」学会欺骗！OpenAI劲敌重磅研究震惊马斯克

不要教LLM学会骗人！不要教LLM学会骗人！不要教LLM学会骗人！因为后果可能会很严重，甚至超出人类的想象。最近，AI初创公司Anthropic的研究表明，一旦LLM学会了人类教授的欺骗行为，它们就会在训练和评估的过程中隐藏自己，并在使用时偷偷输出恶...

人工智能 2024-01-15 人工智能

811阅读