数据集第48页 - AIGC资讯

【AIGC】Chatglm2-lora微调

ChatGLM2介绍 ChatGLM2-6B源码地址：https://github.com/THUDM/ChatGLM2-6B ChatGLM2-6B 是开源中英双语对话模型 ChatGLM-6B 的第二代版本，在保留了初代模型对话流畅、部署门槛较低...

AIGC 2023-12-24 人工智能

980阅读

Llama中文社区开源预训练Atom-7B-chat大模型体验与本地化部署实测(基于CPU，适配无GPU的场景)

一、模型简介原子大模型Atom由Llama中文社区和原子回声联合打造，在中文大模型评测榜单C-Eval中位居前十（8月21日评测提交时间）。 Atom系列模型包含Atom-7B和Atom-...

大数据 2023-12-24 人工智能

1106阅读

GPT系列训练与部署——GPT2环境配置与模型训练

本文为博主原创文章，未经博主允许不得转载。本文为专栏《Python从零开始进行AIGC大模型训练与推理》系列文章，地址为“https://blog.csdn.net/suiyingy/article/details/13...

大数据 2023-12-24 人工智能

989阅读

14秒就能重建视频，还能变换角色，Meta让视频合成提速44倍

就今天的人工智能发展水平来说，文生图、图生视频、图像/视频风格迁移都已经不算什么难事。生成式 AI 天赋异禀，能够毫不费力地创建或修改内容。尤其是图像编辑，在以十亿规模数据集为基础预训练的文本到图像扩散模型的推动下，经历了重大发展。这股浪潮催生了大量图...

生成式AI 2023-12-24 人工智能

782阅读

击败扩散模型，清华朱军团队基于薛定谔桥的新语音合成系统来了

近日，由清华大学计算机系朱军教授课题组发布的基于薛定谔桥的语音合成系统 [1]，凭借其「数据到数据」的生成范式，在样本质量和采样速度两方面，均击败了扩散模型的「噪声到数据」范式。论文链接：https://arxiv.org/abs/2312.03...

人工智能 2023-12-24 人工智能

1144阅读

ChatGPT vs Bard 背后的技术

自 2022 年 11 月推出以来，OpenAI 的 Chat GPT 引起了广泛关注。但现在，谷歌已经加强了 Bard AI，这是其最新发布的产品之一。 OpenAI 的Chat GPT是一种 AI 语言模型，能够以对话的方式执行文本摘要、语言翻译和问...

生成式AI 2023-12-24 人工智能

849阅读

测试时领域适应的鲁棒性得以保证，TRIBE在多真实场景下达到SOTA

测试时领域适应（Test-Time Adaptation）的目的是使源域模型适应推理阶段的测试数据，在适应未知的图像损坏领域取得了出色的效果。然而，当前许多方法都缺乏对真实世界场景中测试数据流的考虑，例如：测试数据流应当是时变分布（而非传统领域适应中...

AIGC 2023-12-24 人工智能

889阅读

清华特奖焦剑涛大模型创业：突破GPT-4工具使用能力，搞开源种子轮融资七千万

两位清华校友打造，在GPT-4核心优势之一使用工具上实现超越。连HuggingFace CEO都来帮它造势：它的名字叫“NexusRaven”，参数只有130亿。出色的函数调用能力连网友都忍不住称赞，既可以并行也可以嵌套。背后团队则更令人瞩目...

AIGC 2023-12-24 人工智能

846阅读

最强英文开源模型LLaMA架构探秘，从原理到源码

导读：LLaMA 65B是由Meta AI（原Facebook AI）发布并宣布开源的真正意义上的千亿级别大语言模型，发布之初（2023年2月24日）曾引起不小的轰动。LLaMA的横空出世，更像是模型大战中一个搅局者。虽然它的效果（performance）...

人工智能 2023-12-24 人工智能

1326阅读

史上最快3D数字人生成器：半小时完成训练，渲染仅需16毫秒，苹果出品

之前要两天才能训练好的数字人，现在只用半小时就能完成了！到了推理阶段，更是只要16毫秒，就能得到动作流畅、细节到位的场景视频。而且无需复杂的采样和建模，只要随便拍一段50-100帧的视频就足够了，换算成时间不过几秒钟。这正是由苹果联合德国马普所推出...

大数据 2023-12-23 人工智能

840阅读

【LLM】LLaMA简介：一个650亿参数的基础大型语言模型

LLaMA简介：一个650亿参数的基础大型语言模型 Paper Setup 其他资料作为 Meta 对开放科学承诺的一部分，今天我们将公开发布 LLaMA (大型语言模型 Meta AI ，这是一个最先进的大型语言基础模型，旨在帮...

AIGC 2023-12-23 人工智能

1228阅读

“最美中国女生”——AI绘画还没上车的有难了！！！

废话少说，先上图！！！前段时间，ChatGPT生成了一张自诩为“最美的中国女生”。虽然审美是主观的，但不可否认，图片的客观美。不过——你不会还只是看到图片里的美女，肤浅地欣赏高颜值吧？别人都已经透过现象看本质，赶上新浪潮，get新技能了… 好...

大数据 2023-12-23 人工智能

876阅读

从新手到高手：AI绘画实战中的Midjourney

? 个人网站:【海拥】【神级代码资源网站】【办公神器】 ? 基于Web端打造的：?轻量化工具创作平台 ? 想寻找共同学习交流的小伙伴，请点击【全栈技术交流群】随着人工智能（AI）技术的飞速发展，AI绘画逐渐成为艺术领域的一项令人瞩目的技术。本文将...

AIGC 2023-12-23 人工智能

1025阅读

基于MindSpore的llama微调在OpenI平台上运行

基于MindSpore的llama微调在OpenI平台上运行克隆预训练模型克隆chatglm-6b代码仓，下载分布式的模型文件 git lfs install git clone https://huggingface.co/openlm-...

人工智能 2023-12-23 人工智能

928阅读

whisper

Robust Speech Recognition via Large-Scale Weak Supervision 介绍大规模弱监督的训练。先前的方法都是通过大量的无监督学习训练（无监督的数据容易收集，所以通过大量无监督的学习可以训练出一个质量...

生成式AI 2023-12-23 人工智能

1003阅读

关于生成式语言大模型的一些工程思考 paddlenlp & chatglm & llama

生成式语言大模型，随着chatgpt的爆火，市场上涌现出一批高质量的生成式语言大模型的项目。近期百度飞桨自然语言处理项目paddlenlp发布了2.6版本。更新了以下特性：全面支持主流开源大模型Bloom, ChatGLM, GLM, Llama, OPT...

生成式AI 2023-12-22 人工智能

974阅读

Anthropic发布新方法通过提示降低生成式AI偏见

人工智能公司Anthropic最近发布了一项方法，旨在通过提示工程减少公司使用的大型语言模型（LLMs）输出中的歧视。该公司在一份文件中详细介绍了一种评估方法，指导公司如何通过优化提示降低模型输出的歧视性。该文件为开发人员和决策者提供了了解LLMs生成答案...

生成式AI 2023-12-22 人工智能

999阅读

使用 GPT-4 和 Midjourney 建构Tiktok故事

您准备好探索生成AI的奇妙世界，创作出富有吸引力的故事并配以引人入胜的插图了吗？根据我最近使用GPT-4和Midjourney的体验，我成功地使用YiVal构建了一个端到端的叙事，GPT-4用来生成大规模的故事，同时Midjourney创建令人惊叹的插图。...

人工智能 2023-12-22 人工智能

982阅读

AI Native工程化：百度App AI互动技术实践

作者 | GodStart 导读随着AI浪潮的兴起，越来越多的应用都在利用大模型重构业务形态，在设计和优化Prompt的过程中，我们发现整个Prompt测评和优化周期非常长，因此，我们提出了一种Prompt生成、评估与迭代的一体化解决方案，...

人工智能 2023-12-22 人工智能

893阅读

Gemini AI免费测试入口在哪谷歌Gemini软件怎么样

谷歌Gemini AI是一款由谷歌人工智能部门开发的大型语言模型（LLM）。它是在一个包含文本、代码、音频、图像和视频的庞大数据集上训练的。Gemini AI可以用于各种任务，包括自然语言处理(NLP 、机器翻译、代码生成、创意写作和问题回答。Google...

大数据 2023-12-22 人工智能

1000阅读

生成式人工智能如何改变数据中心的要求

什么是数据中心，我们如何使用它?更具体地说，数据中心有哪些不同类型，它们为使用它们的企业提供哪些不同的用途? 这些问题看似简单，但要得出令人满意的答案却出人意料地困难。就在过去一年左右的时间里，我们看到越来越强大的大型语言模型(LLM 正在支持新的生成...

大数据 2023-12-22 人工智能

780阅读

我的大模型观：我眼中的LLM

文章目录大模型是有智能的。也许，大模型是一场骗局？从头训练or微调我想象中的大模型架构大厂的大模型中小厂和个人开发该何去何从？今年，大模型火的一塌糊涂。最近几个月paper with code上，前几名的论文几乎都是生成模...

人工智能 2023-12-22 人工智能

880阅读

【达摩院OpenVI】AIGC技术在图像超分上的创新应用

团队模型、论文、博文、直播合集，点击此处浏览一、背景近10年来，深度学习技术得到了长足进步，在图像增强领域取得了显著的成果，尤其是以GAN为代表的生成式模型在图像复原、老片修复，图像超分辨率等方面大放异彩。图像超分辨率是视频增强方面，用...

人工智能 2023-12-22 人工智能

1065阅读

【大模型AIGC系列课程 3-7】领域&私域对话数据收集与生成

重磅推荐专栏：《大模型AIGC》；《课程大纲》本专栏致力于探索和讨论当今最前沿的技术趋势和应用领域，包括但不限于ChatGPT和Stable Diffusion等。我们将深入研究大型模型的开发和应用，以及与之相关的人工智能生成内容（AIGC）技术。通过深...

大数据 2023-12-22 人工智能

880阅读

Video-LLaMA An Instruction-tuned Audio-Visual Language Model for Video Understanding 用于视频理解的指令调谐视听语言

1.摘要我们提出了一个多模态框架Video-LLaMA1，它使大型语言模型(LLM 能够理解视频中的视觉和听觉内容。视频-来自冻结的预训练视频和音频编码器和冻结的LLM的美洲驼引导跨模式训练。不像以前的工作，补充线性最小二乘法只处理视觉或听觉信号...

人工智能 2023-12-21 人工智能

1143阅读

开发者笑疯了！ LLaMa惊天泄露引爆ChatGPT平替狂潮，开源LLM领域变天

来源: 新智源微信号：AI-era Meta的LLaMA模型开源，让文本大模型迎来了Stable Diffustion时刻。谁都没想谁能想到，一次意外的LLaMA泄漏，竟点燃了开源LLM领域最大的创新火花。一系列表现出色的Chat...

大数据 2023-12-21 人工智能

975阅读

AIGC（生成式AI）试用 15 -- 小结

断断续续的尝试在实际的工作使用中理解和测试AIGC，运用会越来越多、越来越广范，但也是时候做个小结了。没有太用热火的ChatGPT，只是拿了日常最容易用到的CSDN创作助手（每周写文章总是看到）和文心一言（没了谷歌只能百度），毕竟天天工作...

生成式AI 2023-12-21 人工智能

916阅读

「Animate Anyone」官网体验入口 AI动画角色软件app免费下载地址

Animate Anyone是一款利用扩散模型从静态图像生成角色视频的工具。该软件通过驱动信号将静态图像转换为动画，为角色动画提供了一个专门的新框架。那么，想要体验Animate Anyone吗？下面就给大家带来Animate Anyone官网体验入口和免...

生成式AI 2023-12-21 人工智能

1438阅读

AI图片编辑神器Anydoor：开启图片编辑的任意门图片主体随意移动

随着数字时代图像编辑的飞速发展，来自香港大学、阿里巴巴和蚂蚁集团的新成果AnyDoor为图片编辑开辟了一扇全新的时代之门。这是一项基于扩散技术的创新，具有将目标物体以和谐的方式传送到用户指定位置的神奇能力。与传统模型需要为每个物体调整参数不同，AnyDo...

大数据 2023-12-21 人工智能

989阅读

使用 PyTorch FSDP 微调 Llama 2 70B

引言通过本文，你将了解如何使用 PyTorch FSDP 及相关最佳实践微调 Llama 2 70B。在此过程中，我们主要会用到 Hugging Face Transformers、Accelerate 和 TRL 库。我们还将展示如何在 SL...

大数据 2023-12-21 人工智能

872阅读

开创全新通用3D大模型，VAST将3D生成带入「秒级」时代

生成式 AI 在3D 领域在很长一段时间内都在等待自己的「ChatGPT」时刻。传统3D 建模涉及游戏、影视、建筑等多个行业，普遍依赖专业人员手动操作，生产周期短则几天，多则以月为单位，单个3D 模型的创建成本至少需要几千元。生成式 AI 技术在2D 图...

生成式AI 2023-12-21 人工智能

1011阅读

together.ai让AI模型训练快9倍，获NVIDIA参投1.025亿美元A轮融资

目前获得融资最多的两家大模型创业公司是OpenAI和Anthropic，而这两家公司最大的投资者分别是微软和亚马逊，他们投资的很大一部分不是资金，而是等值的云计算资源。这其实也就把这两家顶尖的闭源大模型公司“绑上了”科技巨头的“战车”。在闭源大模型之外，...

大数据 2023-12-21 人工智能

980阅读

LLM-项目详解-Chinese-LLaMA-AIpaca（一）：LLM+LoRa微调加速技术原理及基于PEFT的动手实践：一些思考和mt0-large+lora完整案例

如何花费较少的算力成本来进行微调训练，十分重要，当前关于LLaMA、Alpaca、Instruct微调、LoRa微调等多个概念大家讲的很多，最近也在学习，也看到几个有趣的话题（主要参考于（https://github.com/ymcui/Chinese-L...

大数据 2023-12-21 人工智能

983阅读

【AI绘图丨 Stable_diffusion 系列教程四】— Window 环境 | Stable Diffusion入门教程及安装（全篇）

?腾小云导读最近，AI图像生成引人注目，它能够根据文字描述生成精美图像，这极大地改变了人们的图像创作方式。Stable Diffusion作为一款高性能模型，它生成的图像质量更高、运行速度更快、消耗的资源以及内存占用更小，是AI图像生成领域的里...

AIGC 2023-12-21 人工智能

1830阅读

全面合作：传媒业巨头与OpenAI寻求共赢

12月13日，OpenAI与欧洲最大的数字出版公司施普林格Axel Springer宣布战略合作。这是继媒体联盟一再发起抵制AI厂商的抗议以来，首例传媒巨头与AI厂商从版权、技术及商业模式上的全方位战略合作。本文梳理了此次合作带给新闻业的重要意义，与合作...

生成式AI 2023-12-21 人工智能

910阅读

ChatGPT抢走了数据！编程语言排行榜，没法做了！

撰稿 | 言征出品 | 51CTO技术栈（微信号：blog51cto）提及编程语言排行榜，很多人都能想到Tiobe、RedMonk、Stack Overflow等，基本上它们更新的频率也相对固定。但最近，这家号称编程语言榜单天花板的RedMonk似...

生成式AI 2023-12-21 人工智能

964阅读

Gemini Pro还不如GPT-3.5，CMU深入对比研究：保证公平透明可重复

谷歌Gemini实力到底如何？卡耐基梅隆大学来了场专业客观第三方比较。为保证公平，所有模型使用相同的提示和生成参数，并且提供可重复的代码和完全透明的结果。不会像谷歌官方发布会那样，用CoT@32对比5-shot了。一句话结果：Gemini Pr...

AIGC 2023-12-20 人工智能

886阅读

研究发现，GPT 和其他 AI 模型无法分析 SEC 备案文件

一家名为 Patronus AI 的初创公司的研究人员发现，大型语言模型在分析美国证券交易委员会（SEC）备案文件时经常无法正确回答问题。即使是表现最佳的人工智能模型配置 OpenAI 的 GPT-4-Turbo，当给予几乎整个备案文件的阅读能力和相关问题...

人工智能 2023-12-20 人工智能

849阅读

关于num_steps_all = len(train_loader) // configs.gradient_accumulation_steps * configs.epochs的理解，文心一言

当然可以，我会尽量用简单的语言来解释这行代码。这行代码计算的是在整个训练过程中，模型参数会更新的总次数。 len(train_loader ：这表示你的训练数据被分成了多少份（或称为“批次”）。想象一下你有100张纸，每张纸上写了一些训练数据，那...

AIGC 2023-12-20 人工智能

919阅读

薅羊毛！阿里云免费GPU云主机畅玩AI绘画，免费领取阿里云v100显卡搭建AI绘画利器Stable Diffusion

❝ AI绘画利器Stable Diffusion,因为对电脑显卡，磁盘，内存等都有一些限制，导致大部分人望而止步，所以小编今天教大家免费领取阿里云的免费显卡服务器，免费试用3个月，以方便各位快速学习与使用。 ❞ 领取免费的GPU计算...

生成式AI 2023-12-20 人工智能

1010阅读

【小沐学Python】Python实现语音识别（Whisper）

文章目录 1、简介 1.1 whisper简介 1.2 whisper模型 2、安装 2.1 whisper 2.2 pytorch 2.3 ffmpeg 3、测试 3.1 命令测试 3.2 代码测试：识别声音文件 3.3 代码测试：...

生成式AI 2023-12-20 人工智能

1440阅读

摸底谷歌Gemini：CMU全面测评，Gemini Pro不敌GPT 3.5 Turbo

前段时间，谷歌发布了对标 OpenAI GPT 模型的竞品 ——Gemini。这个大模型共有三个版本 ——Ultra（能力最强）、Pro 和 Nano。研究团队公布的测试结果显示，Ultra 版本在许多任务中优于 GPT4，而 Pro 版本与 GPT-3...

人工智能 2023-12-20 人工智能

872阅读

CVPR 2023 | 可控文生图/定制化文生图领域论文详解 AI作画增强版

可控文生图/定制化文生图 1、DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation DreamBooth是一种新的文本到图像扩散模型...

人工智能 2023-12-20 人工智能

1011阅读

斯坦福大学研究生开发名为PIGEON的AI模型仅通过几张照片找到你的位置

斯坦福大学的研究生们开发了一款名为 PIGEON 的应用程序，可以仅仅通过查看 Google 街景图像或其他图像来确定具体位置，其准确率令人印象深刻。根据预印本论文的数据，PIGEON 可以以92%的准确率预测所拍摄国家，并且在40%的猜测中可以将位置定...

人工智能 2023-12-20 人工智能

1025阅读

大语言模型训练数据常见的4种处理方法

本文分享自华为云社区《浅谈如何处理大语言模型训练数据之一常见的数据处理方法》，作者：码上开花_Lancer。大语言模型训练需要数万亿的各类型数据。如何构造海量“高质量”数据对于大语言模型的训练具有至关重要的作用。虽然，截止到2023 年9 月为止，还...

人工智能 2023-12-20 人工智能

1347阅读

实时湖仓技术选型，企业如何借实时湖仓赢在“数据驱动”时代

在之前三期的实时湖仓系列文章中，我们从业务侧、产品侧、应用侧等几个方向，为大家介绍了实时湖仓方方面面的内容，包括实时湖仓对于企业数字化布局的重要性以及如何进行实时湖仓的落地实践等。本文将从纯技术的角度，为大家解析实时湖仓的存储原理以及生态选型，为企业建...

人工智能 2023-12-20 人工智能

989阅读

PillarNeSt：如何进一步提升基于Pillar的3D目标检测性能？

写在前面 && 笔者的个人理解目前在自动驾驶领域中，一辆自驾汽车会配备多种传感器，如：激光雷达传感器采集点云数据、相机传感器采集图像数据等。由于激光雷达传感器可以更加准确的获取待检测物体的几何和位置信息，所以基于点云的感知算法模型在快速...

AIGC 2023-12-20 人工智能

885阅读

逆天！真实可控、可拓展，自动驾驶仿真平台LightSim上新

最近，来自 Waabi AI、多伦多大学、滑铁卢大学和麻省理工的研究者们在 NeurIPS 2023 上提出了一种全新的自动驾驶光照仿真平台 LightSim。研究者们提出了从真实数据中生成配对的光照训练数据的方法，解决了数据缺失和模型迁移损失的问题。L...

大数据 2023-12-20 人工智能

887阅读

AIGC实战——条件生成对抗网络(Conditional Generative Adversarial Net, CGAN)

AIGC实战——条件生成对抗网络 0. 前言 1. CGAN架构 2. 模型训练 3. CGAN 分析小结系列链接 0. 前言我们已经学习了如何构建生成对抗网络 (Generative Adversarial Net, GA...

人工智能 2023-12-20 人工智能

966阅读

每个开发人员都应该知道的六个生成式AI框架和工具

译者 | 晶颜审校 | 重楼在快速发展的技术领域，生成式人工智能是一股革命性的力量，它改变了开发人员处理复杂问题和创新的方式。本文深入探讨了生成式AI的世界，揭示了对每个开发人员都必不可少的框架和工具。 LangChain LangChain由H...

AIGC 2023-12-20 人工智能

1403阅读