数据集第33页 - AIGC资讯

AIGC从入门到入坑01（初学者适用版）

AIGC从入门到入坑系列文章 AIGC系列第一章--简述 AIGC从入门到入坑系列文章前言学习路径 AI时间线人工智能简史 AI绘画简史 AI名词解释小白从0-1必看5篇资料初学者进阶必读8篇资料总结前...

人工智能 2024-02-23 人工智能

743阅读

AI绘画专栏之Comfyui之AnimateDiffLCM更快效果更佳工作流分享

AnimateLCM能够在很少的步骤中生成高质量的视频。相比直接在原始视频数据集上应用一致性学习，该项目提出了一种解耦的一致性学习策略，分别对图像生成的基础知识和运动生成的基础知识进行提炼。这种策略提高了训练效率并提升了生成视频的视觉质量。那么关于两个...

人工智能 2024-02-23 人工智能

636阅读

鱼眼相机与超声波传感器融合实现鸟瞰近场障碍物感知

本文经自动驾驶之心公众号授权转载，转载请联系出处。论文链接：https://browse.arxiv.org/pdf/2402.00637.pdf 视频链接：https://youtu.be/JmSLBBL9Ruo 本文介绍了鱼眼相机与超声传...

生成式AI 2024-02-23 人工智能

491阅读

目标检测新SOTA：YOLOv9问世，新架构让传统卷积重焕生机

继 2023 年 1 月 YOLOv8 正式发布一年多以后，YOLOv9 终于来了！我们知道，YOLO 是一种基于图像全局信息进行预测的目标检测系统。自 2015 年 Joseph Redmon、Ali Farhadi 等人提出初代模型以来，领域内的研...

生成式AI 2024-02-23 人工智能

541阅读

清华叉院、理想提出DriveVLM，视觉大语言模型提升自动驾驶能力

与生成式 AI 相比，自动驾驶也是近期 AI 最活跃的研究和开发领域之一。要想构建完全的自动驾驶系统，人们面临的主要挑战是 AI 的场景理解，这会涉及到复杂、不可预测的场景，例如恶劣天气、复杂的道路布局和不可预见的人类行为。现有的自动驾驶系统通常包括...

大数据 2024-02-23 人工智能

473阅读

EfficientViT-SAM：精度不变原地起飞！

作者提出了EfficientViT-SAM，这是一系列加速的SAM模型。在保留SAM轻量级的提示编码器和 Mask 解码器的同时，作者用EfficientViT替换了沉重的图像编码器。在训练方面，首先从SAM-ViT-H图像编码器向EfficientV...

大数据 2024-02-23 人工智能

619阅读

AIGC内容分享(五十九)：拐点时刻？AIGC时代的新闻业

目录前言大洗牌：新闻业的三重变革涌现：AIGC正掀起一场 “供给侧改革”之外：达克摩斯之剑： AIGC时代结语：前言一阵生成式人工智能(AIGC 的旋风，正在席卷众多领域。 2022年底，OpenAI发布自然语言对话...

人工智能 2024-02-23 人工智能

712阅读

爆火Sora背后的技术，一文综述扩散模型的最新发展方向

为了使机器具有人类的想象力，深度生成模型取得了重大进展。这些模型能创造逼真的样本，尤其是扩散模型，在多个领域表现出色。扩散模型解决了其他模型的限制，如 VAEs 的后验分布对齐问题、GANs 的不稳定性、EBMs 的计算量大和 NFs 的网络约束问题。因...

生成式AI 2024-02-22 人工智能

572阅读

使用Stable Diffusion完成绘图

2.2 使用Stable Diffusion完成绘图 Stable diffusion 由于其开源特性，发展极为迅猛，可以说很多效果超过了 Midjourney 也完全不过分，知识系统十分庞杂，他是有两个公司运营研发，WebUI和sd的ckpt文件都...

人工智能 2024-02-22 人工智能

524阅读

模型融合、混合专家、更小的LLM，几篇论文看懂2024年LLM发展方向

在过去的 2023 年中，大型语言模型（LLM）在潜力和复杂性方面都获得了飞速的发展。展望 2024 年的开源和研究进展，似乎我们即将进入一个可喜的新阶段：在不增大模型规模的前提下让模型变得更好，甚至让模型变得更小。现在，2024 年的第一个月已经过去...

AIGC 2024-02-22 人工智能

562阅读

【AI绘画】硬核解读Stable Diffusion（完整版）小白必收藏！！！

手把手教你入门绘图超强的AI绘画，用户只需要输入一段图片的文字描述，即可生成精美的绘画。给大家带来了全新保姆级教程资料包（文末可获取） 2022年可谓是AIGC（AI Generated Content）元年，上半年有文生图大模型DALL-E2和Sta...

大数据 2024-02-22 人工智能

664阅读

Karpathy离职OpenAI，首发2小时AI大课！从头开始构建GPT分词器

离职OpenAI的技术大神karpathy，终于上线了2小时的AI大课。 ——「让我们构建GPT Tokenizer（分词器）」。其实，早在新课推出两天前，karpathy在更新的GitHub项目中，就预告了这件事。这个项目是minbpe——专为...

人工智能 2024-02-22 人工智能

439阅读

LLaMA 2 和 QianWen-14B

阿里云通义千问14B模型开源！性能超越Llama2等同等尺寸模型 - 科技新闻 - EDA365电子论坛网 LLaMA 2 的硬件要求： LLaMA 2 系列模型有不同的参数量版本，如7B、13B和70B等。对于不同大小的模型，其硬件需求也有所不同。以...

生成式AI 2024-02-22 人工智能

645阅读

超越AF2？Iambic、英伟达、加州理工学院开发多尺度深度生成模型，进行状态特异性蛋白质-配体复合物结构预测

由蛋白质和小分子配体形成的结合复合物无处不在，对生命至关重要。虽然最近科学家在蛋白质结构预测方面取得了进展，但现有算法无法系统地预测结合配体结构及其对蛋白质折叠的调节作用。为了解决这种差异，AI 制药公司 Iambic Therapeutics、英伟达...

大数据 2024-02-22 人工智能

538阅读

网络安全中的机器学习：挑战与比较

在数字互联时代，机器学习(ML 在网络安全防御中的作用已变得不可或缺。机器学习算法能够识别大量数据集中的模式和异常，为预防和减轻网络威胁提供了一条有前景的途径。然而，在乐观的情绪中，也存在着许多必须解决的挑战，才能在网络安全领域有效地利用机器学习。...

人工智能 2024-02-22 人工智能

440阅读

[AIGC 大数据基础]hive浅谈

在当今大数据时代，随着数据量的不断增大，如何高效地处理和分析海量数据已经成为一个重要的挑战。为了满足这一需求，Hive应运而生。 Hive作为一个基于Hadoop的数据仓库基础设施，为用户提供了类SQL的查询语言和丰富的功能，使得处理大规模数据变得更...

AIGC 2024-02-22 人工智能

464阅读

全球最强开源大模型一夜易主！谷歌Gemma 7B碾压Llama 2 13B，重燃开源之战

一声炸雷深夜炸响，谷歌居然也开源LLM了？！这次，重磅开源的Gemma有2B和7B两种规模，并且采用了与Gemini相同的研究和技术构建。有了Gemini同源技术的加持，Gemma不仅在相同的规模下实现SOTA的性能。而且更令人印象深刻的是，还...

生成式AI 2024-02-22 人工智能

469阅读

谷歌VideoPoet负责人蒋路跳槽TikTok！对标Sora，AI视频模型大战在即

离职OpenAI的技术大神karpathy，终于上线了2小时的AI大课。 ——「让我们构建GPT Tokenizer（分词器）」。图片其实，早在新课推出两天前，karpathy在更新的GitHub项目中，就预告了这件事。图片这个项目是minbpe...

人工智能 2024-02-22 人工智能

459阅读

大语言模型之LlaMA系列-LlaMA 2及LlaMA_chat(下)

多转一致性的系统消息 - System Message for Multi-Turn Consistency 在对话设置中，某些指示应适用于所有对话轮次。例如，简洁地响应，或"充当"某个公众人物。当我们向Llama 2-Chat提供此类指示时，后...

大数据 2024-02-22 人工智能

534阅读

都在搞端到端，试问端到端自动驾驶的基石到底是什么？

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解基础模型的出现彻底改变了自然语言处理和计算机视觉领域，为其在自动驾驶（AD）中的应用铺平了道路。这项调查对40多篇研究论文进行了全面回顾，展示了基础模型在增强AD中的...

人工智能 2024-02-22 人工智能

500阅读

单GPU就能压缩模型，性能不变参数少25%！微软提出模型稀疏化新方法

众所周知，对于大语言模型来说，规模越大，所需的算力越大，自然占用的资源也就越多。研究人员于是乎把目光转到了这片领域，即模型的稀疏化（Sparsification）。今天要介绍的SliceGPT，则可以实现模型的事后稀疏。也就是说，在一个模型训练完了以...

AIGC 2024-02-21 人工智能

481阅读

Karpathy新视频又火了：从头构建GPT Tokenizer

技术大神卡帕西离职OpenAI以后，营业可谓相当积极啊。这不，前脚新项目刚上线，后脚全新的教学视频又给大伙整出来了：这次，是手把手教咱构建一个GPT Tokenizer（分词器），还是熟悉的时长（足足2小时13分钟）。 Ps. 上次讲课还是俩月前的...

AIGC 2024-02-21 人工智能

404阅读

被字节辟谣的中文版Sora，究竟厉害在哪里？

撰稿 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）近日，市场有消息称，在Sora引爆文生视频赛道之前，国内的字节跳动也推出了一款新型视频模型Boximator，与Gen-2、Pink1.0等既有模型相比，Boximator的独特...

生成式AI 2024-02-21 人工智能

488阅读

深度学习在时间序列预测的总结和未来方向分析

2023年是大语言模型和稳定扩散的一年，时间序列领域虽然没有那么大的成就，但是却有缓慢而稳定的进展。Neurips、ICML和AAAI等会议都有transformer 结构(BasisFormer、Crossformer、Inverted transf...

生成式AI 2024-02-21 人工智能

491阅读

谷歌AI推出ScreenAI：用于UI和信息图解读的视觉语言模型

划重点: ⭐️ Google AI 团队提出了 ScreenAI，这是一个视觉语言模型，可以全面理解 UI 和信息图。 ⭐️ ScreenAI 在多个任务上表现出色，包括图形问答（QA），元素注释，摘要生成等。 ⭐️ 该团队发布了三个新数据集，为未来研究提...

生成式AI 2024-02-21 人工智能

451阅读

创作活动（九十三）———ChatGPT 和文心一言哪个更好用？

#ChatGPT 和文心一言哪个更好用？# 根据提供的搜索结果，ChatGPT和文心一言各有特点和优势，选择哪一个更好用取决于具体的应用场景和个人需求。以下是两者的对比： ChatGPT：适用场景：适合需要生成大量知识性文本的任务，如问答系统、知识图...

大数据 2024-02-21 人工智能

611阅读

逆天了！UniVision：BEV检测和Occ联合统一框架，双任务SOTA！

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&个人理解最近这几年以视觉为中心的3D感知在自动驾驶中得到了快速发展。尽管3D感知模型在结构和概念上有许多相似之处，但在特征表示、数据格式和目标方面仍存在差距，这对统一高效的3D感知...

AIGC 2024-02-21 人工智能

549阅读

详解面向 Java 开发人员的机器学习案例

译者 | 陈峻审校 | 重楼自去年以来，诸如ChatGPT 和 Bard之类的大语言模型已将机器学习提升到了一种现象级的地位。开发人员使用它们在辅助编程方面不断探索了从图像生成到疾病检测等领域的应用案例。鉴于全球各大科技公司都在加大针对机器学习的...

大数据 2024-02-21 人工智能

526阅读

英伟达NeMo框架在AI领域的综合应用与优势总结

一、NeMo 框架介绍 NVIDIA NeMo 是基于 PyTorch 和 PyTorch Lightning 的一个开源训练框架，源代码完全公开在 GitHub 上。NeMo 的主要目标是使 AI 开发者能够快速构建对话式 AI 模型并开发相关应用。...

人工智能 2024-02-21 人工智能

609阅读

基于LLaMA-Factory的微调记录

文章目录数据模型准备基于网页的简单微调基于网页的简单评测基于网页的简单聊天基于网页的模型合并微调问题测试与解决问题测试模板修改强化训练持续训练单数据集训练微调总结 LLaMA-Factory是一个非常好用的无代...

生成式AI 2024-02-21 人工智能

1054阅读

全网最全Stable Diffusion原理快速上手，模型结构、关键组件、训练预测方式！！！！

手把手教你入门绘图超强的AI绘画程序，用户只需要输入一段图片的文字描述，即可生成精美的绘画。给大家带来了全新保姆级教程资料包（文末可获取）【AIGC】Stable Diffusion的建模思想、训练预测方式快速在这篇博客中，将会用机器学习入门级描...

大数据 2024-02-21 人工智能

591阅读

两步生成25帧高质量动画，计算为SVD的8% | 在线可玩

耗费的计算资源仅为传统Stable Video Diffusion（SVD）模型的2/25！ AnimateLCM-SVD-xt发布，一改视频扩散模型进行重复去噪，既耗时又需大量计算的问题。先来看一波生成的动画效果。赛博朋克风轻松驾驭，男孩头戴耳机，...

大数据 2024-02-20 人工智能

529阅读

为什么人工智能应该开源？

在当今快速发展的数字时代，人工智能几乎处于所有行业革命性创新的前沿。从医疗保健、教育到娱乐，人工智能的变革性影响是显而易见的。什么是开源人工智能? 开源人工智能是人工智能软件和工具，其源代码开放并向公众开放。开发人员、研究人员和其他感兴趣的各方可以访...

生成式AI 2024-02-20 人工智能

428阅读

人工智能驱动的效率：重新定义数据中心的能源使用

在当今的数字时代，数据中心是积极管理巨大信息流的动力，以保持我们互联世界的运行。数据中心格局反映了这场技术革命，其在过去三年中增长了惊人的48%。然而，这种进步是有代价的，因为大型数据中心是贪婪的能源消耗者，每个数据中心都需要足够的电力来供电。人工智...

AIGC 2024-02-20 人工智能

465阅读

AnyGPT:实现任意模态输入到任意模态输出

近日，复旦大学、上海人工智能实验室等机构联合推出了一款名为AnyGPT的多模态大语言模型，该模型在处理语音、文本、图像和音乐等多种模态输入时，可以生成任何模态的输出。 AnyGPT采用离散表示技术，通过在各模态输入上进行离散标记，实现了多模态信息的统一处...

大数据 2024-02-20 人工智能

515阅读

什么是机器学习中的模型部署？

在机器学习中，模型部署是将机器学习模型集成到现有生产环境中的过程，在该环境中，模型可以接受输入并返回输出。目标是让其他人可以使用经过训练的机器学习模型的预测。大多数在线资源侧重于机器学习生命周期的前期步骤，例如探索性数据分析(EDA 、模型选择和模型...

AIGC 2024-02-20 人工智能

488阅读

Midjourney创始人：版权问题暂时无解，AI生图不是要取代艺术家

Midjourney大火之后，艺术家的路却越走越窄了。而最近，又曝出Midjourney等生图AI面临很严重的版权问题。用户用非常简单的提示词就能获得无数收版权保护的图像。最近，福布斯杂志的特约撰稿人专门采访了Midjourney的创始人David...

人工智能 2024-02-20 人工智能

474阅读

Sora给中国AI带来的真实变化

OpenAI的最新技术成果——文生视频模型Sora，在春节假期炸裂登场，令海内外的AI从业者、投资人彻夜难眠。如果你还没有关注到这个新闻，简单介绍一下:Sora是OpenAI使用超大规模视频数据，训练出的一个通用视觉模型，可以理解和模拟运动中的物理世界，...

大数据 2024-02-20 人工智能

462阅读

生成式人工智能和数据质量可以共存吗？

在这个高科技的时代，想必大家对于生成式人工智能并不陌生，至少都有听说过。但对于人工智能所生成的数据，大家始终有所顾虑，这就不得不涉及到数据质量了。在这个高科技的时代，想必大家对于生成式人工智能并不陌生，至少都有听说过。但对于人工智能所生成的数据，大家...

生成式AI 2024-02-20 人工智能

444阅读

SIMPL：用于自动驾驶的简单高效的多智能体运动预测基准

本文经自动驾驶之心公众号授权转载，转载请联系出处。原标题：SIMPL: A Simple and Efficient Multi-agent Motion Prediction Baseline for Autonomous Driving 论文链接...

AIGC 2024-02-20 人工智能

490阅读

NeRF成为过去？三维重建迈向3D GS新时代！（复旦大学最新综述）

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解 3D Gaussian Splatting（3D-GS）已成为计算机图形学领域的一个重大进步，它提供了明确的场景表示和新颖的视图合成，而不依赖于神经网络，如神经辐射场...

人工智能 2024-02-20 人工智能

684阅读

『拯救』开放异构场景 | HEAL：最新可扩展协作感知框架

本文经自动驾驶之心公众号授权转载，转载请联系出处。协同感知技术能够有效解决自动驾驶车辆单体感知中存在的障碍物遮挡、视角受限、以及远距离感知能力弱等问题。然而，现有的工作都做了一个过分简单的假设，即参与协作的智能体使用相同的传感器，部署相同的感知模型。...

生成式AI 2024-02-20 人工智能

480阅读

深度学习的未来：趋势和新兴技术

深度学习是人工智能(AI 的一个子集，持续推动技术进步，塑造机器感知、分析和响应数据的方式。本文将探索将在未来几年重新定义人工智能格局的最新趋势和新兴技术。模型规模指数增长以GPT-3等模型为例，越来越大的神经网络模型的趋势展示了对更复杂、更强大的...

大数据 2024-02-20 人工智能

566阅读

学习生成式人工智能的七个挑战

生成式人工智能已成为一股变革力量，突破了机器所能实现的界限。从文本和图像生成到创建真实的模拟，生成式人工智能已经在各个领域展示了其潜力。随着该领域对熟练专业人员的需求持续飙升，掌握生成人工智能的旅程被证明是一项艰巨的任务，其特点是复杂性需要细致入微...

生成式AI 2024-02-20 人工智能

467阅读

GitHub热榜第一：百万token上下文，还能生成视频，UC伯克利出品

今日GitHub热榜榜首，是最新的开源世界模型。上下文窗口长度达到了100万token，持平了谷歌同时推出的王炸Gemini 1.5，伯克利出品。强大的模型，命名也是简单粗暴——没有任何额外点缀，直接就叫LargeWorldModel（LWM）。...

AIGC 2024-02-20 人工智能

456阅读

100万token，一次能分析1小时YouTube视频，「大世界模型」火了

最近几天，我们接连被谷歌的多模态模型 Gemini 1.5 以及 OpenAI 的视频生成模型 Sora 所震撼到，前者可以处理的上下文窗口达百万级别，而后者生成的视频能够理解运动中的物理世界，被很多人称为「世界模型」。然而，这些刷屏无数的模型真的能很好...

大数据 2024-02-20 人工智能

437阅读

RNN模型挑战Transformer霸权！1%成本性能比肩Mistral-7B，支持100+种语言全球最多

在大模型内卷的同时，Transformer的地位也接连受到挑战。近日，RWKV发布了Eagle 7B模型，基于最新的RWKV-v5架构。 Eagle 7B在多语言基准测试中，击败了所有的同级别模型，在单独的英语测试中，也和表现最好的模型基本打平。同时...

人工智能 2024-02-20 人工智能

460阅读

Windows、Office直接上手，大模型智能体操作电脑太6了

当我们谈到 AI 助手的未来，很难不想起《钢铁侠》系列中那个令人炫目的 AI 助手贾维斯。贾维斯不仅是托尼・斯塔克的得力助手，更是他与先进科技的沟通者。如今，大模型的出现颠覆了人类使用工具的方式，我们或许离这样的科幻场景又近了一步。想象一下，如果一个多模...

大数据 2024-02-19 人工智能

555阅读

AI自动化标注崛起，数据标注员要失业了？

在数据标注行业流行着一句话：“有多少智能，就有多少人工”。由于需要标注的数据规模庞大且成本较高，一些互联网巨头及一些AI公司很少自己设有标注团队，大多交给第三方数据服务公司或者数据标注团队来做。这也衍生出了专为AI而生的人力密集型的数据标注产业链。...

人工智能 2024-02-19 人工智能

577阅读

美国商标局确认：OpenAI 无法申请 “GPT” 商标

OpenAI 是一家开发 AI 工具和聊天机器人的公司，但其 ChatGPT 制作者可能无法拥有该技术的商标。美国专利商标局（PTO）拒绝让由 Sam Altman 领导的 OpenAI 公司注册 GPT(生成式预训练转换器作为商标的申请。该公司在与...

AIGC 2024-02-19 人工智能

483阅读