数据集第36页 - AIGC资讯

三篇论文解决「语义分割的优化和评估」难题！鲁汶/清华/牛津等联合提出全新方法

优化语义分割模型常用的损失有Soft Jaccard损失，Soft Dice损失和Soft Tversky损失，但它们都和软标签不兼容，所以无法支持一些重要的训练技术（例如标签平滑，知识蒸馏，半监督学习，多标注员等）。另一方面，语义分割常用的评价指标...

大数据 2024-02-06 人工智能

876阅读

AIGC在物联网与智能制造中的实践

1.背景介绍 1. 背景介绍物联网和智能制造是当今最热门的技术领域之一，它们在各种行业中发挥着重要作用。随着计算机视觉、自然语言处理和机器学习等技术的发展，人工智能(AIGC 在物联网和智能制造领域的应用也日益增多。本文将探讨AIGC在物联...

AIGC 2024-02-06 人工智能

1247阅读

挖掘BEV潜力的边界！DA-BEV：无监督BEV SOTA新方案！

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解今天和大家探讨3D视觉感知领域中的一个特定问题：针对纯视觉的鸟瞰图（BEV）的无监督领Domain Adaptation（Unsupervised Domain Ad...

大数据 2024-02-06 人工智能

1025阅读

从0开始用 PyTorch 构建完整的 NeRF

本文经自动驾驶之心公众号授权转载，转载请联系出处。在解释代码之前，首先对NeRF（神经辐射场）的原理与含义进行简单回顾。而NeRF论文中是这样解释NeRF算法流程的： “我们提出了一个当前最优的方法，应用于复杂场景下合成新视图的任务，具体的实现原理是...

生成式AI 2024-02-06 人工智能

1077阅读

AIGC实战——归一化流模型(Normalizing Flow Model)

AIGC实战——归一化流模型 0. 前言 1. 归一化流模型 1.1 归一化流模型基本原理 1.2 变量变换 1.3 雅可比行列式 1.4 变量变换方程 2. RealNVP 2.1 Two Moons 数据集 2.2 耦合层 2.3 通...

人工智能 2024-02-06 人工智能

1937阅读

面向AI工程的五大JavaScript工具

令许多人惊讶的是，一向在Web开发领域中大放异彩的JavaScript在开发使用大语言模型(LLM 的应用程序方面同样大有价值。我们在本文中将介绍面向AI工程的五大工具，并为希望将LLM纳入其项目中的开发人员介绍一些必要的资源。 AI工程市场在2023...

AIGC 2024-02-06 人工智能

1355阅读

【AIGC-图片生成视频系列-6】SSR-Encoder：用于主题驱动生成的通用编码器

目录一. 贡献概述二. 方法详解 a 训练阶段 b 推理生成阶段：三. 综合结果四. 注意力可视化五. 选择性主题驱动图像生成六. 人体图像生成七. 可推广到视频生成模型八. 论文九. 个人思考稳定扩散（S...

生成式AI 2024-02-06 人工智能

882阅读

爆火的AI博主，是“摇钱树”还是“坑”？（附实测教程）

这段时间，平均一周就有一位虚拟博主火爆出圈。自此前Instagram博主Emily靠堪称完美的颜值在Ins4周内涨粉超20万之后，最近，外网又有一位叫Lexi Love的AI博主火了。 Lexi Love的Ins账号数据她的角色设定依旧是模特，背后的...

生成式AI 2024-02-05 人工智能

1354阅读

香港最大AI诈骗案：Deepfake换脸「英国CFO」，直接骗走公司2亿港币

【新智元导读】香港一家跨国公司员工，被骗子邀请进了用Deepfake做的「高管视频会议」中，下令让他转了2亿港币到不知名中账户，5天之后才发现被骗了。这几天，古老的AI应用——「AI换脸」多次破圈，屡屡登上热搜。先是网上充斥的大量泰勒斯威夫特的「AI艳...

人工智能 2024-02-05 人工智能

869阅读

秒速出图！体验 TensorRT 加速 Stable Diffusion 图像创作

TensorRT 如何加速 Stable Diffusion？生成式 AI 图像内容生成技术近年来发展迅速，可以根据人类语言描述生成图片，在时尚、建筑、动漫、广告、游戏等领域有着广泛应用。 Stable Diffusion WebUI 是 Githu...

大数据 2024-02-05 人工智能

983阅读

GPT-SoVITS官网体验入口 AI文本生成合成转换语音在线免费使用地址

GPT-SoVITS是一个强大的零样本语音转换和文本到语音WebUI。它具有零样本TTS、少样本TTS、跨语言支持和WebUI工具等功能。该产品支持英语、日语和中文，提供了集成工具，包括语音伴奏分离、自动训练集分割、中文ASR和文本标注，帮助初学者创建训练...

AIGC 2024-02-05 人工智能

1677阅读

罕见！苹果开源图片编辑神器MGIE，要上iPhone?

拍张照片，输入文字指令，手机就开始自动修图？这一神奇功能，来自苹果刚刚开源的图片编辑神器「MGIE」。把背景中的人移除在桌子上添加披萨最近一段时间，AI 在图片编辑这一应用上取得了不小的进展。一方面，在 LLM 的基础上，多模态大模型（MLL...

AIGC 2024-02-05 人工智能

938阅读

两亿参数时序模型替代LLM？谷歌突破性研究被批「犯新手错误」

最近，谷歌的一篇论文在 X 等社交媒体平台上引发了一些争议。这篇论文的标题是「A decoder-only foundation model for time-series forecasting（用于时间序列预测的仅解码器基础模型）」。简而言之，...

人工智能 2024-02-05 人工智能

923阅读

新型IT运维管理，基础设施和数据两手都要硬

AI大模型时代，数据赋予IT人“新使命” 当下IT人在企业中扮演着运营支撑的角色。说到运维管理，相信每人都是一把辛酸泪，每天承担着繁琐、高负荷且又高风险的运维工作，但在业务规划和职业发展时又成为了“透明人”。业内有句调侃的话：“只花钱的人，不配拥有发...

人工智能 2024-02-05 人工智能

841阅读

音频秒生全身虚拟人像，AI完美驱动面部肢体动作！UC伯克利Meta提出Audio2Photoreal

就在最近，Meta和UC伯克利联合提出了一种全新的虚拟人物形象生成的方法—— 直接根据音频生成全身人像，效果不仅逼真，还能模拟出原音频中包含的细节，比如手势、表情、情绪等等。图片论文地址：https://arxiv.org/abs/2401.0188...

人工智能 2024-02-05 人工智能

980阅读

打脸奥特曼，GPT-4今年比去年还懒！网友在线实测出炉

GPT-4变懒的问题，又有新进展。就在今天凌晨，奥特曼发推称，GPT-4这个毛病在新的一年应该好多了！图片关于GPT-4变懒，网友的吐槽已是不计其数，其中最多的就是与代码相关的任务：完成度不高不说，还会被分割成一个一个小块，使用时需要逐一复制。...

AIGC 2024-02-05 人工智能

810阅读

ChatGPT论文：大语言模型LLM之战:Dolly、LLaMA 、Vicuna、Guanaco、Bard、ChatGPT--在自然语言转SQL(NL2SQL、Text-to-SQL)的比较（一）

摘要 ChatGPT的成功引发了一场AI竞赛，研究人员致力于开发新的大型语言模型（LLMs），以匹敌或超越商业模型的语言理解和生成能力。近期，许多声称其性能接近GPT-3.5或GPT-4的模型通过各种指令调优方法出现了。作为文本到SQL解析的从业者，我...

大数据 2024-02-05 人工智能

1105阅读

美国博士小哥打败女友的AI男友！7页论文让LLM降智，训出「负分男友」成功挽回

女友爱上AI了，怎么破？一位自称来自Cranberry-Lemon大学应用心理机器学习系的Chad Broman博士最近表示，自己已经和女友Tiffany分手8个月了。虽然很享受单身的自由，但身边没有女友的日子，连玩快艇都少了很多滋味。他一直想找机...

大数据 2024-02-05 人工智能

794阅读

香港最大AI诈骗案！Deepfake换脸「英国CFO」，直接骗走公司2亿港币

这几天，古老的AI应用——「AI换脸」多次破圈，屡屡登上热搜。先是网上充斥的大量泰勒斯威夫特的「AI艳照」，逼得X（原推特）只能直接屏蔽了所有有关「Tylor Swift」的搜索。而今天香港警方向社会公布了一起更离谱的诈骗案件：一家英国跨国企业的中...

AIGC 2024-02-05 人工智能

854阅读

大模型系列——解读RAG

RAG 是2023年最流行的基于 LLM 的应用系统架构。有许多产品几乎完全建立在 RAG 之上，覆盖了结合网络搜索引擎和 LLM 的问答服务，到成千上万个数据聊天的应用程序。很多人将RAG和Agent 作为大模型应用的两种主流架构，但什么是RAG呢？R...

生成式AI 2024-02-05 人工智能

2223阅读

iPhone动嘴10秒P图！UCSB苹果全华人团队发布多模态MGIE，官宣开源人人可玩

几天前，库克在苹果电话会上证实，「今年晚些时候会发布生成式AI」。 ChatGPT掀起全球热潮之后，苹果也在悄悄发力AI，曾曝出的大模型框架Ajax、AppleGPT等AI工具让业界充满了期待。 6月举办的WWDC上，这家曾霸占全球市值第一公司，将会宣布...

AIGC 2024-02-05 人工智能

861阅读

比OpenAI官方提示词指南更全，这26条黄金准则让LLM性能飙升50%以上

论文地址: https://arxiv.org/abs/2312.16171 Github地址: https://github.com/VILA-Lab/ATLAS 论文标题：Principled Instructions Are All You...

大数据 2024-02-05 人工智能

977阅读

ChatLaw：基于LLaMA微调的法律大模型

文章目录动机数据组成模型框架模型评估北大团队发布首个的中文法律大模型落地产品ChatLaw，为大众提供普惠法律服务。模型支持文件、语音输出，同时支持法律文书写作、法律建议、法律援助推荐。 github地址：https://g...

大数据 2024-02-05 人工智能

1597阅读

[AIGC 大数据基础] 浅谈hdfs

HDFS介绍什么是HDFS？ HDFS（Hadoop Distributed File System）是Apache Hadoop生态系统的一部分，是一个分布式文件系统。它被设计用于存储和处理大规模数据集，并且能够容错、高可靠和高性能地处理文...

AIGC 2024-02-05 人工智能

858阅读

什么是网络人工智能？

如今，越来越多的企业正在利用人工智能(AI 和网络之间的协同作用。随着用户设备及其生成的数据的激增，企业越来越依赖人工智能来帮助管理庞大的网络基础设施。到2024年，60%的企业将拥有采用人工智能的基础设施，这将需要更广泛的自动化和预测分析，用于网络...

大数据 2024-02-05 人工智能

927阅读

苹果研究团队揭示WRAP技术：用合成数据进行预训练大模型成本低准确性高

近几个月来，大型语言模型（LLMs）在人工智能社区中引起了极大的关注和流行。这些模型在文本摘要、问答、代码完成、内容生成等任务中展示出了强大的能力。然而，LLMs通常在不充分的网络抓取数据上进行训练。这些数据通常杂乱、无结构，表达不清晰。按照现有的扩展原...

大数据 2024-02-05 人工智能

979阅读

如何使用单个指令微调GPT-3.5或Llama 2

由于在各种任务中的通用性，像ChatGPT和Llama 2这样的大型语言模型(LLM 广受欢迎。然而，有些应用程序需要使用自定义数据对这些模型进行微调，以获得更好的性能。不幸的是，针对特定应用程序对大型语言模型(LLM 进行微调通常是复杂和令人沮丧的...

生成式AI 2024-02-05 人工智能

999阅读

Segment Anything论文翻译，SAM模型，SAM论文，SAM论文翻译；一个用于图像分割的新任务、模型和数据集；SA-1B数据集

【论文翻译】- Segment Anything / Model / SAM论文论文链接： https://arxiv.org/pdf/2304.02643.pdf https://ai.facebook.com/research/publica...

大数据 2024-02-05 人工智能

1499阅读

首个环视世界模型DrivingDiffusion: BEV数据和仿真新思路！

本文经自动驾驶之心公众号授权转载，转载请联系出处。笔者的一些个人思考在自动驾驶领域，随着BEV-based子任务/端到端方案的发展，高质量的多视图训练数据和相应的仿真场景构建愈发重要。针对当下任务的痛点，“高质量”可以解耦成三个方面：不同维度...

人工智能 2024-02-05 人工智能

1219阅读

一文读懂「AIGC，AI Generated Content」AI生成内容

首先，让我们理解一下这两个概念。 AIGC，或者称之为人工智能生成内容，是指使用AI算法和模型来自动生成全新的、原创的内容。这种内容可以包括文本、图像、音频、视频等各种形式，甚至可以包括一些独特的形式，比如新颖的创意和设计。AIGC的应用领域非常广...

AIGC 2024-02-05 人工智能

1115阅读

【多模态】13、Vision-Language 模型在视觉任务中的调研

文章目录一、简介二、基础知识 2.1 视觉任务的训练策略 2.2 VLM 基础 2.2.1 网络结构 2.2.2 预训练目标函数 2.2.3 评估和下游任务 2.3 数据集三、迁移学习 3.1 使用 prompt tunin...

生成式AI 2024-02-05 人工智能

1184阅读

图感知对比学习提升多变量时间序列分类效果

今天给大家介绍一篇AAAI 2024中，由新加坡科技研究局（A*STAR）和新加坡南洋理工大学联合发表的时间序列分类工作，通过图感知对比学习改善多变量时间序列分类，取得了非常显著的效果提升。图片论文标题：Graph-Aware Contrasting...

大数据 2024-02-04 人工智能

1116阅读

什么是人工智能语音发生器及其工作原理？

近年来，人工智能语音生成器已经成为一项强大的技术，它正在改变人们与机器交互和接收数字内容的方式。创新系统通过使用人工智能模仿人类语音模式来工作，从而产生更真实、更自然的声音。在本文中，我们将探索人工智能生成发音的有趣领域，阐明其内部结构以及使其听起来如...

AIGC 2024-02-04 人工智能

1170阅读

AI绘画stability工具大全

Stability AI 公司的关于AI绘画工具集合，这家公司从Stable Diffusion商业出来，具有能浓厚社区文化，凡事研究AI绘画都会关注这家公司！ Stability AI 的使命是让AI对所有人开放和有益。本文基于Stable Dif...

大数据 2024-02-04 人工智能

958阅读

人工智能：电信行业的希望灯塔

为了有效利用人工智能的变革力量，电信提供商必须从根本上转变思维方式，并采用旨在推动增长的创新商业模式。ChatGPT的出现引发了人们对人工智能的极大兴趣，吸引了从董事会成员和供应商到分析师和活动组织者等各个利益相关者的关注。在这个以数字化转型为主导的时...

人工智能 2024-02-04 人工智能

864阅读

CES 2024的亮点仅仅聚焦AI深度赋能和产业创新吗？｜ DALL-E 3、Stable Diffusion等20+ 图像生成模型综述

随着科技飞速发展，CES（国际消费电子展）已然成为全球科技产业的风向标，每年的CES大会都是业界瞩目的盛事。回顾2024年CES大会，不难发现其亮点纷呈，其中以人工智能的深度赋能为最引人注目之处。AI技术的深入应用成为CES大会上的一大亮点，各大厂商纷纷展...

人工智能 2024-02-04 人工智能

1160阅读

不分割成token，直接从字节中高效学习，Mamba原来还能这样用

在定义语言模型时，通常会使用一种基本分词方法，把句子分为词（word）、子词（subword）或字符（character）。其中，子词分词法一直是最受欢迎的选择，因为它在训练效率和处理词汇表外单词的能力之间实现了自然的折中。然而，一些研究指出了子词分词法...

生成式AI 2024-02-04 人工智能

1114阅读

打破MoE训练效率与性能瓶颈，华为盘古稀疏大模型全新架构LocMoE出炉

2023 年 12 月，首个开源 MoE 大模型 Mixtral 8×7B 发布，在多种基准测试中，其表现近乎超越了 GPT-3.5 和 LLaMA 2 70B，而推理开销仅相当于 12B 左右的稠密模型。为进一步提升模型性能，稠密 LLM 常由于其参数...

生成式AI 2024-02-04 人工智能

903阅读

Agent像人一样分工协作，还能“群聊”交换信息

智能体也要有“规范手册”！一项名为MetaGPT的研究，通过对智能体角色进行明确分工，并要求多个智能体在协作中采用统一规范的“交流格式”等方法，让智能体性能大增。目前，这项研究在GitHub上已狂揽33.6k星，并在深度学习顶会ICLR 2024上被...

大数据 2024-02-04 人工智能

1075阅读

中文创意写作能力超GPT-4，「最会写」的中文大模型Weaver来了

ChatGPT 等通用大模型支持的功能成百上千，但是对于普通日常用户来说，智能写作一定是最常见的，也是大模型最能真正帮上忙的使用场景之一。尽管大模型经常能写出看起来像模像样的文字，但是大多数情况下内容的创意程度和文风都经不起深究。尤其是在创作领域，大模型...

人工智能 2024-02-04 人工智能

1000阅读

【AI绘画】stable diffusion原理解读，通俗易懂，直接喂到你嘴里！！！

手把手教你入门绘图超强的AI绘画，用户只需要输入一段图片的文字描述，即可生成精美的绘画。给大家带来了全新保姆级教程资料包（文末可获取）文章目录一、前言（可跳过）二、stable diffusion 1.clip 2...

AIGC 2024-02-04 人工智能

1107阅读

人工智能大时代——AIGC综述

生成式AI分类模型按照输入输出的数据类型分类，目前主要包括9类。有趣的是，在这些已发布大模型的背后，只有六个组织（OpenAI, Google, DeepMind, Meta, runway, Nvidia）参与部署了这些最先进的模型。...

生成式AI 2024-02-04 人工智能

1058阅读

生成式人工智能应用中的矢量数据库

生成式人工智能凭借其制作文本、图像和音频等新内容的卓越能力，处于技术创新的前沿。这个变革领域的核心是一个经常被忽视的部分：矢量数据库。这些数据库能够熟练地处理复杂的非结构化数据，从而激发人工智能的创造力，证明自己在这一领域的价值无可估量。生成式人...

生成式AI 2024-02-04 人工智能

844阅读

史上首个100%开源大模型重磅登场！破纪录公开代码/权重/数据集/训练全过程，AMD都能训

多年来，语言模型一直是自然语言处理（NLP）技术的核心，考虑到模型背后的巨大商业价值，最大最先进的模型的技术细节都是不公开的。现在，真·完全开源的大模型来了！来自艾伦人工智能研究所、华盛顿大学、耶鲁大学、纽约大学和卡内基梅隆大学的研究人员，联合发表了...

人工智能 2024-02-04 人工智能

830阅读

图领域首个通用框架来了！入选ICLR'24 Spotlight，任意数据集、分类问题都可搞定

能不能有一种通用的图模型—— 它既能够根据分子结构预测毒性，又能够给出社交网络的朋友推荐？或者既能预测不同作者的论文引用，还可以发现基因网络中的人类衰老机制？你还真别说，被ICLR 2024接收为Spotlight的“One for All（OFA）...

生成式AI 2024-02-04 人工智能

902阅读

匿名论文提出奇招，增强大模型长文本能力居然还能这么做

一提到提高大模型长文本能力，就想到长度外推或者上下文窗口扩展? 不行，这些都太费硬件资源了。来看一个奇妙新解: 和长度外推等方法使用KV缓存的本质不同，它用模型的参数来存储大量上下文信息。具体办法就是建一个临时Lora模块，让它仅在长文本生成过程中“流...

生成式AI 2024-02-04 人工智能

850阅读

详解“小而优”的大语言模型Zephyr 7B

Zephyr是Hugging Face发布的一系列大语言模型，使用蒸馏监督微调(dSFT 在更庞大的模型上进行训练，显著提高了任务准确性。 2023年是属于大语言模型(LLM 和开源的一年。许多初创公司和企业开放了模型和权重的源代码，以应对ChatGPT...

人工智能 2024-02-04 人工智能

920阅读

登Nature子刊，滑铁卢大学团队评论「量子计算机+大语言模型」当下与未来

模拟当今量子计算设备的一个关键挑战，是学习和编码量子比特之间发生的复杂关联的能力。基于机器学习语言模型的新兴技术已经显示出学习量子态的独特能力。近日，加拿大滑铁卢大学的研究人员在《Nature Computational Science》发表题为《La...

AIGC 2024-02-04 人工智能

912阅读

击败OpenAI，权重、数据、代码全开源，能完美复现的嵌入模型Nomic Embed来了

一周前，OpenAI 给广大用户发放福利，在下场修复 GPT-4 变懒的问题后，还顺道上新了 5 个新模型，其中就包括更小且高效的 text-embedding-3-small 嵌入模型。我们知道，嵌入是表示自然语言或代码等内容中概念的数字序列。嵌入使...

AIGC 2024-02-04 人工智能

1212阅读

陶哲轩看了都直呼内行！谷歌等用LLM自动证明定理拿顶会杰出论文，上下文越全证得越好

Transformer的技能树是越来越厉害了。来自马萨诸塞大学、谷歌和伊利诺伊大学厄巴纳-香槟分校（UIUC）的研究人员发表了一篇论文，利用大语言模型自动生成定理的完整证明。论文地址：https://arxiv.org/pdf/2303.04910...

AIGC 2024-02-04 人工智能

970阅读