多任务第4页 - AIGC资讯

广义人工智能时代：通往通用人工智能（AGI）之路

人工智能(AI 将于2024年进一步改进，大型语言模型有望进一步发展。 2023年对于人工智能和生成式人工智能来说是激动人心的一年，特别是那些采用大型语言模型(LLM 架构的人工智能，比如来自开放人工智能(GPT 4 、Anthropic(Claud...

AIGC 2024-01-16 人工智能

920阅读

OpenAI Whisper论文笔记

OpenAI Whisper论文笔记 OpenAI 收集了 68 万小时的有标签的语音数据，通过多任务、多语言的方式训练了一个 seq2seq （语音到文本）的 Transformer 模型，自动语音识别（ASR）能力达到商用水准。本文为李沐老师论文精...

人工智能 2024-01-15 人工智能

953阅读

AI看图猜位置，准确率超90%！斯坦福最新PIGEON模型：40%预测误差不到25公里

随手在网络上发布的一张照片，能暴露多少信息？外国的一位博主@rainbolt就长年接受这种「照片游戏」的挑战，网友提供照片，他来猜测照片的具体拍摄地，有些照片甚至还能猜到具体的航班细节。是不是细思极恐？但「照片挑战」也同样抚慰了很多人心中的遗憾，...

生成式AI 2024-01-15 人工智能

1012阅读

【AIGC】大模型协作系统 HuggingGPT 深度解析

欢迎关注【youcans的 AIGC 学习笔记】原创作品【AIGC】大模型协作系统 HuggingGPT 深度解析 1. 摘要 2. 前言 3. HugginGPT 大模型协作系统 3.1 任务规划 3.2 模型选择 3.3 任务执行...

人工智能 2024-01-15 人工智能

1050阅读

OpenAI的人工智能语音识别模型Whisper详解及使用

1 whisper介绍拥有ChatGPT语言模型的OpenAI公司，开源了 Whisper 自动语音识别系统，OpenAI 强调 Whisper 的语音识别能力已达到人类水准。 Whisper是一个通用的语音识别模型，...

生成式AI 2024-01-14 人工智能

3372阅读

国内多所高校共建开源社区LAMM，加入多模态语言模型大家庭的时候到了

ChatGPT问世以来，大语言模型（LLM）实现了跳跃式发展，基于自然语言进行人机交互的AI范式得到广泛运用。然而，人类与世界的交互中不仅有文本，其他诸如图片、深度等模态也同样重要。然而，目前的多模态大语言模型（MLLM）研究大多数闭源，对高校和大多数研...

大数据 2024-01-14 人工智能

1015阅读

实测OPPO大模型手机：路人甲一抹就没，电话粥一键总结

都说2024会是AI Agent元年，杀手级应用将要出现。但就在开年，已经看到不一样的思路。与其做单个Agent应用，不如把系统能力提升为Agent级。不仅让大模型加持智能助手，还能让系统工具也具备AIGC能力。比如一键消除照片中的人群: 让AI...

生成式AI 2024-01-13 人工智能

951阅读

蚂蚁营销推荐场景上的因果纠偏方法

一、因果纠偏的背景 1、偏差的产生推荐系统里根据收集的数据来训练推荐模型，给用户推荐一个合适的 item，当用户与这个 item 产生交互后，数据又会被收集用于继续训练模型，从而形成一个闭环。但是这个闭环当中可能会存在各种各样的影响因素，因此会产生误差...

生成式AI 2024-01-09 人工智能

851阅读

AIGC之文本内容生成概述（下）——Transformer

在上一篇文章中，我们一口气介绍了LSTM、Word2Vec、GloVe、ELMo等四种模型的技术发展，以及每种模型的优缺点与应用场景，全文超过一万字，显得冗长且繁杂，在下文部分我们将分开介绍Transformer、BERT、GPT1/GPT2/GPT3/C...

生成式AI 2024-01-08 人工智能

1031阅读

学习实践-Whisper语音识别模型实战（部署+运行）

1、Whisper内容简单介绍 OpenAI的语音识别模型Whisper，Whisper 是一个自动语音识别（ASR，Automatic Speech Recognition）系统，OpenAI 通过从网络上收集了 68 万小时的多语言（98 种语言）...

生成式AI 2024-01-08 人工智能

1115阅读

轻量级模型，重量级性能，TinyLlama、LiteLlama小模型火起来了

当大家都在研究大模型（LLM）参数规模达到百亿甚至千亿级别的同时，小巧且兼具高性能的小模型开始受到研究者的关注。小模型在边缘设备上有着广泛的应用，如智能手机、物联网设备和嵌入式系统，这些边缘设备通常具有有限的计算能力和存储空间，它们无法有效地运行大型语...

AIGC 2024-01-08 人工智能

865阅读

MongoDB携手亚马逊云科技优化Amazon CodeWhisperer建议，助力开发者在MongoDB上构建应用程序

MongoDB (NASDAQ: MDB 和亚马逊 (NASDAQ: AMZN 旗下的亚马逊云科技（AWS）今日宣布，双方正在协作优化Amazon CodeWhisperer，为在MongoDB上的应用程序开发和改进工作提供更好的建议和支持。Mongo...

人工智能 2024-01-08 人工智能

856阅读

Make-A-Video（造啊视频）——无需文字-视频数据的文字转视频（文生视频）生成方法

AIGC 2024-01-07 人工智能

1642阅读

万字长文谈自动驾驶BEV感知

本文经自动驾驶之心公众号授权转载，转载请联系出处。 prologue 这有可能是更的最长的文章系列了，先说为什么，一方面是看到分割大模型对小模型的提升效果需要时间，另一方面是之前对自动驾驶的BEV算法做了很长时间的预研，自己也应该好好梳理一下了。（很...

生成式AI 2024-01-07 人工智能

1127阅读

AI平台：Microsoft - 云、计算机、应用和游戏

Microsoft - 云、计算机、应用和游戏...

人工智能 2024-01-06 人工智能

937阅读

AI平台：文心大模型-产业级知识增强大模型

文心大模型-产业级知识增强大模型···大模型···产品中心···星河社区···合作咨询···文心一言，你的智能伙伴有用、有趣、有温度写方案、想点子、问万事、闲聊天现已全面开放，快来和我聊天吧查看详情两小时玩转大模型创意应用学习课程文心一言向全社会开放文心一...

生成式AI 2024-01-06 人工智能

1181阅读

看见这张图没有，你就照着画：谷歌图像生成AI掌握多模态指令

用图2的风格画图1的猫猫并给它戴上一顶帽子。谷歌新设计的一种图像生成模型已经能做到这一点了!通过引入指令微调技术，多模态大模型可以根据文本指令描述的目标和多张参考图像准确生成新图像，效果堪比 PS 大神抓着你的手助你 P 图。在使用大型语言模型（LLM...

AIGC 2024-01-06 人工智能

829阅读

一个评测模型+10个问题，摸清盘古、通义千问、文心一言、ChatGPT的“家底”！...

‍数据智能产业创新服务媒体 ——聚焦数智 · 改变商业毫无疑问，全球已经在进行大模型的军备竞赛了，“有头有脸”的科技巨头都不会缺席。昨天阿里巴巴内测了通义千问，今天华为公布了盘古大模型的最新进展。不久前百度公布了文心一言...

生成式AI 2024-01-06 人工智能

963阅读

斯坦福炒虾机器人爆火全网！华人团队成本22万元，能做满汉全席还会洗碗

今天，会做一大桌子菜的斯坦福机器人Mobile ALOHA刷屏全网。滑蛋虾仁、干贝烧鸡、蚝油生菜，色香味俱全，看着很诱人。就拿滑蛋虾仁这道菜来说，Mobile ALOHA在烧水的过程中先打上3颗鸡蛋，然后把虾仁放到水中焯熟，平底锅倒入鸡蛋液再加入...

AIGC 2024-01-04 人工智能

850阅读

百度大模型这一年：文心一言国内首个用户破亿，飞桨开发者超千万

文心一言用户规模破1亿，飞桨的开发者数量达到1070万。只用短短两个月，文心大模型4.0整体效果又提升了32%。 2023年12月28日，在刚刚过去的 WAVE SUMMIT+2023深度学习开发者大会上，百度揭幕了文心大模型与深度学习平台飞桨的一系列新...

大数据 2024-01-03 人工智能

853阅读

肖仰华：走向千行百业的大模型

现如今，我们站在了大模型技术和产业发展的中场思考阶段。这个阶段的开启源于 ChatGPT 的诞生，它引发了广泛而深入的关注。尽管这种关注对于推动技术和产业的发展起到了至关重要的作用，但同时我们也看到了一系列问题的浮现。这些问题包括成本和价值的问题以及一些...

人工智能 2024-01-03 人工智能

928阅读

ChatGPT变笨新解释：世界被AI改变，与训练时不同了

对于ChatGPT变笨原因，学术界又有了一种新解释。加州大学圣克鲁兹分校一项研究指出: 论文重点研究了“任务污染”问题，也就是大模型在训练时期就见识过很多任务示例，给人一种AI拥有零样本或少样本能力的错误印象。也有学者从另一个角度指出，大模型训练...

大数据 2024-01-01 人工智能

814阅读

盘古智能体（Pangu-Agent）的五个创新点

随着大规模语言模型（Large Language Model，LLM）的发展和应用，人工智能领域出现了一种新的研究方向，即基于LLM的自主智能体（LLM-based Autonomous Agent）。这种智能体利用LLM的强大的表示能力和生成能力，可以...

AIGC 2023-12-29 人工智能

1397阅读

字节具身智能新成果：用大规模视频数据训练GR-1，复杂任务轻松应对

最近 GPT 模型在 NLP 领域取得了巨大成功。GPT 模型首先在大规模的数据上预训练，然后在特定的下游任务的数据上微调。大规模的预训练能够帮助模型学习可泛化的特征，进而让其轻松迁移到下游的任务上。但相比自然语言数据，机器人数据是十分稀缺的。而且机器...

人工智能 2023-12-29 人工智能

817阅读

这次重生，AI要夺回网文界的一切

重生了，这辈子我重生成了 MidReal。一个可以帮别人写「网文」的 AI 机器人。这段时间里，我看到很多选题，偶尔也会吐槽一下。竟然有人让我写写 Harry Potter。拜托，难道我还能写的比 J・K・Rowling 更好不成？不过，...

生成式AI 2023-12-29 人工智能

837阅读

2024年十大网络技术预测

全球电信行业大咖对2024年的预测虽然5G覆盖全球，人工智能重塑网络，数据中心发生变化，但于电信而言，前方的道路仍很复杂。消除数字鸿沟、防范复杂的欺诈行为、倡导可持续发展，同时谨慎采用新技术，这些都是2024年的优先事项。随着生成式人工智能接管移动...

人工智能 2023-12-28 人工智能

875阅读

一文读懂常用的 “生成式 AI 库”

Hello folks，我是 Luga，今天我们继续来聊一下人工智能（AI）生态领域相关的技术 - GenerativeAI Library（生成式 AI 库），本文将继续聚焦在针对 Gen AI Library 的技术进行解析，使得大家能够了解 G...

AIGC 2023-12-26 人工智能

1244阅读

华为诺亚的盘古Agent来了，让智能体学会结构化推理

自 AI 诞生以来，开发能够解决和适应复杂工作的多任务智能体（Agent）一直是个重要的目标。 AI 智能体对于许多应用至关重要，研究者通常用强化学习方法通过环境交互来培养智能体的决策技能。基于模型和无模型的深度强化学习方法都已取得了广为人们所知的成就，...

AIGC 2023-12-26 人工智能

963阅读

AIGC音乐生成#riff + diffusion 以生成频谱图图像来转换为音乐 | 无界日报第2期

小杜无界日报第2期，本期头条 - stable diffusion 微调模型 riff + diffusion 以生成频谱图图像来转换为音乐。无界日报 2022.12.16 第02期 - 头条 - riff +...

AIGC 2023-12-26 人工智能

964阅读

基于whisper模型的在线添加视频字幕网站（持续更新）

1.什么是whisper Whisper 是一个自动语音识别（ASR，Automatic Speech Recognition）系统，OpenAI 通过从网络上收集了 68 万小时的多语言（98 种语言）和多任务（multitask）监督数据对 Whi...

大数据 2023-12-26 人工智能

1418阅读

一文看懂ChatGPT对美国企业带来了哪些影响

ChatGPT 自问世以来，一直在 AI 技术创新领域扮演着改变游戏规则的角色。美国是全球 ChatGPT 用户中最多的国家，占总数的15%。ChatGPT 在美国的企业中的使用就像是一把魔杖，快速改变着各行各业。目前，公司正在探索如何使用 AI，尤其是...

大数据 2023-12-25 人工智能

888阅读

李飞飞DeepMind全新「代码链」碾压CoT！大模型用Python代码推理，性能暴涨12%

思维链（CoT），最具开拓性和影响力的提示工程技术之一，能增强LLM在推理决策中的表现。那么，如果大模型可以在代码中「思考」，会如何呢？最近，谷歌DeepMind、斯坦福、UC伯克利团队联手提出了全新技术——「代码链」（CoC）。论文地址：htt...

大数据 2023-12-25 人工智能

917阅读

whisper

Robust Speech Recognition via Large-Scale Weak Supervision 介绍大规模弱监督的训练。先前的方法都是通过大量的无监督学习训练（无监督的数据容易收集，所以通过大量无监督的学习可以训练出一个质量...

生成式AI 2023-12-23 人工智能

992阅读

开发者笑疯了！ LLaMa惊天泄露引爆ChatGPT平替狂潮，开源LLM领域变天

来源: 新智源微信号：AI-era Meta的LLaMA模型开源，让文本大模型迎来了Stable Diffustion时刻。谁都没想谁能想到，一次意外的LLaMA泄漏，竟点燃了开源LLM领域最大的创新火花。一系列表现出色的Chat...

大数据 2023-12-21 人工智能

963阅读

【小沐学Python】Python实现语音识别（Whisper）

文章目录 1、简介 1.1 whisper简介 1.2 whisper模型 2、安装 2.1 whisper 2.2 pytorch 2.3 ffmpeg 3、测试 3.1 命令测试 3.2 代码测试：识别声音文件 3.3 代码测试：...

生成式AI 2023-12-20 人工智能

1428阅读

摸底谷歌Gemini：CMU全面测评，Gemini Pro不敌GPT 3.5 Turbo

前段时间，谷歌发布了对标 OpenAI GPT 模型的竞品 ——Gemini。这个大模型共有三个版本 ——Ultra（能力最强）、Pro 和 Nano。研究团队公布的测试结果显示，Ultra 版本在许多任务中优于 GPT4，而 Pro 版本与 GPT-3...

人工智能 2023-12-20 人工智能

867阅读

AIGC大记事【2023-0625】【第五期】：《时代》专访ChatGPT之父：人工智能影响经济还需要很多年

大咖观点：《时代》专访ChatGPT之父：人工智能影响经济还需要很多年孙正义：我每天和ChatGPT聊天，一场巨大革命即将到来，软银“终将统治世界！” 刘慈欣谈 ChatGPT：人类的无能反而是人类最后的屏障 AI时代已来，吴恩达呼吁向每个孩...

生成式AI 2023-12-20 人工智能

932阅读

深度学习之目标检测中的常用算法

随着深度学习的不断发展，深度卷积神经网络在目标检测领域中的应用愈加广泛，现已被应用于农业、交通和医学等众多领域。与基于特征的传统手工方法相比，基于深度学习的目标检测方法可以学习低级和高级图像特征，有更好的检测精度和泛化能力。什么是目标检测？目标检测...

AIGC 2023-12-19 人工智能

1510阅读

GPT-4V都搞不明白的未来推理有解法了！来自华科大&上科大

多模态大语言模型展现了强大的图像理解和推理能力。但要让它们基于当前观测来对未来事件进行预测推理仍然非常困难。即便是当前最强大的GPT-4V（如下图所示），也无法很好地解决这一问题。 △ GPT-4V的错误案例现在，华科大和上科大团队提出了一个赋予...

生成式AI 2023-12-18 人工智能

868阅读

AIGC系列之：CLIP和OpenCLIP

目录模型背景 CLIP模型介绍相关资料原理和方法 Image Encoder Text Encoder 对比学习预训练 Zero Shot预测优势和劣势总结 OpenClip模型介绍相关资料原理结果用法...

人工智能 2023-12-17 人工智能

3150阅读

理想汽车全自研大模型Mind GPT 综合性评测榜单双榜第一

快科技12月16日消息，理想汽车官方发文称，理想自研Mind GPT中文大模型综合性评测榜单双榜第一。两大冠军如下: 1、C-Eval中文大模型综合性测评榜冠军 C-Eval是清华大学、上海交通大学和爱丁堡大学合作构建的中文语言模型综合性考试评估套件，...

生成式AI 2023-12-16 人工智能

816阅读

xAI Grok测试资格怎么获取推特AI助手怎么样

xAI Grok是一款人工智能聊天机器人，它利用大型语言模型（LLM）提供人机对话交互，可以回答各种问题，甚至建议要问什么问题。它还具有实时信息检索、幽默和叛逆的特性，使其与其他聊天机器人如ChatGPT和Bard有所不同。那么xAI Grok在哪里可以体...

大数据 2023-12-15 人工智能

963阅读

专家表示：AI在学校作弊问题上的担忧目前尚无根据

近期关于学生利用人工智能（AI）进行学术作弊的担忧似乎有些过于夸张。斯坦福教育学者进行了匿名调查和随访焦点小组讨论，针对高中生的使用情况，发现自ChatGPT一年多前问世以来，作弊率虽然一直相对较高，但并未呈现明显增长的趋势。图源备注：图片由AI生成，...

生成式AI 2023-12-15 人工智能

845阅读

首个「创造式任务」基准来了！北大清华联手发布Creative Agents：专为想象力而生！

近年来，许多研究通过训练服从自然语言指令的智能体，让智能体具有了解决各种开放式任务的能力。例如，SayCan[1]利用语言模型实现了根据语言描述解决各种室内机器人任务的智能体，Steve-1[2]训练端到端的策略实现了能够在《我的世界》（Minecra...

AIGC 2023-12-14 人工智能

872阅读

仿人脑神经开发AI！剑桥大学最新研究登Nature子刊，人造大脑成AI新方向

人脑作为地球上最复杂的智能载体，一个最大的特点就是能高能效地产生智能。如果能尽可能按照人脑的工作原理来创建AI系统，将会大大提高AI的工作效率，大幅降低能耗。最近，剑桥大学做了这么项研究，就是想找到一个条路径，让AI系统复制人脑。论文地址：http...

生成式AI 2023-12-11 人工智能

927阅读

谷歌祭出多模态“杀器” Gemini真能碾压GPT-4吗？

“最大”、最有能力”、“最佳”、“最高效”，谷歌为其12月7日新发布的多模态大模型Gemini冠上了好几个“最”，与OpenAI GPT-4“比高高”的胜负欲呼之欲出。区分为Ultra、Pro、Nano三个尺寸的Gemini，不仅号称在各种“AI考试”中...

人工智能 2023-12-11 人工智能

1109阅读

【多模态】5、BLIP | 统一理解与生成任务为图像生成更高质量的文本描述

文章目录一、背景二、方法 2.1 模型结构 2.2 Pre-training Objectives 2.3 CapFilt 三、效果 3.1 训练细节 3.2 CapFilt 的效果 3.3 样本多样性是文本合成器的关键 3.4 参数...

AIGC 2023-12-09 人工智能

2080阅读

音频提取字幕开源模型-whisper

介绍 Whisper 是一种通用的语音识别模型。它是在包含各种音频的大型数据集上训练的，也是一个可以执行多语言语音识别、语音翻译和语言识别的多任务模型。地址：openai/whisper whisper-webui OpenAI 的 Whis...

生成式AI 2023-12-09 人工智能

1100阅读

【Whisper】《OpenAI Whisper 精读【论文精读】》学习笔记

方法 Whisper在论文中表示使用单模型（single model）来完成多个语音任务（multitask），李沐教授认为优点是设计上比较干净； I. 关于单模型效果的疑问但是他同时也提出了两个疑问：使用单模型会不会跑得不够快（因为保证...

AIGC 2023-12-09 人工智能

779阅读

北大等发布最新AI智能体Jarvis-1，制霸「我的世界」

智能体研究又取得了新成绩！最近，来自北大、北邮、UCLA和BIGAI的研究团队联合发表了一篇论文，介绍了一个叫做Jarvis-1的智能体。论文地址：https://arxiv.org/pdf/2311.05997.pdf 从论文标题来看，Jarvi...

AIGC 2023-12-08 人工智能

876阅读