多模态第27页 - AIGC资讯

2028年人类将迎来AGI：DeepMind联合创始人长文预测未来AI发展

10月26日，在X上有三万订阅的Dwarkesh Podcast（矮人播客）主持人Dwarkesh Patel采访了谷歌DeepMind的创始人兼首席AGI科学家Shane Legg。他们讨论了AGI出现的时间节点、可能的AGI新架构、作为下一个行业标...

人工智能 2023-11-13 人工智能

807阅读

语言作“纽带”，拳打脚踢各模态，超越Imagebind

北大联合腾讯打造了一个多模态15边形战士！以语言为中心，“拳打脚踢”视频、音频、深度、红外理解等各模态。具体来说，研究人员提出了一个叫做LanguageBind的多模态预训练框架。用语言作为与其它模态之间的纽带，冻结语言编码器，然后用对比学习方法...

生成式AI 2023-11-13 人工智能

842阅读

通用异常检测新曙光：华科大等揭秘GPT-4V的全方位异常检测表现

异常检测任务旨在识别明显偏离正常数据分布的异常值，在工业检验、医学诊断、视频监控和欺诈检测等多个领域都发挥了重要作用。传统的异常检测方法主要依赖于描述正常数据分布以进行正异常样本的区分。然而，对于实际的应用而言，异常检测也需要理解数据的高层语义，从而深入...

生成式AI 2023-11-13 人工智能

896阅读

AIGC 爆火，浪潮信息要做大模型的数据存储大底座

AIGC 在 2023 年爆火，各类大模型层出不穷，参数动辄达到千亿数量级。这些背后，数据的类型和形式也走向复杂多样。例如大模型会采用到我们真实物理世界中的文字、视觉、音频、3D、雷达、多谱等复杂多样的不同模态信号和数据，数据则又存在结构化、半结构化、非结...

AIGC 2023-11-12 人工智能

848阅读

【AI】文心一言的使用

一、获得内测资格： 1、点击网页链接申请：https://yiyan.baidu.com/ 2、点击加入体验，等待通过二、获得AI伙伴内测名额 1、收到短信通知，点击链接网页Link：https://chat.baidu.com/page/l...

大数据 2023-11-12 人工智能

961阅读

摸着OpenAI过河，百度文心一言能否“重拳出击”？

“文心一言”对标ChatGPT，饱含争议。文心一言作为一款语言大模型，并提出了自己在技术对就业的影响方面的理解，现阶段正处于摸着OpenAI过河的时候，路该如何走？ GPT-4太惊艳，压力给到文心一言这段时间，GPT-4和文心一言前后脚和大家...

生成式AI 2023-11-11 人工智能

796阅读

大语言模型汇总（ChatGPT、盘古、通义、文心一言、混元）

首先就是OpenAI所提出的GPT相关模型，也是目前最火的大语言模型，发布版本已经到了4.0 1.ChatGPT 官网：https://chat.openai.com/chat 如下图是自然语言功能的使用示例 2.华为的盘古模型盘古模型是华为开发...

生成式AI 2023-11-11 人工智能

1137阅读

文心一言（中国版ChatGPT）

百度十年，汇成一言文心一言文心一言（英文名：ERNIE Bot）是百度全新一代知识增强大语言模型，文心大模型家族的新成员，能够与人对话互动，回答问题，协助创作，高效便捷地帮助人们获取信息、知识和灵感。文心一言是知识增强的大语言模型，基于飞桨深...

大数据 2023-11-11 人工智能

1284阅读

OpenAI遭黑客攻击，定制版GPT虽迟但到：今日全量上线

让全球网友崩溃的ChatGPT宕机事件，有了最新消息。 OpenAI通告称，这次事件中发现了服务器遭受黑客攻击的记录。开发者大会后本已经高涨的流量，加上黑客攻击，导致服务器不堪重负，原本周一全量上线GPTs的计划也被迫推迟。不过好消息是，就在刚刚，...

AIGC 2023-11-10 人工智能

781阅读

让AI模型成为GTA五星玩家，基于视觉的可编程智能体Octopus来了

电子游戏已经成为如今现实世界的模拟舞台，展现出无限可能。以游戏《侠盗猎车手》（GTA）为例，在 GTA 的世界里，玩家可以以第一人称视角，在洛圣都(游戏虚拟城市当中经历丰富多彩的生活。然而，既然人类玩家能够在洛圣都里尽情遨游完成若干任务，我们是否也能有一...

AIGC 2023-11-10 人工智能

849阅读

太疯狂，GPTs上线：奥特曼表演手搓马斯克大模型，还有人已搞出第三方市场

前几天开发者大会上 OpenAI 说过，只要买会员，你就可以基于新版 GPT-4 大模型开发自己的应用，大家都跃跃欲试。今天凌晨，这个叫 GPTs 的功能正式开放了。所有的 ChatGPT Plus 订阅用户都可以从头到脚自定义 GPT，无需任何编...

人工智能 2023-11-10 人工智能

800阅读

报道称Stability AI成功融资5000万美元

Stability AI，一家以其Stable Diffusion图像生成软件而闻名的人工智能（AI）初创公司，据报道成功融资5000万美元，资金来自可转换债券。这一现金注入是通过可转换债券获得的，具体细节未透露。图源备注：图片由AI生成，图片授权服务...

AIGC 2023-11-10 人工智能

878阅读

UniPAD：通用自动驾驶预训练模式！各类感知任务都可支持

本文经自动驾驶之心公众号授权转载，转载请联系出处。最近，新论文推陈出新的速度着实太快有点读不过来的感觉。可以看到的是，语言视觉多模态大模型融合已经是业界共识了，UniPad 这篇文章就比较有代表性，多模态的输入，类世界模型的预训练基座模型，同时又方便扩...

人工智能 2023-11-10 人工智能

880阅读

百度文心一言对标 ChatGPT，你怎么看？

文心一言 VS ChatGPT 接受不完美期待进步里程碑意义文心一言初体验 ✔ 文学创作 ✔ 商业文案创作 ✔ 数理逻辑推算 ✔ 中文理解 ✔ 多模态生成写在最后何为文心？“文”就是我们中华语言文字中的文，“...

生成式AI 2023-11-10 人工智能

900阅读

AI视野：ChatGPT和API发生重大中断；GPTs分阶段推出计划延迟；中国第二批11个大模型备案获批；阿里将开源720亿参数大模型

???AI新鲜事 ChatGPT和API发生重大中断! 11月9日凌晨，OpenAI在官网发布，ChatGPT和API发生重大中断，导致全球所有用户无法正常使用，宕机时间超过2小时。OpenAI已经找到问题所在并进行了修复，但仍然不稳定，会继续进行安全监控...

生成式AI 2023-11-09 人工智能

960阅读

【AIGC】1、爆火的 AIGC 到底是什么 | 全面介绍

文章目录一、AIGC 的简要介绍二、AIGC 的发展历程三、AIGC 的基石 3.1 基本模型 3.2 基于人类反馈的强化学习 3.3 算力支持四、生成式 AI（Generative AI） 4.1 单模态 4.1.1 生成式语...

AIGC 2023-11-09 人工智能

1301阅读

【原创】用 VisualGLM 进行AIGC多模识别和内容生成

最近几个月，整个AI行业的LLM（大语言模型）蓬勃发展，除了过去传统的纯文字的多模态能力的视觉语言模型，如 GPT-4，ImageBind等表现令人印象深刻。 ChatGLM-6B是中文用户使用非常舒服的一个开源中文LLM。2023年5月17日，智谱...

人工智能 2023-11-09 人工智能

1026阅读

大语言模型的七大网络安全热门应用

在这个网络威胁攻防日益失衡的时代，飞速发展的人工智能和大型语言模型(LLM 正成为推动网络安全变革的颠覆性力量。面对新兴威胁，人工智能正推动网络安全转向主动、智能防御。人工智能与人类专业知识的结合才是打造下一代网络安全防御的最佳方式。今天，人工智能...

大数据 2023-11-09 人工智能

814阅读

用语言对齐多模态信息，北大腾讯等提出LanguageBind，刷新多个榜单

在现代社会，信息传递和交流不再局限于单一模态。我们生活在一个多模态的世界里，声音、视频、文字和深度图等模态信息相互交织，共同构成了我们丰富的感知体验。这种多模态的信息交互不仅存在于人类社会的沟通中，同样也是机器理解世界所必须面对的挑战。如何让机器像人类...

人工智能 2023-11-09 人工智能

896阅读

GPT-5明年降临？爆料人泄露多模态Gobi就是GPT-5，已初现自我意识

【新智元导读】首届开发者大会余温还在，GPT-5突然被爆2024年初就来。OpenAI首秀可谓是赚足了眼球，一系列新品更新，直接让ChatGPT和API同时崩溃。 OpenAI首届开发者大会，就是一场AI盛宴。 GPT-4Turbo、大幅降价、面向开发者新...

生成式AI 2023-11-09 人工智能

863阅读

vivo开源蓝心大模型BlueLM-7B系列后续还将开源13B以及多模态7B-vl模型

近日，vivo AI正式开源了BlueLM-7B 基础（base）模型和7B 对话 (chat 模型，同时开源了支持32K 的长文本基础 (base 模型和对话 (chat 模型。具体特性如下： vivo表示，后续还将开源13B 模型和支持...

大数据 2023-11-09 人工智能

883阅读

大模型勇闯洛圣都，加封「GTA五星好市民」！南洋理工、清华等发布视觉可编程智能体Octopus：打游戏、做家务全能干

随着游戏制作技术的不断发展，电子游戏已然成为现实世界的模拟舞台。以游戏《侠盗猎车手》（GTA）为例，在GTA的世界里，玩家可以以第一人称视角，在洛圣都（游戏虚拟城市）当中经历丰富多彩的生活。然而，既然人类玩家能够在洛圣都里尽情遨游完成若干任务，我们...

人工智能 2023-11-09 人工智能

1003阅读

在等GPT-5多模态？试试Genmo！Adobe AI首轮内测报告；ChatGPT三条使用哲学与实践；论文追更与阅读神器 | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦！ ? 『微软 New Bing 引入广告』日活跃用户超1亿，探索广告投放的未来微软正在尝试在 New Bing 的聊天回复中投放广告。虽然广告被明确标...

生成式AI 2023-11-09 人工智能

968阅读

文心一言 vs GPT-4 —— 全面横向比较

文心一言 vs GPT-4 —— 全面横向比较 3月15日凌晨，OpenAI发布“迄今为止功能最强大的模型”——GPT-4。我第一时间为大家奉上了体验报告《OpenAI 发布GPT-4——全网抢先体验》。时隔一日，3月16日下午百度发布大语言模型—...

人工智能 2023-11-09 人工智能

1273阅读

解说梅西球赛、英雄联盟，OpenAI GPT-4视觉API被开发者玩出新花样

文章开始，我们先来看一段球赛解说视频：是不是感觉听起来不太对劲？你的感觉没错，因为这段解说是用 AI 生成的，这个大喊「梅西！梅西！」的声音居然来自 AI。这是 X 平台（原推特）博主 @Gonzalo Espinoza Graham 发布的一段视...

生成式AI 2023-11-09 人工智能

872阅读

10分钟定制一个「陈天奇GPT」，OpenAI新品大波实测来袭！Sam Altman降维打击，千家AI初创公司入土

OpenAI首届春晚，创业公司屠杀夜。正如Sam Altman所言：「我们正在孕育新物种，它们正在迅速增殖。」图片可以说，基于OpenAI接口构建创业公司，产品忽然就失去了意义。许多初创公司的产品，已经没有了护城河。杜克大学教授陈怡然表示，照这个...

生成式AI 2023-11-09 人工智能

868阅读

GPT商店已至，AI的爆款应用还有多远？

什么，还必须要关注“技术”想要什么。昨天凌晨，整个AI界发生了一场地震，在被视为“首届AI春晚”的OpenA开发者大会上，GPT-4进行了史诗版本的更新。 128K的超长上下文、成本更低的tokens、全新的Assistants API、新增的多模态功能...

生成式AI 2023-11-09 人工智能

883阅读

全网最全ChatGPT/AIGC报告分析（365份）

本星球整理了365份ChatGPT/AIGC重磅专业报告（更新中…），部分目录如下，请读者搜索关键字，获取报告，学习参阅。 https://mp.weixin.qq.com/s/hvI2Hupjx_mnPh3YGyobww 1、计算机研究报告：Chat...

生成式AI 2023-11-08 人工智能

1028阅读

带你认识一下多模态对比语言图像预训练CLIP

本文分享自华为云社区《多模态对比语言图像预训练CLIP：打破语言与视觉的界限》，作者：汀丶。一种基于多模态（图像、文本）对比训练的神经网络。它可以在给定图像的情况下，使用自然语言来预测最相关的文本片段，而无需为特定任务进行优化。CLIP的设计类似于GP...

生成式AI 2023-11-08 人工智能

879阅读

教育大数据采集机制与关键技术研究

点击上方蓝字关注我们教育大数据采集机制与关键技术研究柴唤友1, 刘三女牙1,2, 康令云1, 张雅娴1, 李卿2, 刘智2 1 华中师范大学国家数字化学习工程技术研究中心，湖北武汉 430079 2 华中师范大...

AIGC 2023-11-08 大数据

1060阅读

多模态音乐AI框架Video2Music 为视频生成情感相符的音乐

近日，一款创新的人工智能多模态音乐生成框架Video2Music引起了广泛关注。该框架利用独特的数据集和经过用户研究验证的转换器模型，能够为视频生成情感上相符的音乐，填补了这一领域的空白。据悉，Video2Music的GitHub Repo已经发布，为研究...

人工智能 2023-11-08 人工智能

1057阅读

思谋科技发布全球首个工业多模态大模型 IndustryGPT V1.0

思谋科技在第六届中国国际进口博览会上发布了全球首个工业多模态大模型 IndustryGPT V1.0。这个大模型通过深度的行业洞察和海量的精炼数据，能够准确回答制造业的问题、识别工业缺陷，并提供决策支持。与此同时，思谋科技还与松下、江森自控等跨国企业...

AIGC 2023-11-08 人工智能

803阅读

北大推出首个多轮多模态PPT任务完成基准PPTC GPT-4完成正确率仅6%

北大和微软亚洲研究院的研究人员提出了一项新的评估基准PPTC，旨在评估大型语言模型在复杂多轮多模态PPT任务中的表现。他们通过创建包含数百个多模态指令的数据集，挑战大模型在多轮人机对话中生成PPT文档的能力。结果显示，GPT-4在创建新PPT文档任务中表...

人工智能 2023-11-07 人工智能

844阅读

百度网盘首页全新改版：个人文档feed流推荐、大模型加持2步内完成所有操作

10月17日在2023百度世界大会上，百度创始人、董事长兼首席执行官李彦宏表示，重构后的百度网盘，不但实现了从图形界面交互到自然语言交互的转变，还增强了多模态信息理解。据了解，自2012年上线至今，百度网盘已积累8亿用户，文件量级达4万亿，每天用户会上传...

AIGC 2023-11-07 人工智能

983阅读

OpenAI推出GPT-4升级版GPT-4 Turbo：功能更强大且更便宜

11月7日消息，据外媒报道，当地时间周一，美国人工智能研究公司OpenAI推出了GPT-4 Turbo，这是其大语言模型GPT-4的升级版本。据悉，OpenAI在今年3月14日推出了第一个版本的GPT-4。它是一个多模态大型语言模型，支持图像和文本输入，...

AIGC 2023-11-07 人工智能

793阅读

GPT-4完成正确率仅6%！北大等提出首个「多轮、多模态」PPT任务完成基准PPTC

【新智元导读】为了填补LLM在复杂多模态环境中利用复杂工具完成多轮、多模态指令的评估空白，研究人员引入了PowerPoint任务完成（PPTC）基准测试，以评估LLM创建和编辑PPT文档的能力。最近对大型语言模型（例如ChatGPT和GPT-4）进行的评...

人工智能 2023-11-07 人工智能

901阅读

深夜炸场，ChatGPT一周年：无需编程，全民定义GPT的时代，来了！

撰稿 | 云昭深夜又是一场王炸！在ChatGPT发布一周年之际，OpenAI 创始人Altman 在首届开发者大会上全场放大招，台下掌声不断。无需编程，甚至无需敲键盘，单纯通过语音聊天就能构建一个专属自定义的GPT！这个消息实在太燃了！以至于推特...

人工智能 2023-11-07 人工智能

789阅读

GPT-4重磅升级！OpenAI发布GPT-4 Turbo：更强大还更便宜

快科技11月7日消息，当地时间周一，OpenAI首届开发者大会如期召开，在大会上OpenAI正式推出了GPT-4 Turbo。据OpenAI介绍，相比于GPT-4，GPT-4 Turbo主要有6方面的提升：第一，上下文对话长度，GPT4最大只能支持8k...

人工智能 2023-11-07 人工智能

882阅读

联发科发布天玑9300生成式AI移动芯片支持运行330亿参数大模型

昨日晚间，联发科技发布了天玑9300旗舰5G 生成式 AI 移动芯片，采用台积电第三代4nm 制程。该芯片预计于2023年底上市。这款芯片采用全大核架构设计，提供高智能、高性能、高能效、低功耗的特性，为用户带来卓越的生成式 AI 体验。天玑9300采...

AIGC 2023-11-07 人工智能

833阅读

加量降价！OpenAI推出史上最强ChatGPT，人人可自定义GPT，GPT商店本月上线

很快，GPT系列都将可以通过GPT商店访问。是的，这是在OpenAI首次举办的首次开发者大会DevDay上，官方亲自宣布的消息。在旧金山的开发者大会上，除了官宣GPT商店外，OpenAI还表示会有一款更便宜的GPT-4，为开发者在应用程序中的使用...

AIGC 2023-11-07 人工智能

873阅读

ChatGPT王炸升级！更强版GPT-4上线，API定价打骨折，发布现场掌声没停过

ChatGPT，今天裂变成无数个GPT。 OpenAI在首届开发者日上，正式公布自定义GPT。还将上线“GPT商店”，与创作者分享收入。 CEO山姆·奥特曼现场登台演示，3分钟不到，只凭几步操作做好一个“创业导师GPT”。接下来，“创业导师GPT...

AIGC 2023-11-07 人工智能

950阅读

天玑9300 AI能力飙升：最高支持330亿参数的AI大语言模型

快科技11月6日消息，联发科今晚正式发布天玑9300旗舰5G生成式AI移动芯片，支持在端侧生成式AI、游戏、影像等方面定义旗舰新体验。据介绍，天玑9300集成MediaTek第七代AI处理器APU 790，为生成式AI而设计，其性能和能效得到显著提升，整...

人工智能 2023-11-07 人工智能

797阅读

AI视野：xAI首个大模型Grok炸场;李开复官宣开源大模型Yi-34B;ChatGPT原型Gizmo新功能曝光;百度网盘引入大模型智能助理

????大模型动态李开复官宣全球最强开源大模型Yi-34B 一次可处理40万汉字零一万物发布全球最强的开源大模型Yi-34B，具备超强的语言理解和处理能力，支持处理40万汉字，在中文指标上表现卓越，标志着中国在大模型领域的重大突破。项目地址:htt...

AIGC 2023-11-06 人工智能

933阅读

大型语言模型（LLM）技术精要，不看亏了

哈喽，大家好。今天分享一篇知乎高赞文章，作者是张俊林老师。图片读完收获很多，能帮大家更好地理解、学习大模型。原文有2.8w字，我提炼了核心要点，阅读需要10min。 ChatGPT的出现给很多人带来了惊喜和醒悟。有人惊喜地发现大型语言模型（LLM）...

AIGC 2023-11-06 人工智能

967阅读

李开复领队开源大模型 Yi，40万字上下文窗口破纪录

由李开复博士亲自下场创办的零一万物（01.ai），自3月底官宣成立后，于近日发布并开源了两个版本的中英文大模型 Yi-6B 和 Yi-34B。在线上发布环节，李开复博士重点介绍了 Yi 系列大模型的三处性能亮点: 全球最长200K 上下文窗口，免费开...

AIGC 2023-11-06 人工智能

985阅读

北大具身智能新成果：无需训练，听指令就能灵活走位

北京大学董豪团队具身导航最新成果来了：无需额外建图和训练，只需说出导航指令，如： Walk forward across the room and walk through the panty followed by the kitchen. Stan...

人工智能 2023-11-06 人工智能

913阅读

马斯克版ChatGPT爆火来袭！不用Python，11人爆肝两个月

马斯克突然出手截胡，抢在OpenAI开发者大会前发布大模型Grok。与其他ChatGPT类产品不同，Grok可以实时从?推文中获取最新知识，比如马斯克刚刚与Joe Rogan的最新访谈。图片巨量、实时且独特的?数据构成了Grok的最大护城河，早在7...

AIGC 2023-11-06 人工智能

845阅读

全球首发！总结七十余种开源数据集，一览自动驾驶开源数据体系

本文经自动驾驶之心公众号授权转载，转载请联系出处。基于数据驱动的各类深度学习模型任务，近年来随着数据集规模的不断扩大，性能逐渐被提升，国内外各大自动驾驶公司都在不断建立自己的数据库，以及数据闭环系统，期待数据的丰富能够解决下半场自动驾驶问题，那么如何...

AIGC 2023-11-06 人工智能

913阅读

知乎“知海图AI”大模型开放服务相关产品将择机上线

知乎宣布，旗下的“知海图AI”大模型即将面向社会公众开放服务。该大模型具备千亿级参数和更强的逻辑推理能力，旨在持续赋能创作者、讨论场、信息获取、内容运营等各项业务场景。知乎在2023年4月推出了首个中文大模型“知海图AI”，该大模型在成熟大模型CPM-B...

AIGC 2023-11-05 人工智能

904阅读

AI能理解自己生成的东西吗? 在GPT-4、Midjourney上实验后，有人破案了

从 ChatGPT 到 GPT4，从 DALL・E 2/3 到 Midjourney，生成式 AI 引发了前所未有的全球关注。强大的潜力让人们对 AI 产生了许多期待，但是强大的智能也会引发人们的恐惧和担忧。近期大牛们针对该问题还上演了一场激烈的论战。先...

AIGC 2023-11-05 人工智能

861阅读