多模态第19页 - AIGC资讯

清华、小米、华为、 vivo、理想等多机构联合综述，首提个人LLM智能体、划分5级智能水平

嘿 Siri、你好小娜、小爱同学、小艺小艺、OK Google、小布小布…… 想必这些唤醒词中至少有一个曾被你的嘴发出并成功呼唤出了一个能给你导航、讲笑话、添加日程、设置闹钟、拨打电话的智能个人助理（IPA）。可以说 IPA 已经成了现代智能手机不可或缺...

AIGC 2024-01-22 人工智能

864阅读

AI视野：Adobe发布视频模型ActAnywhere；SVD将强势升级；新壹视频大模型通过备案；三星Galaxy AI两年内将开启付费

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ ???AI应用 Adobe发布视频...

AIGC 2024-01-22 人工智能

836阅读

谷歌AI聊天机器人在线使用地址 Gemini官网体验入口

Gemini是谷歌DeepMind推出的新一代人工智能系统。它能够进行多模态推理，支持文本、图像、视频、音频和代码之间的无缝交互。Gemini在语言理解、推理、数学、编程等多个领域都超越了之前的状态，成为迄今为止最强大的AI系统之一。它有三个不同规模的版本...

人工智能 2024-01-22 人工智能

1686阅读

ChatGPT 和文心一言两大AI助手的比较

一背景 ChatGPT是由OpenAI开发的，它可以理解自己生成的内容，并根据输入的上下文进行推理和生成回复。这种自我理解的能力使得ChatGPT在处理复杂对话和问题时具有优势。然而，ChatGPT的缺点是只能根据预先设定的规则和模板回...

大数据 2024-01-22 人工智能

2374阅读

GPT-5被5万张H100卡脖子！Altman急筹数十亿美元，欲取代英伟达建起AI芯片帝国

Sam Altman正在筹集数十亿美元，建立一个全球性的半导体晶圆厂网络！这一事件背后的原因很可能就是，OpenAI已经无「芯」训练「GPT-5」了。此前，据英国《金融时报》报道，OpenAI 正在开发一种新的AI模型，该模型将是 GPT-4 的「重...

生成式AI 2024-01-22 人工智能

1013阅读

Agent触摸汉堡辨冷热，首次拥有类人感官！UCLA等发布3D多模态交互具身智能大模型

具身智能，是大模型未来应用的一个重要方向。现在，大模型加持下的智能体，能够参与3D环境，不仅有了听觉视觉，还有了触觉等多种感官能力。卧室里有什么物体，一眼辨认。听到门铃响了，LLM便会告诉你家里来客人了。大模型加持的NPC，在触摸桌子的香蕉后，...

大数据 2024-01-22 人工智能

1112阅读

AI对比：ChatGPT与文心一言的异同与未来

文章目录 ?前言一、ChatGPT和文心一言概述 1.1 ChatGPT 1.2 文心一言二、ChatGPT和文心一言比较 2.1 训练数据与知识储备 2.2 语义理解与生成能力 2.2 应用场景与商业化探索三、未来展望 3.1...

人工智能 2024-01-22 人工智能

1199阅读

AIGC文生图及工具产品简介

AIGC，全称是人工智能生成内容（Artificial Intelligence Generated Content）是继UGC（用户生成内容），PGC（平台生成内容）后，利用人工智能技术，自动生成内容的生产方式；目前主要利用&集成自然语言处理、...

大数据 2024-01-22 人工智能

1365阅读

第二证券：AIGC概念活跃，焦点科技、三维通信涨停，万兴科技大涨

AIGC概念24日盘中走势生动，到发稿，万兴科技、三态股份涨超10%，焦点科技、三维通讯、我国科传等涨停，中文在线涨超9%，果麦文明、新国都涨约7%。消息面上，各大电商途径于10月18-24日先后发动“双11”大促或预售，2023年“双11”活动优惠全...

生成式AI 2024-01-22 人工智能

811阅读

Video-LLaMA 论文精读

Video-LLaMA: An Instruction-tuned Audio-Visual Language Model for Video Understanding video-LLaMA 一种用于视频理解的指令调整视听语言模型引言 ...

大数据 2024-01-22 人工智能

1010阅读

4个令人惊艳的ChatGPT项目，开源了！AIGC也太猛了...

大家好啊～自从 ChatGPT、Stable Diffusion 发布以来，各种相关开源项目百花齐放，着实让人应接不暇。今天，我将着重挑选几个优质的开源项目，对我们的日常工作、学习生活，都会有很大的帮助。今天整理分享给大家，希望对你有所帮助。...

大数据 2024-01-22 人工智能

878阅读

一文了解AIGC与ChatGPT

关注微信公众号掌握更多技术动态 --------------------------------------------------------------- 一、AIGC简介 1.AIGC基础 (1 AIGC是什么 AIGC是人...

人工智能 2024-01-22 人工智能

1608阅读

一张图500元是目前AIGC最高“回报”？小冰李笛：调用API的商业模式不适用于未来 | MEET 2024...

编辑部发自凹非寺量子位 | 公众号 QbitAI AIGC在商业界中，最大的一笔回报是多少？答案可能是：一张图片，500元。而且这就是发生在最近、号称人工智能著作权第一案的真实案例： A利用人工智能技术生成了一张图片，...

人工智能 2024-01-21 人工智能

936阅读

GPT-4V惨败！CV大神谢赛宁新作：V*重磅「视觉搜索」算法让LLM理解力逼近人类

Sam Altman最近在世界经济论坛上发言，称达到人类级别的AI很快就会降临。但是，正如LeCun一直以来所言，如今的AI连猫狗都不如。现在看来的确如此。 GPT-4V、LLaVA等多模态模型图像理解力足以让人惊叹。但是，它们并非真的能够做的面面俱到。...

大数据 2024-01-21 人工智能

899阅读

AIGC内容分享(九)：2024 AIGC应用层十大趋势

目录前言展望未来前言我国正在经历经济发展的重要时刻，以生成式人工智能等为代表的智能经济活动逆势增长，成为我国推动经济持续增长、构筑科技创新和产业升级之基，也成为支撑经济体系现代化的新引擎。工业和信息化部的统计数据显示，1-10月份，我...

AIGC 2024-01-21 人工智能

919阅读

AIGC原理：扩散模型diffusion综述一：面向视觉计算的扩散模型研究进展

论文地址：State of the Art on Diffusion Models for Visual Computing ? 贴一幅SGM（Score-based Generative Model）的原因是宋飏博士将他2019年提出的SMLD模型和20...

AIGC 2024-01-20 人工智能

1945阅读

AIGC、ChatGPT、GPT系列？我的认识

AIGC（AI generated content），新型内容生产方式。AIGC是利用人工智能技术来生成内容，也就是，它可以用输入数据生成相同或不同类型的内容，比如输入文字、生成文字，输入文字、生成图像等。 GPT-3是生成型的预训练变换模型，是...

大数据 2024-01-20 人工智能

915阅读

AI游戏设计的半年度复盘；大模型+智能音箱再起波澜；昇思大模型技术公开课第2期；出海注册经验分享；如何使用LoRA微调Llama 2 | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦！ ? 进步or毁灭：Nature 调研显示 1600+ 科学家对AI的割裂态度国际顶级期刊 Nature 最近一项调研很有意思，全球 1600 多名科...

人工智能 2024-01-20 人工智能

968阅读

智能车的「ChatGPT时刻」，还有多远？

要说今年“科技春晚”CES上最吸引眼球的是什么，智能车当属其一。毕竟大模型一上车，智能座舱都卷成酱婶了：让车上的数字助手帮忙记录约饭日程，Ta能直接帮你把餐厅也给预定了。 △骁龙座舱平台效果展示规划路线这种事儿也变得充满巧思，数字助手会根据你的习...

生成式AI 2024-01-19 人工智能

817阅读

谷歌AI多模态人工智能系统网页版在线使用地址 Gemini官网体验入口

Gemini是谷歌DeepMind推出的新一代人工智能系统。它能够进行多模态推理，支持文本、图像、视频、音频和代码之间的无缝交互。Gemini在语言理解、推理、数学、编程等多个领域都超越了之前的状态，成为迄今为止最强大的AI系统之一。它有三个不同规模的版本...

大数据 2024-01-19 人工智能

1529阅读

llama.cpp模型推理之界面篇

目录前言一、llama.cpp 目录结构二、llama.cpp 之 server 学习 1. 介绍 2. 编译部署 3. 启动服务 4、扩展或构建其他的 Web 前端 5、其他前言在《基于llama.cpp学习开源LL...

大数据 2024-01-19 人工智能

1872阅读

一键实景转动画，清华系初创公司全球首发4D骨骼动画框架，还能生成个性化角色

前几日，苹果宣布首款虚拟头显设备 Vision Pro 将于 2 月 2 日正式发售，XR 设备作为下一代终端预计将迎来快速发展。未来随着虚拟显示设备的普及，数字交互将从平面走向立体，立体模型、立体动画将成为未来主流的内容形态，虚实融合下的多维沉浸式交互...

AIGC 2024-01-19 人工智能

980阅读

视觉Mamba来了：速度提升2.8倍，内存能省87%

号称「全面包围 Transformer」的 Mamba，推出不到两个月就有了高性能的视觉版。本周四，来自华中科技大学、地平线、智源人工智能研究院等机构的研究者提出了 Vision Mamba（Vim）。论文地址：https://arxiv.or...

AIGC 2024-01-19 人工智能

837阅读

智能车的「ChatGPT时刻」，还有多远？| 模力时代

要说今年“科技春晚”CES上最吸引眼球的是什么，智能车当属其一。毕竟大模型一上车，智能座舱都卷成酱婶了: 让车上的数字助手帮忙记录约饭日程，Ta能直接帮你把餐厅也给预定了。 △骁龙座舱平台效果展示规划路线这种事儿也变得充满巧思，数字助手会根据你的习...

人工智能 2024-01-19 人工智能

877阅读

吞吐量提升5倍，联合设计后端系统和前端语言的LLM接口来了

大型语言模型 (LLM 越来越多地用于需要多个链式生成调用、高级 prompt 技术、控制流以及与外部环境交互的复杂任务。然而，用于编程和执行这些应用程序的现有高效系统存在着明显的缺陷。现在，开源社区的研究者们面向 LLM 提出了一种结构化生成语言（...

人工智能 2024-01-19 人工智能

872阅读

GPU库存将到60万个！扎克伯格确认新目标：创建通用人工智能

1月19日消息，在科技领域，一股热潮正席卷而来，它源于一种坚定的信念，即科技行业正迈向实现超人、神级智能的道路上。引领这股潮流的旗手包括OpenAI，他们宣称要创造出这种通用人工智能（AGI）。而谷歌人工智能项目负责人杰米斯·哈萨比斯（Demis Ha...

大数据 2024-01-19 人工智能

863阅读

UniVG官网体验入口 AI多模态视频生成系统在线使用地址

UniVG是一款革命性的多模态视频生成系统，专门设计用于处理各种视频生成任务。它支持从文本和图像模态到视频的转换，通过采用多条件交叉注意力和偏置高斯噪声，UniVG实现了在视频生成领域的高自由度和低自由度的创新。该系统在公共学术基准MSR-VTT上实现了最...

人工智能 2024-01-19 人工智能

860阅读

AIGC创作系统ChatGPT源码，支持最新GPT-4-Turbo模型，支持DALL-E3文生图

一、AI创作系统 SparkAi创作系统是基于OpenAI很火的ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统，支持OpenAI-GPT全模型+国内AI全模型。本期针对源码系统整体测试下来非常完美，可以说SparkAi是目前国内一...

大数据 2024-01-19 人工智能

996阅读

AI绘画与多模态原理解析：从CLIP到DALLE1/2、DALLE 3、Stable Diffusion、SDXL Turbo、LCM

前言终于开写本CV多模态系列的核心主题：stable diffusion相关的了，为何执着于想写这个stable diffusion呢，源于三点去年stable diffusion和midjourney很火的时候，就想写，因为经常被刷屏，但那会时...

生成式AI 2024-01-19 人工智能

3046阅读

AI视野：谷歌推几何模型Alpha Geometry；三星发布AI手机Galaxy S24；Runway更新运动笔刷功能；Midjourney v6下周补齐缩放平移等功能

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ ????大模型动态谷歌推数学几何...

人工智能 2024-01-18 人工智能

857阅读

字节跳动基础架构SRE-Copilot获得2023 CCF国际AIOps挑战赛冠军

近日，2023 CCF国际AIOps挑战赛决赛暨“大模型时代的AIOps”研讨会在北京成功举办，活动吸引了来自互联网、运营商、科研院所、高校、软硬件厂商等领域多名专家学者参与，为智能运维的前沿学术研究、落地生产实践打开了新思路。决赛中，从初赛两百多支...

生成式AI 2024-01-18 人工智能

1459阅读

国产开源模型标杆大升级，重点能力比肩ChatGPT！书生·浦语2.0发布，支持免费商用

1月17日，新一代大语言模型书⽣·浦语2.0（InternLM2）正式发布并开源。 2种参数规格、3种模型版本，共计6个模型，全部免费可商用。它支持200K超长上下文，可轻松读200页财报。200K文本全文范围关键信息召回准确率达95.62%。不...

生成式AI 2024-01-18 人工智能

935阅读

LLaMA Pro: Progressive LLaMA with Block Expansion

Q: 这篇论文试图解决什么问题？ A: 这篇论文试图解决大型语言模型（LLMs）在特定领域（如编程、数学、生物医学或金融）能力不足的问题。尽管LLMs在多种现实世界任务中表现出色，但在某些特定领域仍然存在局限性，这阻碍了开发通用语言代理以应用于更广泛场景...

生成式AI 2024-01-18 人工智能

1068阅读

GPT-4，大增长时代的序幕

作者｜成诚虽然我们早在 2017 年就预测了超大模型的到来，因此才搞了分布式深度学习框架 OneFlow（github.com/Oneflow-Inc/oneflow/），且 2020 年的 GPT-3 也掀起了大模型热潮（OneFlow...

AIGC 2024-01-18 人工智能

937阅读

昆仑天工SkyWork：更懂中文的AIGC开源模型

昆仑天工SkyWork系列AIGC开源模型，由奇点智源公司研发，在2022年12月发布，覆盖图像、文本、编程等多模态内容生成能力，包括绘画、文章续写、对话、中英翻译、推理、诗词对联、菜谱撰写、合同起草、代码补全等。昆仑天工SkyWork系列模型...

人工智能 2024-01-18 人工智能

1411阅读

马毅LeCun谢赛宁曝出多模态LLM重大缺陷！开创性研究显著增强视觉理解能力

Sam Altman在各种场合都提到，大语言模型的多模态能力，是未来AI技术能够造福人类的最亟待突破的领域。那么现在在多模态大模型的视觉功能能否达到与语言功能匹配的水平？当前多模态模型取得的进步很大程度上归功于大语言模型（LLM）的推理能力。但在视...

AIGC 2024-01-18 人工智能

1011阅读

新一代注意力机制Lightning Attention-2：无限序列长度、恒定算力开销、更高建模精度

大语言模型序列长度的限制，极大地制约了其在人工智能领域的应用，比如多轮对话、长文本理解、多模态数据的处理与生成等。造成这一限制的根本原因在于当前大语言模型均采用的 Transformer 架构有着相对于序列长度的二次计算复杂度。这意味着随着序列长度的增加...

人工智能 2024-01-18 人工智能

956阅读

GLM-4体验入口智谱AI多模态大模型在线使用地址

GLM-4是由智谱AI在首届技术开放日上发布的一款新型大模型。GLM- 4 在性能上全面提升近60%，支持更长的上下文、更强的多模态支持和更快速的推理。产品定位为下一代基座大模型，旨在为文本处理、数据分析、图像生成等领域提供高效的AI解决方案。点击前往...

生成式AI 2024-01-18 人工智能

1125阅读

大模型时代下AIGC新浪潮

大模型时代下AIGC新浪潮文章目录大模型时代下AIGC新浪潮 1. **相关概念** 2. **迎接大模型时代** 3. **ChatGPT引爆AIGC产业** 4. **从产业链宏观看AIGC** 1. **上游：基础层**...

AIGC 2024-01-18 人工智能

973阅读

2023年的深度学习入门指南(24) - 处理音频的大模型 OpenAI Whisper

2023年的深度学习入门指南(24 - 处理音频的大模型 OpenAI Whisper 在这一讲之前，我们所用的大模型都是针对文本的。这一讲我们增加一个新的领域，即音频。我们将介绍OpenAI的Whisper模型，它是一个处理音频的大模型。 Wh...

生成式AI 2024-01-18 人工智能

1602阅读

如何将知识图谱与AIGC结合？京东是这么做的

一、导言首先介绍一下京东在电商场景下 AIGC 方面的探索。这是一个商品营销文案自动生成的全景图，自下而上首先是商品的输入信息。输入信息是异构多源的，包括商品的商详页里的图片、文本、商品的标题以及商品的知识图谱。通用的知识图谱是三元组的形式，...

大数据 2024-01-18 人工智能

1089阅读

AIGC内容分享(十二)：AIGC探索之旅AIGC探索之旅

目录前言引言：AI时代，未来已来 AIGC简介与发展历程早期萌芽阶段（1950s－1990s）沉淀积累阶段（1990s－2010s）快速发展阶段（2010s至今）大模型与AIGC的关联大模型概述大模型的定义和特点典型大...

大数据 2024-01-18 人工智能

1019阅读

2023最新AI创作系统ChatGPT网站源码+Midjourney绘画+支持GPT-4-Turbo模型+即将支持TSS语音对话功能模块

一、AI创作系统 SparkAi创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统，支持OpenAI-GPT全模型+国内AI全模型。本期针对源码系统整体测试下来非常完美，可以说SparkAi是目前国内一款的ChatGPT...

AIGC 2024-01-17 人工智能

999阅读

和普通电脑区别在哪：联想公布AI PC五大核心特征

快科技1月17日消息，在今天下午的联想拯救者及消费生态新品发布会上，联想官方公布了AI PC五大核心特征，回答了AI PC和普通电脑到底有何区别的问题。联想表示，AI PC的第一个核心特征就是本地混合AI算力，拥有CPU GPU NPU本地混合计算架构，...

AIGC 2024-01-17 人工智能

793阅读

AI视野：Stability AI发布代码模型Stable Code3B；书生·浦语2.0正式开源；阿里推新项目MotionShop；Win11新增AI生成图像功能

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ ????大模型动态 Stabili...

大数据 2024-01-17 人工智能

945阅读

大模型“藏毒”：“后门”触发，猝不及防！

撰稿 | 言征出品 | 51CTO技术栈（微信号：blog51cto）跟大模型会产生幻觉相比，更可怕的事情来了，最新的一项研究证明：在用户不知情的情况下，最初觉得很得力的大模型助手，将化身“间谍”，产生破坏性代码。具体来讲，一组研究人员对LL...

人工智能 2024-01-17 人工智能

862阅读

AIGC（ChatGPT）简介

一．概述 AIGC： Artificial Intelligence Generated Context，即可以利用人工智能技术自动产生内容，常见如代码生成，文本问答、图像生成、视频生成等。AIGC能力范围可以覆盖回答问题、撰写文章、文本摘要、语...

AIGC 2024-01-17 人工智能

883阅读