多模态第12页 - AIGC资讯

最神秘国产大模型团队冒泡，一出手就是万亿参数MoE，两款应用敞开玩

国内基础大模型创业公司，最后一位强实力选手终于正式来到台前。它就是微软前全球副总裁姜大昕所创办的阶跃星辰。一年前，量子位就对这位大牛的创业动向有所耳闻。姜大昕在微软工作16年有余，曾任职微软全球副总裁，微软亚洲互联网工程院（STCA）首席科学家，...

AIGC 2024-04-01 人工智能

893阅读

苹果似乎达到了AGI，此AGI非彼AGI

整理丨诺亚出品 | 51CTO技术栈（微信号：blog51cto）近日，苹果宣布，全球开发者大会（WWDC）将于6月10日（北京时间6月11日）开幕，大会面向所有开发者全程在线开放。据官方新闻稿介绍，本次活动“旨在展示 iOS、iPadOS、m...

AIGC 2024-04-01 人工智能

769阅读

Kimi平替？最神秘国产大模型团队阶跃星辰冒泡一出手就是两个王炸！

国内基础大模型创业公司阶跃星辰近日正式亮相，由微软前全球副总裁姜大昕创立。该公司专注于多模态融合和Scaling Law，已经开发出千亿参数的ToC产品，并在万亿模型研发上取得显著进展。阶跃星辰的产品包括两款面向C端市场的应用:跃问和冒泡鸭，均已全面开放使...

生成式AI 2024-04-01 人工智能

998阅读

Mini-Gemini:简单有效的AI框架，增强多模态视觉语言模型

近期，中国香港中文大学和 SmartMore 的研究人员推出了一种名为 Mini-Gemini 的新颖框架，通过增强多模态输入处理来推动 VLMs 的发展。Mini-Gemini 采用了双编码器系统和一种新颖的补丁信息挖掘技术，结合一个特别策划的高质量数据...

大数据 2024-04-01 人工智能

834阅读

AIGC行业趋势：Sora横空出世，向多模态应用加速迈进

文/浦银国际证券近期，OpenAI的Sora的横空出世再一次引发市场对AIGC的关注，文生视频领域取得重大突破，效果远超预期。我们将围绕Sora的核心优势、技术特点、行业影响、未来趋势等方面进行阐述。相较于此前的文生视频模型，Sora取得哪些突...

AIGC 2024-03-30 人工智能

903阅读

前端食堂技术周刊第 115 期：Rolldown 正式开源、马斯克宣布 xAI 本周将开源 Grok、如何使用 Copilot 完成 50% 的日常工作？

美味值：????? 口味：手打柠檬茶食堂技术周刊仓库地址：https://github.com/Geekhyt/weekly 大家好，我是童欧巴。欢迎来到前端食堂技术周刊，我们先来看下上周的技术资讯。技术资讯前端 Rolldown 正...

人工智能 2024-03-30 人工智能

849阅读

AI写作的困惑与突破：深度探索其可能性与局限性

大家好，小发猫降重今天来聊聊AI写作的困惑与突破：深度探索其可能性与局限性，希望能给大家提供一点参考。以下是针对论文重复率高的情况，提供一些修改建议和技巧，可以借助此类工具： AI写作的困惑与突破：深度探索其可能性与局限性随着人工智能技术的飞...

生成式AI 2024-03-29 人工智能

911阅读

密传！苹果牵手Anthropic，加码iOS 18，挑战ChatGPT！

整理丨诺亚出品 | 51CTO技术栈（微信号：blog51cto）苹果公司被广泛传言正在与多家人工智能公司进行接洽，其中包括OpenAI、谷歌以及谷歌支持的创业公司Anthropic，旨在为预计今年晚些时候推出的iOS 18提供一系列全新AI特性支撑...

大数据 2024-03-29 人工智能

866阅读

【Stable Diffusion】专栏介绍和文章索引（持续更新中）

目录 1 背景 2 思考 3 文章索引（持续更新中） 3.1 入门 3.2 初级 3.3 中级 3.3 高级 1 背景最近开始学习AIGC，对Stable Diffusion比较感兴趣，所以新建了这个专栏，来记录自己在使用和...

AIGC 2024-03-29 人工智能

878阅读

AI写作的未来：从困惑度与爆发度的视角探索

大家好，小发猫降ai今天来聊聊AI写作的未来：从困惑度与爆发度的视角探索，希望能给大家提供一点参考。降ai辅写以下是针对论文AI辅写率高的情况，提供一些修改建议和技巧，可以借助此类工具：还有： AI写作的未来：从困惑度与爆发度的视角探索...

生成式AI 2024-03-29 人工智能

917阅读

苹果研发多模态AI，这是研究人员迄今发现的结果

译者 | 布加迪审校 | 重楼如果我告诉你，在最近热议的多模态AI背后，苹果正在悄然酝酿一场革命，你会作何感想？苹果的一群研究人员一直在系统地研究如何构建功能最强大的多模态模型，揭露了质疑传统智慧的重要见解。现在他们让我们有机会一窥底层的细节。他...

人工智能 2024-03-28 人工智能

920阅读

量产杀器！P-Mapnet：利用低精地图SDMap先验，建图性能暴力提升近20个点！

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面在线HD Map生成算法是当前自动驾驶系统摆脱对高精地图依赖的方法之一，现有的算法在远距离范围下的感知表现依然较差。为此，我们提出了P-MapNet，其中的“P”强调我们专注于融合地图先验以...

AIGC 2024-03-28 人工智能

1091阅读

钉钉 AI 升级：加入多模态、工作流等能力

3月28日，钉钉 AI 助理进行了重磅升级，新增了图片理解、文档速读、工作流等功能。这次升级使得钉钉 AI 助理率先尝试了多模态和长文本处理技术，展现出更强大的能力。用户可以在钉钉 IM 消息框或通过魔法棒按钮进入 AI 助理对话框，发送长文件、在线文档...

生成式AI 2024-03-28 人工智能

820阅读

微软亚研院新作：让大模型一口气调用数百万个API！

近年来，人工智能发展迅速，尤其是像ChatGPT这样的基础大模型，在对话、上下文理解和代码生成等方面表现出色，能够为多种任务提供解决方案。但在特定领域任务上，由于专业数据的缺乏和可能的计算错误，它们的表现并不理想。同时，虽然已有一些专门针对特定任务的AI...

人工智能 2024-03-28 人工智能

921阅读

钉钉AI：好险，差点就被长文本卷到

好家伙，现在随便打开一个大模型应用，支持的文本都有那————么长。最新消息，7亿人在用的钉钉也加入战局，一出手就是长文本、多模态和工作流三大能力升级，全是最热门的AI迭代方向。专门提一下，钉钉AI助理的长文本这次能轻松拿捏几十万字的文档，甚至放话单文档...

生成式AI 2024-03-28 人工智能

869阅读

理想汽车 Mind GPT 多模态认知大模型通过国家备案

今日，理想汽车宣布其全自研的多模态认知大模型——Mind GPT，已正式通过国家《生成式人工智能服务管理暂行办法》的备案。这一里程碑式的事件标志着理想汽车成为首个通过该备案的汽车厂商自研大模型。 Mind GPT，这款在汽车智能座舱中落地应用的大模型，其...

生成式AI 2024-03-28 人工智能

756阅读

Hume AI发布对话AI——EVI：具备情感感知能力

Hume AI近日发布了一款具有情感感知能力的对话AI:EVI，这款产品采用了一种被称为情感大语言模型（eLLM）的多模态生成AI技术。情感大语言模型（eLLM）是一种结合了大型语言模型(LLMs 的语言理解能力和表情测量技术的情感感知能力的新技术。这种...

AIGC 2024-03-28 人工智能

874阅读

OpenAI把微软电网搞崩！GPT-6被曝25年发布，训练刷爆10万张H100

GPT-6也被电力卡脖子了——部署十万个H100时，整个电网发生了崩溃！就在刚刚，微软工程师爆料，10万个H100基建正在紧锣密鼓地建设中，目的就是训练GPT-6。微软工程师吐槽说，团队在部署跨区域GPU间的infiniband级别链接时遇到了困难。...

大数据 2024-03-27 人工智能

863阅读

【精华】AIGC启元2024

文章目录 AIGC 前沿 (1 Gemini 1.5 Pro（谷歌新一代多模态大模型） (2 Sora（文本生成视频大模型） (3 EMO（阿里生成式AI模型） (4 Playground v2.5（文生图大模型） (5 VSP-L...

生成式AI 2024-03-26 人工智能

1719阅读

【AIGC调研系列】AIGC大模型如何与sonar等工具集成

AIGC大模型与Sonar等工具集成的方式主要体现在通过自动化和智能化的方式提升代码质量检测、内容生成和SEO优化等方面。具体来说，可以通过以下几种方式实现集成：这表明AIGC大模型可以通过集成现有的自动化工具（如Sonar）来提高软件开发过程中的代码...

人工智能 2024-03-26 人工智能

1222阅读

苹果再发多模态论文！陪我们走过十年的“Hey Siri”会被更智能的交互方式取代吗？

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）全面发力AI的苹果，再出新研究！随着人工智能技术的发展，我们熟悉的“Hey Siri”或将成为历史。苹果团队最新出炉的论文《利用大型语言模型进行设备指向性语音检测的多模...

人工智能 2024-03-26 人工智能

881阅读

阶跃星辰宣布推出 Step 系列通用大模型

阶跃星辰团队宣布推出了 Step 系列通用大模型，包括 Step-1千亿参数语言大模型、Step-1V 千亿参数多模态大模型，以及 Step-2万亿参数 MoE 语言大模型的预览版。据悉，阶跃星辰成立于2023年4月，以 “智能阶跃，十倍每一个人的可...

生成式AI 2024-03-26 人工智能

896阅读

突破性的百万级视频和语言世界模型：Large World Model~

本文经自动驾驶之心公众号授权转载，转载请联系出处。在探索如何让AI更好地理解世界方面，最近的一项突破性研究引起了广泛关注。来自加州大学伯克利分校的研究团队发布了“Large World Model, LWM”，能够同时处理百万级长度的视频和语言序列，...

生成式AI 2024-03-26 人工智能

964阅读

CNN、Transformer、Uniformer之外，我们终于有了更高效的视频理解技术

视频理解的核心目标在于对时空表示的把握，这存在两个巨大挑战：短视频片段存在大量时空冗余和复杂的时空依赖关系。尽管曾经占主导地位的三维卷积神经网络 (CNN 和视频 Transformer 通过利用局部卷积或长距离注意力有效地应对其中之一的挑战，但它们在...

大数据 2024-03-26 人工智能

893阅读

3D版Sora来了？UMass、MIT等提出3D世界模型，具身智能机器人实现新里程碑

在最近的研究中，视觉-语言-动作（VLA，vision-language-action）模型的输入基本都是2D数据，没有集成更通用的3D物理世界。此外，现有的模型通过学习「感知到动作的直接映射」来进行动作预测，忽略了世界的动态性，以及动作和动态之间的关...

生成式AI 2024-03-26 人工智能

887阅读

大佬谈AI｜库克要让国行版iPhone装上百度AI 周鸿祎剖析库克盘算，黄仁勋、Altman语出惊人！

3月25日消息，过去一周，国内外AI圈子又有众多话题涌现。苹果公司CEO蒂姆·库克（Tim Cook）的中国之行成为观察苹果生成式AI发展动态的窗口；英伟达的2024 GTC大会CEO黄仁勋携新的超级GPU亮相，要为更大规模的生成式AI模型训练扫清算力障碍...

大数据 2024-03-25 人工智能

832阅读

良心！vivo离职员工意外收到年终奖；传苹果使用百度AI功能；阿里魔搭类Sora模型开源；Kimi带火，多家大厂开卷“长文本”

出品 | 51CTO技术栈（微信号：blog51cto）一、商业圈 1.vivo前员工离职大半年突然收到年终奖日前，有vivo前员工在小红书平台发帖感谢vivo称，离职将近大半年，突然收到年终奖，还称相比去年有涨幅，此外，主动离职也给了N+1补偿。在...

生成式AI 2024-03-25 人工智能

839阅读

剑桥团队开源：赋能多模态大模型RAG应用，首个预训练通用多模态后期交互知识检索器

论文链接：https://arxiv.org/abs/2402.08327 DEMO 链接：https://u60544-b8d4-53eaa55d.westx.seetacloud.com:8443/ 项目主页链接：https://preflm...

AIGC 2024-03-25 人工智能

1175阅读

通用文档理解新SOTA，多模态大模型TextMonkey来了

最近，华中科技大学和金山的研究人员在多模态大模型 Monkey [1]（Li et al., CVPR2024）工作的基础上提出 TextMonkey。在多个场景文本和文档的测试基准中，TextMonkey 处于国际领先地位，有潜力带来办公自动化、智慧教...

人工智能 2024-03-25 人工智能

885阅读

AI模型训练：强化算法与进化算法

强化学习算法(RL 和进化算法(EA 都属于机器学习领域的子集，但它们在解决问题的方法和思想上有所不同。强化学习算法：强化是一种机器学习范式，它主要关注的是智能体(agent 在与环境进行交互的过程中，通过尝试和错误来学习最优的行为策略，以使其在某...

AIGC 2024-03-25 人工智能

828阅读

【AIGC调研系列】智普GLM-3与GLM-4分别适用于什么使用场景

智普GLM-3与GLM-4分别适用于不同的使用场景。GLM-4是一款性能全面提升的新型大模型，它在总结、信息抽取、复杂推理、代码等应用场景中表现出色[1]。GLM-4支持更长的上下文、更强的多模态支持和更快速的推理[2]，能够完成文件处理、数据分析、图表绘...

生成式AI 2024-03-25 人工智能

1265阅读

AIGC时代下阿里云视频云媒体内容生产技术实践

编者按 AIGC时代下，媒体内容生产领域随着AI的出现也涌现出更多的变化与挑战。面对AI的巨大冲击，如何优化或重构媒体内容生产技术架构？在多样的应用场景中媒体内容生产技术又有着怎样的实践效果？LiveVideoStackCon2023...

AIGC 2024-03-24 人工智能

872阅读

第二证券|AIGC行业新突破不断文化传媒板块活跃

本周以来，以短剧、游戏为代表的文明传媒板块实现三连涨。3月13日，游戏股逆势大涨，游戏出海、网络游戏、短剧游戏方向领涨。到收盘，因赛集团以20%幅度涨停，掌趣科技涨超10%，凯撒文明、中广天择、时代出书、大晟文明、龙版传媒、掌阅科技等多股涨停。消息面上...

大数据 2024-03-23 人工智能

871阅读

每日一看大模型新闻（2024.1.4）中国AIGC广告营销产业全景报告：五大变革四大影响；马斯克也逃不过「科目三」，阿里这个应用都要把外国人馋哭了；通义千问：上线图生视频功能

1.产品发布 1.1首创pix2emb范式！NUS清华联合发布NExT-Chat：对话/检测/分割全能多模态大模型发布日期：2024-1-4 首创pix2emb范式！NUS清华联合发布NExT-Chat：对话/检测/分割全能多模态大模型...

生成式AI 2024-03-23 人工智能

832阅读

文生图的基石CLIP模型的发展综述

CLIP的英文全称是Contrastive Language-Image Pre-training，即一种基于对比文本-图像对的预训练方法或者模型。CLIP是一种基于对比学习的多模态模型，CLIP的训练数据是文本-图像对：一张图像和它对应的文本描述，这里...

AIGC 2024-03-22 人工智能

1040阅读

零一万物API开放多模态中文图表体验超越GPT-4V

近日，零一万物API正式向开发者开放，其中包含三款强大的模型。首先是Yi-34B-Chat-0205，支持通用聊天、问答、对话、写作和翻译等功能;其次是Yi-34B-Chat-200K，能处理多文档阅读理解和构建超长知识库;最后是Yi-VL-Plus多模态...

生成式AI 2024-03-22 人工智能

799阅读

虚拟角色平台Character AI的生成式AI聊天机器人可以说话了

Character AI 最近为其生成式 AI 聊天机器人增加了语音功能。全新的 Character Voice 功能使用户能够真正听到他们正在对话的合成人物的声音，旨在提升用户体验的参与感。 Character AI 的虚拟人格库通过大型语言模型提供对话...

AIGC 2024-03-22 人工智能

1149阅读

国产大模型kimi chat突然火了 Kimi概念股都有哪些？

3 月 21 日，三大指数集体高开高走。受Kimi的催化，影视院线板块在内的Kimi概念股盘中走高，影视院线板块延续昨日涨势，开盘后迅速拉升走强。影视ETF（159855）领涨，截至发稿，该ETF涨3.45%，成交额突破 810 万元，换手率13.98%...

生成式AI 2024-03-21 人工智能

812阅读

一统所有目标感知任务，华科&字节提出目标感知基础模型GLEE

近年来，LLM 已经一统所有文本任务，展现了基础模型的强大潜力。一些视觉基础模型如 CLIP 在多模态理解任务上同样展现出了强大的泛化能力，其统一的视觉语言空间带动了一系列多模态理解、生成、开放词表等任务的发展。然而针对更细粒度的目标级别的感知任务，目前...

生成式AI 2024-03-21 人工智能

892阅读

HPT官网体验入口 HyperGAI多模态语言开源模型框架免费使用地址

HPT是HyperGAI研究团队推出的新型多模态大型语言模型框架。它具有高效且可扩展地训练大型多模态基础模型的能力，能够理解包括文本、图像、视频等多种输入模态。HPT框架不仅可以从头开始训练，还可以通过现有的预训练视觉编码器和/或大型语言模型进行高效适配。...

大数据 2024-03-20 人工智能

936阅读

旷视实战大模型：把多模态扎进行业

距离ChatGPT、GPT-4等引爆新一轮人工智能变革的时刻，已经过去了整整一年的时间。在这一年里，国内外大量公司涌入大模型的“斗兽场”，加速大模型技术的迭代与跃迁。大模型前所未有的通用任务处理能力，让所有人看到了解锁更多应用场景的可能性。各行各业开始...

生成式AI 2024-03-20 人工智能

814阅读

降低AIGC总体疑似率的七大策略

随着人工智能技术的飞速发展，AIGC（人工智能生成内容）的应用越来越广泛。然而，随之而来的问题是AIGC的疑似率居高不下，这给人们带来了不少困惑和疑虑。为了解决这个问题，本文将探讨降低AIGC总体疑似率的七大策略。提高数据质量数据是训练人工智能模...

大数据 2024-03-20 人工智能

1197阅读

Diffusion Transformer Family：关于Sora和Stable Diffusion 3你需要知道的一切

转自知乎：叫我Alonzo就好了前言背景——Sora和Stable Diffusion 3 近期，OpenAI和Stability两大AI巨头公司在同期分别发布了它们的新作品——Sora和Stable Diffusion 3。神奇的是，这...

大数据 2024-03-19 人工智能

1632阅读

AIGC元年大模型发展现状手册

零、AIGC大模型概览 AIGC大模型在人工智能领域取得了重大突破，涵盖了LLM大模型、多模态大模型、图像生成大模型以及视频生成大模型等四种类型。这些模型不仅拓宽了人工智能的应用范围，也提升了其处理复杂任务的能力。a. LLM大模型通过深度学习和自然语...

人工智能 2024-03-19 人工智能

1070阅读

小红书多模态团队建立新「扩散模型」：解码脑电波，高清还原人眼所见

近些年，研究人员们对探索大脑如何解读视觉信息，并试图还原出原始图像一直孜孜不倦。去年一篇被 CVPR 录用的论文，通过扩散模型重建视觉影像，给出了非常炸裂的效果—— AI 不光通过脑电波知道你看到了什么，并且帮你画了出来。第一行：人眼所见画面，第二...

人工智能 2024-03-19 人工智能

1299阅读

优于所有方法！HIMap：端到端矢量化HD地图构建

本文经自动驾驶之心公众号授权转载，转载请联系出处。矢量化高清（HD）地图构建需要预测地图元素的类别和点坐标（例如道路边界、车道分隔带、人行横道等）。现有技术的方法主要基于点级表示学习，用于回归精确的点坐标。然而，这种pipeline在获得elemen...

AIGC 2024-03-19 人工智能

885阅读

巨人网络：计划构建 AI 游戏开发平台降低开发门槛

巨人网络表示，在2024年春季招聘中首次重点招募 AI 算法实习生，标志着公司在游戏和人工智能深度融合领域的新动向。招聘对象为2025届海内外高校在校生，涵盖多个技术岗位，旨在培养新一代游戏 AI 人才加速公司发展。招聘涉及游戏策划、技术、美术、市场运营...

生成式AI 2024-03-19 人工智能

861阅读

Stable Diffusion 3报告

报告链接：https://stability.ai/news/stable-diffusion-3-research-paper 文章目录要点表现架构细节通过重新加权改善整流流量 Scaling Rectified Flow Tr...

AIGC 2024-03-18 人工智能

1117阅读

AI大模型控制红绿灯，港科大（广州）智慧交通新成果已开源

大模型“上路”，干起了交通信号控制（TSC）的活～模型名为LightGPT，以排队及不同区段快要接近信号灯的车辆对路口交通状况分析，进而确定最好的信号灯配置。该模型由香港科技大学（广州）的研究团队提出，其背后关键是一个名为LLMLight的框架。...

生成式AI 2024-03-18 人工智能

822阅读

新智元 | Stable Diffusion 3技术报告流出，Sora构架再立大功！生图圈开源暴打Midjourney和DALL·E 3？

本文来源公众号“新智元”，仅用于学术分享，侵权删，干货满满。原文链接：Stable Diffusion 3技术报告流出，Sora构架再立大功！生图圈开源暴打Midjourney和DALL·E 3？【新智元导读】Stability AI放出了号称能暴...

人工智能 2024-03-18 人工智能

996阅读