多模态第18页 - AIGC资讯

AI视野：ChatGPT模型大更新；阿里云发布多模态大模型；Runway视频生成输给Pixverse；百度推多模态模型UNIMO-G

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ ???AI应用 ChatGPT模型...

AIGC 2024-01-26 人工智能

922阅读

Altman地位又危了？！OpenAI董事会邀请竞争对手加入，还挖角谷歌Gemini高管

Altman的地位又危险了？据知情人士透露，上个月，OpenAI董事会的Adam D'Angelo致电Databricks的首席执行官Ali Ghodsi，询问Ghodsi是否考虑加入OpenAI董事会。 Adam D'Angelo 本来找知名公司高...

AIGC 2024-01-26 人工智能

885阅读

顶流Mamba竟遭ICLR拒稿，学者集体破防变小丑，LeCun都看不下去了

一项ICLR拒稿结果让AI研究者集体破防，纷纷刷起小丑符号。争议论文为Transformer架构挑战者Mamba，开创了大模型的一个新流派。发布两个月不到，后续研究MoE版本、多模态版本等都已跟上。但面对ICRL给出的结果，康奈尔副教授Alexand...

AIGC 2024-01-26 人工智能

800阅读

NeurIPS 2023精选回顾：大模型最火，清华ToT思维树上榜

近日，作为美国前十的科技博客，Latent Space对于刚刚过去的NeurIPS 2023大会进行了精选回顾总结。在NeurIPS会议总共接受的3586篇论文之中，除去6篇获奖论文，其他论文也同样优秀和具有潜力，甚至有可能预示着下一个AI领域的新突破...

大数据 2024-01-26 人工智能

899阅读

中文性能反超VLM顶流GPT-4V，阿里Qwen-VL超大杯限免！看图秒写编程视觉难题一眼辨出

【新智元导读】多模态大模型将是AI下一个爆点。最近，通义千问VLM模型换新升级，超大杯性能堪比GPT-4V。最最重要的是，还能限时免费用。最近，通义千问实火。前段时间被网友玩疯的全民舞王，让「AI科目三」频频登上热搜。让甄嬛、慈禧、马斯克、猫主子和兵...

生成式AI 2024-01-26 人工智能

1067阅读

阿里云发布多模态大模型Qwen-VL-Max版本性能比肩GPT-4V

阿里云公布了多模态大模型的最新研究成果，继Plus版本之后，再次推出Max版本。 Qwen-VL-Max模型在视觉推理方面展现出卓越的能力，可以理解并分析复杂的图片信息，包括识人、答题、创作和写代码等任务。此外，该模型还具备视觉定位功能，可根据画面指定区域...

AIGC 2024-01-26 人工智能

910阅读

AI图像高清修复工具SUPIR 可根据文本提示智能修复

SUPIR是一个通过增加模型规模来提升图像修复能力的技术，它能够根据文本提示进行智能修复，提高图像修复的质量和智能程度。 SUPIR的主要功能包括图像修复和文本引导的修复，利用了模型放大、多模态技术和结果表明，SUPIR在各种图像修复任务和复杂处理场景中都...

人工智能 2024-01-26 人工智能

848阅读

Camera or Lidar？如何实现鲁棒的3D目标检测？最新综述！

本文经自动驾驶之心公众号授权转载，转载请联系出处。 0. 写在前面&&个人理解自动驾驶系统依赖于先进的感知、决策和控制技术，通过使用各种传感器（如相机、激光雷达、雷达等）来感知周围环境，并利用算法和模型进行实时分析和决策。这使得车辆...

大数据 2024-01-26 人工智能

1023阅读

微软推出Copilot Pro高级订阅服务；使用大语言模型处理音频数据；AI新工具Summify-用于总结YouTube视频的人工智能工具

? AI新闻 ? 微软推出Copilot Pro高级订阅服务，扩展适用范围到更多设备和应用摘要：微软为其Copilot助手推出了新的高级订阅服务Copilot Pro，该服务每月收费20美元，支持Windows PC、Web、App使用，并即将登...

AIGC 2024-01-25 人工智能

1096阅读

15大不同领域问答对比，ChatGPT模型大战：国产版百度文心一言、昆仑万维天工能否击败GPT-4（含百度文心一言、昆仑万维天工个人内测体验测试邀请码获取方法，亲测有效）

目录前言百度内测申请天工内测申请申请方式内测体验登录界面运行体验内测对比基本问答事实性问答科普文写作小红书文案项目计划撰写古文理解模型的常识能力和反事实推理代码理解法律相关广告话术数字排序数值计...

AIGC 2024-01-25 人工智能

1094阅读

AI大模型开发架构设计（2）——AI绘画技术架构&应用实践

文章目录 AI绘画技术架构&应用实践 1 AI绘画整体流程 2 AI绘画技术架构文生图核心算法原理文生图工程架构 3 AI绘画的应用实践 AI绘画技术架构&应用实践 1 AI绘画整体流程第一步：...

人工智能 2024-01-25 人工智能

1042阅读

研究: AI代替打工人成本太高，只有23% 视觉工作可替代

根据 MIT 计算机科学与人工智能实验室的研究，人工智能对打工人的淘汰速度可能比人们想象中的要慢得多。这是因为对于企业来说，视觉 AI 实在是太贵了。在绝大多数情况下，人力成本要比采用自动化更便宜。图源备注：图片由AI生成，图片授权服务商Midjour...

AIGC 2024-01-25 人工智能

856阅读

5.28 深圳活动｜Jina AI 生态助力云原生场景下的 AIGC 应用开发

亚马逊云科技 Community Day 将于 5 月 28 日在深圳南山区海德酒店 11 楼举办，Jina AI 软件工程师付杰将带来《Jina AI 生态助力云原生场景下的 AIGC 应用开发》的主题演讲。 Community Day 是亚马逊云...

生成式AI 2024-01-25 人工智能

927阅读

MIT新研究：打工人不用担心被AI淘汰！成本巨贵，视觉工作只有23%可替代

人工智能会抢走我们的工作吗？如果你每天都看硅谷高管谈论着当今尖端的AI技术，可能会觉得答案是肯定的，并且会很快发生。不过，刚刚MIT计算机科学与人工智能实验室（CSAIL）最近的一项研究，可以让我们可以松一口气了：至少视觉AI还无法替代太多人类。论...

生成式AI 2024-01-25 人工智能

914阅读

群聊冷场怎么破？茴香豆用AI帮你解决问题

群聊冷场怎么破?这项有趣而实用的AI技术可以帮你解决问题，化解尴尬。茴香豆（HuixiangDou）是一个基于大语言模型的群聊知识助手，能够自动识别并回答群聊中的技术相关问题，同时避免被非技术内容干扰。其可集成到即时聊天工具中，如微信和飞书，主要服务于技术...

人工智能 2024-01-25 人工智能

863阅读

AIGC领域的多模态深度学习你知道多少？一文带你Get

Look！?我们的大模型商业化落地产品 ?更多AI资讯请??关注 Free三天集训营助教在线为您火热答疑??‍? 什么是多模态深度学习? 多模态深度学习(英文名:Multimodal Deep Learning 是人工智能(AI 的一个子领域...

大数据 2024-01-25 人工智能

1203阅读

RAG实战 7 - 使用llama_index实现多模态RAG

LLM之RAG实战（七）| 使用llama_index实现多模态RAG 文章目录 LLM之RAG实战（七）| 使用llama_index实现多模态RAG 一、多模态RAG 二、多模态LLM 三、多模态嵌入四、多模态索引与检索五、多...

人工智能 2024-01-25 人工智能

1156阅读

AI4Science还是伪命题吗？两年后workshop组织者重新审视AI4Science

2021年，一群热血青年提出了要把AI4Science（AI for Science）带入机器学习顶会NeurIPS。什么？AI4Science是一门学科吗？是不是靠着AI蹭热点？各种质疑声接踵而来。这些质疑和不解也反映在了第一届AI4Science...

人工智能 2024-01-25 人工智能

940阅读

什么值得买“AI问答机器人”通过备案对话式机器人“小值”将上线

近日，值得买科技主营业务什么值得买App的“AI问答机器人”新功能，正式通过国家《生成式人工智能服务管理暂行办法》备案许可。据介绍，什么值得买“AI问答机器人”是一款消费领域垂类产品，将通过对话形式与用户进行交互，旨在为用户提供智能的消费辅助决策服务，根...

大数据 2024-01-25 人工智能

868阅读

RadOcc：通过渲染辅助蒸馏学习跨模态Occupancy知识

原标题：Radocc: Learning Cross-Modality Occupancy Knowledge through Rendering Assisted Distillation 论文链接：https://arxiv.org/pdf/2312...

大数据 2024-01-25 人工智能

853阅读

100天，3个版本，他们让营销AIGC起来了

“18权益加磅，省的不止一点点！”打开京东金融APP，一则热闹的营销头图跃入眼帘，你可能意识不到，这则堪比设计师水准的物料源自大模型的手笔。今年6.18和11.11，京东金融超过30%的资源位营销素材由AIGC自动生成，这一水平在亿级用户量的应...

生成式AI 2024-01-25 人工智能

852阅读

GPT-4 / Midjourney / GPTs，普通人如何用一套程序全搞定

随着AI的发展，市面上也出现了很多支持AI使用的UI程序，比如NextWeb、LobeChat等，但功能都有所侧重并不全面，本文着重介绍一款功能比较全面的开源程序，希望对你有所帮助。什么是功能全的AI程序？我觉得可以从目前已知的AI能力反推，功能如下：...

大数据 2024-01-25 人工智能

993阅读

AIGC场景应用展望研究报告

AIGC场景应用展望研究报告 AIGC介绍技术视角：AIGC产业技术新突破产业视角：AIGC的产业新变革典型企业案例随着人工智能技术的快速发展，AIGC(AI生成内容正在成为内容生产方式的新趋势。AIGC场景应用展望研...

AIGC 2024-01-25 人工智能

913阅读

首个通用双向Adapter多模态目标追踪方法BAT，入选AAAI 2024

目标跟踪是计算机视觉的一项基础视觉任务，由于计算机视觉的快速发展，单模态 (RGB 目标跟踪近年来取得了重大进展。考虑到单一成像传感器的局限性，我们需要引入多模态图像 (RGB、红外等来弥补这一缺陷，以实现复杂环境下全天候目标跟踪。然而，现有的多...

AIGC 2024-01-24 人工智能

887阅读

MIT和谷歌提出新AI框架Health-LLM:利用可穿戴传感器数据为健康预测任务调整LLM

近日，MIT和Google的研究人员共同提出了一种名为Health-LLM的新型人工智能框架，旨在将大语言模型（LLMs）应用于健康预测任务，利用可穿戴传感器的数据。该框架的提出标志着健康领域在可穿戴技术和人工智能的交叉点上取得了重大突破。可穿戴传感器技...

AIGC 2024-01-24 人工智能

953阅读

扩散模型更懂复杂提示词！Pika北大斯坦福开源新框架，利用LLM提升理解力

Pika北大斯坦福联手，开源最新文本-图像生成/编辑框架！无需额外训练，即可让扩散模型拥有更强提示词理解能力。面对超长、超复杂提示词，准确性更高、细节把控更强，而且生成图片更加自然。效果超越最强图像生成模型Dall·E 3和SDXL。比如要求图片...

生成式AI 2024-01-24 人工智能

868阅读

万字总结 | 2023大模型与自动驾驶论文走马观花

本文经自动驾驶之心公众号授权转载，转载请联系出处。 2023年已经匆匆过去大半，不知各位自动驾驶小伙伴今年的工作生活情况是否顺利呢？高阶ADAS方案量产了吗？新的文章和实验进展又是否顺利呢？今天给大家总结了2023年前后的一些自动驾驶结合大模型的开创性...

生成式AI 2024-01-24 人工智能

1186阅读

迈向分割的大一统！OMG-Seg：一个模型搞定所有分割任务

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者个人思考图像分割已经从单任务分割走到了语义分割、实例分割、全景分割三种分割任务的统一；大模型以及多模态的发展又带来了文本和图像统一，使得跨模态端到端成为可能；追求更高级、更全面...

生成式AI 2024-01-24 人工智能

1178阅读

stable diffusion模型训练时数据量

文生图模型之Stable Diffusion - 知乎通向AGI之路码字真心不易，求点赞！ https://zhuanlan.zhihu.com/p/6424968622022年可谓是 AIGC（AI Generated Content）元年，上半年有文生...

大数据 2024-01-24 人工智能

2174阅读

AI作画的背后是怎么一步步实现的？一文详解AI作画算法原理+性能评测

前言 “AI作画依赖于多模态预训练，实际上各类作画AI模型早已存在，之所以近期作品质量提升很多，可能是因为以前预训练没有受到重视，还达不到媲美人类的程度，但随着数据量、训练量的增多，最终达到了现在呈现的效果。”远在AI作画还没有爆火之前，深度学习就已经...

生成式AI 2024-01-24 人工智能

1128阅读

AI创作系统ChatGPT商业运营网站系统源码，支持AI绘画，GPT语音对话+DALL-E3文生图

一、前言 SparkAi创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统，支持OpenAI-GPT全模型+国内AI全模型。本期针对源码系统整体测试下来非常完美，可以说SparkAi是目前国内一款的ChatGPT对接Op...

大数据 2024-01-23 人工智能

922阅读

加速“虚拟人+X”，魔珐科技撬动AIGC的杠杆

ChatGPT+元宇宙+虚拟人，将开创怎样的未来？ 2022年11月30日，OpenAI凭借七年研发积累发布了全新聊天机器人模型ChatGPT，掀起新的人工智能革命。 2023年6月6日，苹果带着研发七年之久的MR头显产品Vision Pro亮相，通过...

AIGC 2024-01-23 人工智能

813阅读

2024 年值得关注的 6 大生成式 AI 趋势

2023年是人工智能领域长期以来最具颠覆性的一年，大量生成式人工智能产品进入主流。继续其变革之旅，生成式人工智能有望在2024年从兴奋的话题转变为现实世界的应用。随着科技公司不断开发和微调人工智能模型，生成式人工智能领域正在迅速发展，催生了一系列广泛的趋...

AIGC 2024-01-23 人工智能

1097阅读

剧透GPT-5，物色芯片厂，2024年的Sam Altman已经火力全开，只因不敢停下来

尽管如今的AI圈花样层出、新闻满天，但OpenAI的新动向仍然一直是人们最关注的话题之一。最近， OpenAI首席执行官 Sam Altman就在参加达沃斯论坛时高调表示，公司目前的首要任务就是推出下一代大型语言模型，可能被称为GPT-5。他还剧透了一...

大数据 2024-01-23 人工智能

833阅读

2024年人工智能领域十大预测

2023年人工智能领域如果只能筛选一个关键词的话，恐怕非“大模型”莫属。大模型的发展在过去一年中，让各行各业发生了天翻地覆的变化，有企业因大模型而新生，有企业因大模型而消亡。企业的变迁跟技术迭代息息相关，而大模型就是新一代人工智能技术下的产物，大模型已经...

大数据 2024-01-23 人工智能

930阅读

AI视野：哄哄模拟器爆火；零一万物多模态模型上线；InstantID模型发布；Depth Anything社交网络走红

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ ???AI应用哄哄模拟器爆火70...

大数据 2024-01-23 人工智能

849阅读

ChatGPT之后，下个AIGC杀手级应用已近在眼前

鱼羊发自凹非寺量子位 | 公众号 QbitAI 大模型模式，正在新一波AIGC的浪潮里被再度验证。从AI画画的出圈，到现如今ChatGPT的火爆，面向大众的爆款产品接口背后，无不是大模型技术的突破创新。而当这种“大力出奇迹”的技术...

人工智能 2024-01-23 人工智能

862阅读

AI创作系统ChatGPT网站源码，支持AI绘画，支持GPT语音对话+DALL-E3文生图+智能思维导图生成

一、前言 SparkAi创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统，支持OpenAI-GPT全模型+国内AI全模型。本期针对源码系统整体测试下来非常完美，可以说SparkAi是目前国内一款的ChatGPT对接Op...

生成式AI 2024-01-23 人工智能

879阅读

世界顶尖多模态大模型开源！又是零一万物，又是李开复

领跑中英文两大权威榜单，李开复零一万物交出多模态大模型答卷! 距离其首款开源大模型Yi-34B和Yi-6B的发布，仅间隔不到三个月的时间。模型名为Yi Vision Language（Yi-VL），现已正式面向全球开源。同属Yi系列，同样具有两个版本...

生成式AI 2024-01-23 人工智能

850阅读

大模型 Dalle2 学习三部曲（一）Latent Diffusion Models学习

引言 Diffusion model大获成功，但是它的短板也很明显，需要大量的计算资源，并且推理速度比较慢。如何才能提升Diffusion model的计算效率。业界有各种各样的改进，无疑Latent Diffusion Models（潜在扩散模...

生成式AI 2024-01-23 人工智能

995阅读

讯飞星火大模型V3.5将于1月30日发布星火开源大模型等将亮相

讯飞星火 V3.5宣布将于2024年1月30日正式发布。这次升级中，讯飞星火首次基于全国产化算力平台进行训练，实现了全民开放大模型。在逻辑推理、语言理解、文本生成、数学答题和多模态等核心能力上都有大幅提升。此次发布还包括了星火语音大模型和星火开源大模...

生成式AI 2024-01-23 人工智能

740阅读

数据猿预测：2024年大模型、AIGC的十个“小趋势”

大数据产业创新服务媒体 ——聚焦数据 · 改变商业随着2024年的到来，我们站在了人工智能发展的新十字路口，大模型技术不仅突破了以往的限制，更开启了未来可能性的新篇章。在这个关键时刻，我们预见到了一系列颠覆性的发展趋势，它们不...

AIGC 2024-01-23 人工智能

970阅读

Midjourney V6刷屏，但它最可怕的地方居然不是那些神图？

Midjourney在沉寂九个月后推出了Midjourney V6，这个文生图产品体现出的更细腻的细节处理，更强大的语言理解能力和更加“不像AI”的图片效果在过去几天引发一片惊呼。作为一个闭源的模型产品，Midjourney的魔法配方并不为人所知，但就...

AIGC 2024-01-23 人工智能

886阅读

爆肝整理全网最全最新AI生成算法【Stable Diffusion｜Diffusion Model｜DallE2｜CLIP｜VAE｜VQGAN】原理解析

1、生成模型首先回顾一下生成模型要解决的问题：如上图所示，给定两组数据z和x，其中z服从已知的简单先验分布π(z （通常是高斯分布），x服从复杂的分布p(x （即训练数据代表的分布），现在我们想要找到一个变换函数f，它能建立一种z到x的映射f:z...

生成式AI 2024-01-23 人工智能

1507阅读

UCLA提出多模态具身智能大模型MultiPLY AI首次拥有类人感官

近日，UCLA等机构的研究人员推出了具身智能大模型MultiPLY，该模型不仅具备多模态感知能力，包括触觉、视觉、听觉等，使得AI能够更全面地与3D环境进行交互。这标志着具备多感官能力的大模型成为未来AI发展的重要方向。 MultiPLY在多任务实验中表...

AIGC 2024-01-22 人工智能

1002阅读

AIGC重塑基础设施，高密数据中心为何众望所归？

凯文·凯利在《必然》中认为，科技在本质上有所偏好，使得它朝往某种特定方向。毫无疑问，进入到数字经济时代，人工智能技术飞速发展与加速应用之际，这个特定方向逐渐明朗：即算力科技，算力已经成为新一轮科技和产业革命的核心生产力，发展先进的数据中心基础设施是数字...

大数据 2024-01-22 人工智能

874阅读