多模态第17页 - AIGC资讯

云从科技发布国内首款AI原生数据分析产品DataGPT

今日，云从科技发布了国内首款 AI 原生数据分析产品 ——DataGPT。该产品基于云从自主研发的从容多模态大模型，采用新颖的 “对话即分析” 交互模式，改变了企业对复杂数据的认知和应用方式，使数据解析变得简单自然。 DataGPT 具备以下六大亮点:...

大数据 2024-02-01 人工智能

892阅读

InternLM-XComposer2官网体验入口视觉语言AI模型文本图像合成在线使用地址

InternLM-XComposer2是一款领先的视觉语言模型，专注于自由形式文本图像合成与理解。该模型不仅能理解传统的视觉语言，还能从各种输入构建交织的文本图像内容，实现高度可定制的内容创作。InternLM-XComposer2 采用部分LoRA（PL...

AIGC 2024-02-01 人工智能

898阅读

ChatGPT VS 文心一言？赢家是谁？说点真心话

前传今夕是何年？抬望眼，原来已经2024了，距离ChatGPT出道都过去1年又50天了。曾几何时，我还靠着ChatGPT（简称小G）驰骋大学期末大作业的战场，如今已经与她血浓于水。在这个过程中，不乏有竞争者的存在，其中威胁较大的，当属文心一言（简称小...

大数据 2024-02-01 人工智能

1065阅读

赶超Gemini Pro，提升推理、OCR能力的LLaVA-1.6太强了

去年 4 月，威斯康星大学麦迪逊分校、微软研究院和哥伦比亚大学研究者共同发布了 LLaVA（Large Language and Vision Assistant）。尽管 LLaVA 是用一个小的多模态指令数据集训练的，却在一些样本上展示了与 GPT-4...

大数据 2024-02-01 人工智能

889阅读

阿里北交大实习生论文火了！MobileAgent 可模拟人类玩转手机，网友：加速剁手、吃土！

编辑 | 言征出品 | 51CTO技术栈（微信号：blog51cto） “太酷了，以后就靠AI帮我加速剁手吃土了。”近日一款名为MobileAgent的移动智能代理引起了圈内人的注意。一个惊艳之处在于，这款Agent为“手机+GPT4”结合，做出...

大数据 2024-02-01 人工智能

1006阅读

最强开源多模态生成模型MM-Interleaved：首创特征同步器

想象一下，AI 不仅会聊天，还长了「眼睛」，能看懂图片，甚至还会通过画画来表达自己！这意味着，你可以和它们谈天说地，分享图片或视频，它们也同样能用图文并茂的方式回应你。最近，上海人工智能实验室联合香港中文大学多媒体实验室（MMLab）、清华大学、商汤科...

AIGC 2024-02-01 人工智能

941阅读

谷歌的Bard在聊天机器人排名中击败了GPT-4

谷歌的Bard最近通过其Gemini Pro版本在LMSYS聊天机器人榜上超越了OpenAI的GPT-4，标志着聊天机器人领域的一次显著变革。这款更新使得Bard成为LMSYS榜上第二高分的聊天机器人，逐渐摆脱了OpenAI在聊天机器人领域的主导地位。...

人工智能 2024-02-01 人工智能

983阅读

2024大模型应用元年，科大讯飞率先打响商业化第一枪

浩浩荡荡的AIGC潮流，叠加资本资金如火如荼地注入，过去一年里，AI赛道焕发了新生，再度登上了科技语境的浪潮之巅。然而，与大模型战场的热闹相比，在商业化落地场景，AIGC的步伐却略显踌躇——技术层面，从文字到图像创作再到视频创作，AI屡屡交出了刷新大众视...

生成式AI 2024-02-01 人工智能

1052阅读

Stable Diffusion（SD）核心基础知识——（文生图、图生图）

文章目录一、Stable Diffusion核心基础原理（一）Stable Diffusion模型工作流程（二）Stable Diffusion模型核心基础原理（三）Stable Diffusion的训练过程（四）其他主流生成式模型...

生成式AI 2024-02-01 人工智能

1727阅读

AIGC内容分享(四十)：生成式人工智能（AIGC）应用进展浅析

目录 0 引言 1 以ChatGPT为代表的AIGC发展现状 1.1 国外AIGC应用发展现状 1.2 国内AIGC应用发展现状 2 AIGC的技术架构（1）数据层（2）算力基础设施层（3）算法及大模型层（4）AI...

人工智能 2024-02-01 人工智能

1555阅读

AI视野：OpenAI推新模型GPT-4-0125-preview；阿里Qwen-VL升级更新；苹果播客新增转录功能；AI写真项目InstantID在GitHub爆火

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ ???AI应用 OpenAI不服...

人工智能 2024-01-31 人工智能

886阅读

Mobile-Agent: 具有视觉感知可以像人类样操作手机的自主多模态AI代理

Mobile-Agent是一款具有视觉感知的自主多模式移动设备代理，由北京交通大学联合阿里巴巴团队共同开发。简单的说，Mobile-Agent相当于一个可以模拟人类操作手机的自主多模态AI代理。该代理采用纯视觉解决方案，独立于XML和系统元数据，不需要...

AIGC 2024-01-31 人工智能

1047阅读

2031年通信AI市场规模将达388亿美元 5G/6G与AI融合可带来多重收益

全球4G和5G的部署速度比商业服务的推进速度更快，6G预计到2030年也会到来，电信运营商如何以正确姿势迎接未来？目前，全球电信业界都在思考这个问题。其中一大方向是AI，日本NTT Docomo、韩国SK电信等代表，都在积极推进AI与通信融合，寻找新...

AIGC 2024-01-31 人工智能

859阅读

上海智能实验室推图文多模态大模型InternLM-XComposer2（浦语·灵笔2）

InternLM-XComposer2是一款先进的视觉-语言模型，在自由组合文本和图像以及理解这两者之间的内容方面表现卓越。这款模型不仅超越了传统的视觉-语言理解，而且能够巧妙地将多样化的输入，如概要、详尽的文本描述和参考图片，融合成包含文本和图像的复合...

生成式AI 2024-01-31 人工智能

812阅读

一文读懂： AIGC基本原理及应用领域

AIGC是利用人工智能技术来生成内容的一种新型技术。随着人工智能技术的不断发展，AIGC技术也得到了越来越广泛的应用。未来，AIGC技术将会对我们的生活和工作产生巨大的影响。一、AIGC技术的基本原理 AIGC技术的基本...

大数据 2024-01-31 人工智能

5134阅读

多模态LLM多到看不过来？先看这26个SOTA模型吧

当前 AI 领域的关注重心正从大型语言模型（LLM）向多模态转移，于是乎，让 LLM 具备多模态能力的多模态大型语言模型（MM-LLM）就成了一个备受关注的研究主题。近日，腾讯 AI Lab、京都大学和穆罕默德・本・扎耶德人工智能大学的一个研究团队发布...

生成式AI 2024-01-31 人工智能

831阅读

近200+自动驾驶数据集全面调研！一览如何数据闭环全流程

写在前面&个人理解自动驾驶技术在硬件和深度学习方法的最新进展中迅速发展，并展现出令人期待的性能。高质量的数据集对于开发可靠的自动驾驶算法至关重要。先前的数据集调研试图回顾这些数据集，但要么集中在有限数量的数据集上，要么缺乏对数据集特征的详细调查...

生成式AI 2024-01-31 人工智能

1335阅读

重磅！讯飞星火V3.5马上发布！AI写作、AI编程、AI绘画等功能全面提升！

讯飞星火大模型相信很多友友已经不陌生了，可以说是国内GPT相关领域的龙头标杆，而对于1月30日即将在讯飞星火发布会发出的V3.5新版本来说，讯飞星火V3.5与之前版本相比，性能提升方面相当明显，在提示语义理解、内容生成、逻辑推理、实时交互等非常出色，几乎...

人工智能 2024-01-31 人工智能

893阅读

【探索科技感知未来】文心一言大模型

【探索科技感知未来】文心大模型 ?本文介绍文心一言大模型是由中国科技巨头百度公司研发的一款大规模语言模型，其基于先进的深度学习技术和海量数据训练而成。这款大模型具备强大的自然语言处理能力，可以理解并生成自然语言，为用户提供自然、流畅的语言交...

大数据 2024-01-31 人工智能

1365阅读

2024中关村论坛系列活动——中关村开源生态论坛暨大模型智能应用技术大会圆满举办

海淀区是全国人工智能发展高地，具有较好的产业基础和先发优势。为精准支持人工智能大模型的发展，近年来，海淀区陆续出台了《关于加快中关村科学城人工智能大模型创新发展的若干措施》《中关村科学城通用人工智能创新引领发展实施方案（2023-2025年）》等政策文...

AIGC 2024-01-30 人工智能

866阅读

准确率不足20%，GPT-4V/Gemini竟看不懂漫画！首个图像序列基准测试开源

OpenAI的GPT-4V和谷歌最新的Gemini多模态大语言模型一经推出就得到业界和学界的热切关注: 一系列工作都从多角度展示了这些多模态大语言模型对视频的理解能力。人们似乎相信我们离通用人工智能artificial general intellige...

大数据 2024-01-30 人工智能

885阅读

讯飞推出“智慧黑板”：从板书工具跃迁为教师AI助手

快科技1月30日消息，今天下午讯飞星火大模型3.5正式发布。会上，科大讯飞推出了星火智慧黑板”，号称让黑板从板书工具跃迁为教师AI助手。据了解，星火智慧黑板具备四大特色： 1、多模态理解与推荐，让知识的讲解更直观、更生动 2、全自然交互，让老师授课更便...

人工智能 2024-01-30 人工智能

807阅读

AIGC教育行业全景报告：AI助教和家教成真，学习机迎来新机遇

经过一年的快速迭代，业内对于生成式AI将会率先落地于哪些行业已经有了答案。教育领域，不仅被OpenAI列为重点应用之一，也成为国内大模型厂商布局的重点方向。生成式AI技术发展的背后，反映出人类与大模型交互的不断精进。大模型在训练过程中不断学习人类的思...

人工智能 2024-01-30 人工智能

845阅读

科大讯飞发布星火认知大模型 V3.5，多项核心能力超越GPT-4Turbo

在今日下午的发布会上，科大讯飞宣布了星火认知大模型 V3.5的全面升级，该模型在文本生成、语言理解、知识问答等七大能力上均取得显著提升。值得一提的是，其中语言理解、数学能力已超越 GPT-4Turbo，代码能力更达到了 GPT-4Turbo96%，多模态理...

生成式AI 2024-01-30 人工智能

853阅读

AIGC能产生什么样的应用价值？AIGC技术与应用全解析

一、简介近期，短视频平台上火爆的“AI绘画”，在各大科技平台上刷屏的智能聊天软件ChatGPT，引起了人们广泛关注。人工智能潜力再次被证明，而这两个概念均来自同一个领域：AIGC。AIGC到底是什么？为什么如此引人关注？AIGC能产生什么样的应用价值？...

AIGC 2024-01-30 人工智能

1536阅读

AI视野：Meta发布Code Llama70B；Nijijourney V6模型正式上线；Chrome将内置AI写作助手；Minimax的AI对话机器人海螺问问上线

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ ???AI应用 Meta发布最新A...

人工智能 2024-01-30 人工智能

884阅读

把图像视为外语，快手、北大多模态大模型媲美DALLE-3

当前的大型语言模型如 GPT、LLaMA 等在自然语言处理领域取得了显著进展，能够理解和生成复杂的文本内容。但你是否想过，如果能够将大语言模型这强大的理解和生成能力迁移到多模态数据上，就可以轻松理解海量的图像与视频，并辅助创作图文并茂的内容。近期，来自快...

大数据 2024-01-30 人工智能

881阅读

AI虚拟陪伴聊天应用如此火爆，为什么没有中国版Character.ai出现？

三句话，让生气的AI恋人原谅我。最近，一款名为“哄哄模拟器”的AI聊天产品突然走红。与单纯提供陪伴、情绪价值的AI聊天应用不同，哄哄模拟器更像是一个练习高情商对话的小游戏。游戏内预设了多种常见的情侣吵架场景，包括但不限于: 你需要想方设法在限...

大数据 2024-01-30 人工智能

1422阅读

PAI-ChatLearn ：灵活易用、大规模 RLHF 高效训练框架（阿里云最新实践）

PAI-ChatLearn 是阿里云机器学习平台 PAI 团队自主研发的，灵活易用、大规模模型 RLHF 高效训练框架，支持大模型进行 SFT（有监督指令微调）、RM（奖励模型）、RLHF（基于人类反馈的强化学习）完整训练流程。PAI-ChatLear...

人工智能 2024-01-30 人工智能

1342阅读

科大讯飞2023年净利同比增幅达15%-30%：星火大模型V3.5明日发

快科技1月29日消息，科大讯飞晚间发布2023年度业绩预告，2023年实现归属于上市公司股东的净利润6.45亿元-7.3亿元，同比增长15%-30%。报告期内，公司在人工智能通用大模型及行业大模型方面坚定投入并取得显著进展。科大讯飞表示，公司在讯飞星火...

生成式AI 2024-01-29 人工智能

900阅读

第三十二章：ChatGPT与AIGC在物联网领域的应用

1.背景介绍物联网(Internet of Things，IoT 是指通过互联网将物体和设备连接起来，实现数据的传输和共享。物联网技术已经广泛应用于各个领域，如智能家居、智能城市、智能制造、智能农业等。随着数据量的增加和计算能力的提高，人工智能...

人工智能 2024-01-29 人工智能

925阅读

Gemini官网体验入口谷歌DeepMind多模态AI人工智能在线使用地址

Gemini是由谷歌DeepMind推出的新一代人工智能系统。作为全球热门的多模态AI系统，Gemini能够进行多模态推理，支持文本、图像、视频、音频和代码之间的无缝交互。在语言理解、推理、数学、编程等多个领域，Gemini超越了之前的状态，成为迄今为止最...

人工智能 2024-01-29 人工智能

1873阅读

2024年1月17日Arxiv最热论文推荐：清华提出多模态知识检索新框架、MIT新方法大幅提升LLMs的连贯性、浙大新模型助力视频任务新突破、Meta 革新搜索技术、Google革新AI写作

本文整理了今日发表在ArXiv上的AI论文中最热门的TOP5。论文解读、论文热度排序、论文标签、中文标题、推荐理由和论文摘要均由赛博马良平台（saibomaliang.com）上的智能体「AI论文解读达人」提供。如需查看其他热门论文，欢迎移步 ...

AIGC 2024-01-29 人工智能

1261阅读

Llama-2+Mistral+MPT=? 融合多个异构大模型显奇效

随着 LLaMA、Mistral 等大语言模型的成功，各家大厂和初创公司都纷纷创建自己的大语言模型。但从头训练新的大语言模型所需要的成本十分高昂，且新旧模型之间可能存在能力的冗余。近日，中山大学和腾讯 AI Lab 的研究人员提出了 FuseLLM，用...

生成式AI 2024-01-29 人工智能

825阅读

年轻人的第一个多模态大模型：1080Ti轻松运行，已开源在线可玩

一款名为Vary-toy的“年轻人的第一个多模态大模型”来了！模型大小不到2B，消费级显卡可训练，GTX1080ti 8G的老显卡轻松运行。想将一份文档图片转换成Markdown格式？以往需要文本识别、布局检测和排序、公式表格处理、文本清洗等多个步骤...

生成式AI 2024-01-29 人工智能

896阅读

更适合中文LMM体质的基准CMMMU来了：超过30个细分学科，12K专家级题目

近期，随着多模态大模型（LMM）的能力不断进步，评估 LMM 性能的需求也日益增长。与此同时，在中文环境下评估 LMM 的高级知识和推理能力的重要性更加突出。在这一背景下，M-A-P 开源社区、港科大、滑铁卢大学、零一万物等联合推出了面向中文大规模多...

AIGC 2024-01-29 人工智能

881阅读

三星与百度合作，为Galaxy S24系列创造AI体验

三星在中国选择了一个合法的替代方案，即与百度AI Cloud展开合作。这一战略伙伴关系的宣布意味着三星电子中国和百度将共同创造一种AI体验，以提升三星Galaxy S24系列的功能。在这次合作中，百度的文心一言基础模型将与Galaxy AI深度集成，为...

AIGC 2024-01-29 人工智能

825阅读

通义千问视觉语言模型Qwen-VL在线体验入口阿里云AI在线使用入口

Qwen-VL是阿里云推出的通用型视觉语言模型，具备强大的视觉理解和多模态推理能力。采用 Transformer 结构，以 7B 参数规模进行预训练，支持 448x448 分辨率，能够端到端处理图像与文本的多模态输入与输出。Qwen-VL在多个视觉基准测试...

生成式AI 2024-01-29 人工智能

1151阅读

未来五年AI如何改变各学科？从LLM到AI蛋白设计、医疗保健......

五年前（2019 年 1 月），《Nature Machine Intelligence》创刊。当然，就人工智能（AI）而言，五年前似乎是一个不同的时代。 1 月 24 日，Nature Machine Intelligence 杂志在《Annivers...

AIGC 2024-01-29 人工智能

900阅读

从20亿数据中学习物理世界，基于Transformer的通用世界模型成功挑战视频生成

建立会做视频的世界模型，也能通过Transformer来实现了！来自清华和极佳科技的研究人员联手，推出了全新的视频生成通用世界模型——WorldDreamer。它可以完成自然场景和自动驾驶场景多种视频生成任务，例如文生视频、图生视频、视频编辑、动作序...

AIGC 2024-01-29 人工智能

852阅读

开源一个整合了AIGC大语言模型的SpringBoot智慧医药系统

前言哈喽兄弟们，好久不见哦～最近整理了一下之前写过的一些小项目/毕业设计。发现还是有很多存货的，虽然这些项目普遍都写的比较简单，但想一想既然放在电脑里面也吃灰，那么还不如开源分享出去，没准还可以帮助到一些小白新手。本期就在其中选取了一个医...

大数据 2024-01-29 人工智能

1287阅读

首届百度商业AI技术创新大赛启动点燃AIGC革新“星火”

随着生成式AI在全球范围的热议，AIGC前沿技术也在快速迭代，正如百度CEO李彦宏所说 “人工智能发生了方向性改变，从辨别式AI走向生成式AI，生成式AI会带来极大的效率提升” 。而这一领域的发展，将推动AI产品应用深化，极有可能在内容创作、客户服务等领域...

人工智能 2024-01-29 人工智能

875阅读

Midjourney V6更新解读与侵权风险警告；AI Agent智能体创业必读；高清图解Mixtral和MoE；2023年度AI设计实践报告 | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦！ ? Midjourney V6 文生图细节爆炸，但是被扒叠图电影画面？左图提示词：a full body editorial santa ho...

人工智能 2024-01-27 人工智能

1259阅读

多模态大模型，阿里通义千问能和GPT-4V掰手腕了

通义千问的图像推理能力，最近有了大幅提升。 2024年，大模型领域要卷什么? 如果没有思路的话，不妨看看各家大厂都在押注什么方向。最近一段时间，先是 OpenAI 推出 GPT-4V，让大模型拥有了前所未有的图像语义理解能力。谷歌随后跟上，发布的 G...

大数据 2024-01-26 人工智能

853阅读

聚观早报 |苹果官网大促销；微软开放AI助手Copilot

聚观早报每日整理最值得关注的行业重点事件，帮助大家及时了解最新行业动态，每日读报，就读聚观365资讯简报。整理丨Cutie 1月17日消息苹果官网大促销微软开放AI助手Copilot vivo X100 Ultra影像规格曝光智谱A...

生成式AI 2024-01-26 人工智能

923阅读