多模态第23页 - AIGC资讯

AIGC（生成式AI）试用 15 -- 小结

断断续续的尝试在实际的工作使用中理解和测试AIGC，运用会越来越多、越来越广范，但也是时候做个小结了。没有太用热火的ChatGPT，只是拿了日常最容易用到的CSDN创作助手（每周写文章总是看到）和文心一言（没了谷歌只能百度），毕竟天天工作...

生成式AI 2023-12-21 人工智能

908阅读

作业帮图书推出智能教辅支持多模态交互学习、 AI批改

作业帮图书推出了三大系列智能教辅产品，分别是《单词魔法书》、《同步作文公式法》和《小学应用题大通关》。作业帮图书推出的三大系列智能教辅兼具实用性、创新性与互动性，不仅融合了作业帮8.5+亿题库资源和近10年教研团队经验积累，同时搭载作业帮银河大模型等前沿...

人工智能 2023-12-21 人工智能

1272阅读

Gemini 是谷歌迄今为止最佳的 AI 模型但充满希望的基准测试和演示最终引发了批评

谷歌近日公布了其最新的人工智能模型 Gemini，旨在缩小与 OpenAI 之间的差距，并给行业留下深刻印象。该模型展示了强大的基准测试成绩，并通过一段引人注目的视频演示和即时的可用性（尽管是功能受限版本），彰显了谷歌的自信。然而，随着 AI 工程师和...

人工智能 2023-12-21 人工智能

963阅读

被称为下一代风口的AIGC到底是什么？

近期，短视频平台上“AI绘画”的概念爆火，ChatGPT这一词条也刷爆了科技圈，而这些概念同属于一个领域——AIGC。2022年12月，Science杂志发布的2022年度科学十大突破中，AIGC入选。那么，被称之为是AI下一代风口的AIGC到底是什么...

生成式AI 2023-12-21 人工智能

1483阅读

Gemini官网体验入口多模态AI软件app免费下载地址

Gemini是谷歌DeepMind推出的新一代人工智能系统。它能够进行多模态推理，支持文本、图像、视频、音频和代码之间的无缝交互。Gemini在语言理解、推理、数学、编程等多个领域都超越了之前的状态，成为迄今为止最强大的AI系统之一。那么，Gemini在哪...

大数据 2023-12-20 人工智能

859阅读

AIGC大记事【2023-0625】【第五期】：《时代》专访ChatGPT之父：人工智能影响经济还需要很多年

大咖观点：《时代》专访ChatGPT之父：人工智能影响经济还需要很多年孙正义：我每天和ChatGPT聊天，一场巨大革命即将到来，软银“终将统治世界！” 刘慈欣谈 ChatGPT：人类的无能反而是人类最后的屏障 AI时代已来，吴恩达呼吁向每个孩...

生成式AI 2023-12-20 人工智能

942阅读

“文心一言”对标“ChatGPT”有几层功力？

2023年3月16日下午，我们的“李总”宣布文心一言正式发布。在“李总”的介绍中指出，文心一言具有文学创作，商业文案的创作，多模态生成，数理逻辑推算，中文理解等能力。从现场的展示来看，文心一言某种程度上具有了对人类意图的理解能力，回答的准确性，逻...

生成式AI 2023-12-20 人工智能

803阅读

【网安AIGC专题10.11】①代码大模型的应用：检测、修复②其安全性研究：模型窃取攻击（API和网页接口）数据窃取攻击对抗攻击（用途：漏洞隐藏）后门攻击（加触发器+标签翻转）

代码大模型的应用及其安全性研究写在最前面一些想法大型模型输出格式不受控制的解决方法大模型介绍（很有意思）GPT 模型家族的发展 Chatgpt 优点缺点 GPT4 其他模型补充：self-instruct合成数据 Cod...

人工智能 2023-12-19 人工智能

883阅读

聚观早报|百度3月16日发布文心一言；特斯拉被控维修和零部件垄断

今日要闻：百度将3月16日发布「文心一言」；央视3·15曝光诱骗老人直播间均已被封；特斯拉在美国被控「维修和零部件垄断」；英伟达降低 40 系显卡欧洲售价；谷歌在Gmail等办公应用中引入AI技术百度将3月16日发布「文心一言」北京时间 3 月...

AIGC 2023-12-19 人工智能

840阅读

分享一个国内可用的免费GPT4-AI提问AI绘画网站工具

一、前言 ChatGPT GPT4.0，Midjourney绘画，相信对大家应该不感到陌生吧？简单来说，GPT-4技术比之前的GPT-3.5相对来说更加智能，会根据用户的要求生成多种内容甚至也可以和用户进行创作交流。然而，GPT-4对普通用户来说都是需...

人工智能 2023-12-18 人工智能

1261阅读

Gemini官网体验入口谷歌AI聊天模型软件app免费下载地址

Gemini是由谷歌DeepMind推出的新一代人工智能系统。它能够进行多模态推理，支持文本、图像、视频、音频和代码之间的无缝交互。Gemini在语言理解、推理、数学、编程等多个领域的表现超越了以往，成为目前最强大的AI系统之一。它有三个不同规模的版本，能...

生成式AI 2023-12-18 人工智能

1094阅读

2024 年的六个生成式 AI 预测

分析师迈克·莱昂内（Mike Leone）预测了生成式人工智能的下一步——从开源到监管转变——提供了对2024年行业发展方向的全面看法。随着 2023 年接近尾声，是时候展望明年了。当涉及到生成式人工智能时，我们很容易迷失在所有的可能性中——我们在 ...

AIGC 2023-12-18 人工智能

856阅读

AI视野：OpenAI灰度测试GPT4.5；Midjourney V6模型下周发布；Gemini自曝中文用文心一言训练；LeCun提出AGI七阶段路线图

???AI新鲜事 openAI灰度测试GPT4.5 近日，OpenAI正在对最新的GPT4.5turbo模型进行灰度测试，该模型在文本生成质量、效率、上下文理解、多模态能力、编程和代码生成、安全性、个性化定制等七个方面都取得显著进展。 Gemini自曝...

AIGC 2023-12-18 人工智能

1037阅读

GPT-4V都搞不明白的未来推理有解法了！来自华科大&上科大

多模态大语言模型展现了强大的图像理解和推理能力。但要让它们基于当前观测来对未来事件进行预测推理仍然非常困难。即便是当前最强大的GPT-4V（如下图所示），也无法很好地解决这一问题。 △ GPT-4V的错误案例现在，华科大和上科大团队提出了一个赋予...

生成式AI 2023-12-18 人工智能

868阅读

openAI灰度测试GPT4.5 实现六大能力增强

近日，有消息称OpenAI 正在灰度测试最新模型GPT4.5turbo，而宝玉、歸藏等博主也纷纷表示自己的版本已经更新到GPT4.5。据GPT4.5turbo问答结果显示，相较于之前的GPT-4-turbo，新模型在多个方面实现了六大能力的增强。首先，...

人工智能 2023-12-18 人工智能

819阅读

Stable Diffusion Webui源码剖析

1、关键python依赖（1）xformers：优化加速方案。它可以对模型进行适当的优化来加速图片生成并降低显存占用。缺点是输出图像不稳定，有可能比不开Xformers略差。（2）GFPGAN：它是腾讯开源的人脸修复算法，利用预先训练号的面部GAN...

大数据 2023-12-17 人工智能

1335阅读

尊嘟假嘟？2023年人工智能行业新诞生10家独角兽，AIGC竟占近一半

今年的 AIGC 持续热了一年，从王慧文等大佬的入局，到百度发布「文心一言」，各大巨头纷纷发布大模型产品，切实地给中国人工智能赛道的融资添了一把浓烈的火。回顾这即将过去的一整年，虽然 2023 年投融资整体行业遇冷，各种坏消息不断，但总体而言，AI 行...

生成式AI 2023-12-17 人工智能

932阅读

走在GPT 4.5前面？3D、视频直接扔进对话框，大模型掌握跨模态推理

给你一首曲子的音频和一件乐器的 3D 模型，然后问你这件乐器能否演奏出这首曲子。你可以通过听觉来辨认这首曲子的音色，看它是钢琴曲还是小提琴曲又或是来自吉他；同时用视觉识别那是件什么乐器。然后你就能得到问题的答案。但语言模型有能力办到这一点吗？实际上，...

大数据 2023-12-17 人工智能

862阅读

最强文生图跨模态大模型：Stable Diffusion

文章目录一、概述二、Stable Diffusion v1 & v2 2.1 简介 2.2 LAION-5B数据集 2.3 CLIP条件控制模型 2.4 模型训练三、Stable Diffusion 发展 3.1 图形界面...

大数据 2023-12-17 人工智能

1804阅读

AIGC系列之：CLIP和OpenCLIP

目录模型背景 CLIP模型介绍相关资料原理和方法 Image Encoder Text Encoder 对比学习预训练 Zero Shot预测优势和劣势总结 OpenClip模型介绍相关资料原理结果用法...

人工智能 2023-12-17 人工智能

3156阅读

当我获取了文心一言的体验资格，立刻重复了和李彦宏发布会一样的问题，看看文心一言有没有进步（或者是“退步”？

当我获取了文心一言的体验资格，立刻重复了和李彦宏发布会一样的问题，看看文心一言有没有进步（或者是退步？引言文心一言申请方法测试结果文学创作《三体》的作者是哪里人？可以总结一下三体的核心内容吗？如果要续写的话，可以从哪些角度出发？...

生成式AI 2023-12-16 人工智能

858阅读

理想汽车全自研大模型Mind GPT 综合性评测榜单双榜第一

快科技12月16日消息，理想汽车官方发文称，理想自研Mind GPT中文大模型综合性评测榜单双榜第一。两大冠军如下: 1、C-Eval中文大模型综合性测评榜冠军 C-Eval是清华大学、上海交通大学和爱丁堡大学合作构建的中文语言模型综合性考试评估套件，...

生成式AI 2023-12-16 人工智能

823阅读

下一代自动驾驶系统，少不了大模型，系统调研来了

随着大语言模型 (LLM 和视觉基础模型 (VFM 的出现，受益于大模型的多模态人工智能系统有潜力像人类一样全面感知现实世界、做出决策。在最近几个月里，LLM 已经在自动驾驶研究中引起了广泛关注。尽管 LLM 具有巨大潜力，但其在驾驶系统中的关键挑战...

生成式AI 2023-12-16 人工智能

897阅读

个人AI时代正式到来！联想发布两款AI PC：不再只是一个硬件

快科技12月15日消息，在2023英特尔新品发布会暨AI技术创新派对上，联想正式发布了两款AI PC。它们分别是:联想ThinkPad X1Carbon AI 、联想小新Pro16AI酷睿版，现已正式上市，预约预售同步开启。据了解，这两款产品具备内嵌混...

生成式AI 2023-12-16 人工智能

911阅读

OpenAI开源超级对齐方法：用GPT-2，监督、微调GPT-4

12月15日，OpenAI在官网公布了最新研究论文和开源项目——如何用小模型监督大模型，实现更好的新型对齐方法。目前，大模型的主流对齐方法是RLHF（人类反馈强化学习）。但随着大模型朝着多模态、AGI发展，神经元变得庞大、复杂且难控制，RLHF便有点力...

生成式AI 2023-12-16 人工智能

944阅读

中国版的chatGPT“文心一言“到底怎样？

GPT4的提前发布，把压力着实给到百度了！在ChatGPT引爆聊天机器人领域后的数月，我们终于迎来了国内的第一款生成式对话产品。 3月16日14:00，百度文心一言新闻发布会于百度北京总部正式召开。百度创始人、董事长兼CEO李彦宏也实现了自己此前的诺言，...

大数据 2023-12-16 人工智能

994阅读

ChatGPT研究(三)——AIGC多模态交互功能，奠定多场景商用基础

✏️写作：个人博客，InfoQ，掘金，知乎，CSDN ?公众号：进击的Matrix ?特别声明：创作不易，未经授权不得转载或抄袭，如需转载可联系小编授权。前言最近ChatGPT，想必大家已经是耳熟能详了，一度认为ChatGPT的到来是...

人工智能 2023-12-16 人工智能

1002阅读

重磅！苹果官方发布大模型框架：一个可以充分利用苹果统一内存的新的大模型框架MLX，你的MacBook可以一键运行LLaMA了

本文来自DataLearnerAI官方网站：重磅！苹果官方发布大模型框架：一个可以充分利用苹果统一内存的新的大模型框架MLX，你的MacBook可以一键运行LLaMA了 | 数据学习者官方网站(Datalearner https://www.datalea...

大数据 2023-12-15 人工智能

1272阅读

突发！GPT-4.5泄露传闻：是圣诞的礼物，还是传言的迷雾？

刚刚，一颗潜在的AI圈震撼弹——OpenAI 的 GPT-4.5版本——似乎无声地滑入公众的视线。这份所谓的“泄露”信息，以及它预示的技术突破究竟意味着什么，目前仍是一个谜。背景信息:GPT的演变在深入泄露的细节之前，让我们简要回顾一下 GPT 模型...

AIGC 2023-12-15 人工智能

803阅读

AI视野：OpenAI否认即将发布GPT-4.5；Stability AI推出新会员模式；DomoAI支持视频一键转动漫；阿里I2VGen-XL模型代码公布

???AI新鲜事 OpenAI否认即将发布GPT-4.5 OpenAI CEO Sam Altman在Reddit上辟谣称公司未计划发布GPT-4.5，否认最新语言模型的泄露，截图显示为虚假信息。 OpenAI新研究:GPT-2能监督GPT-4 研究发现...

AIGC 2023-12-15 人工智能

930阅读

GPT-4.5大泄露，支持视频3D、价格狂涨6倍？奥特曼亲自回应

GPT 4.5疑似大泄漏：一个是新模型将具备全新多模态能力，文本语音图片以及视频和3D信息全都能一并处理，并且还可以跨模态理解。另一个是更为复杂的推理执行。整个模型被描述为OpenAI最先进的“一款”。图片然而API调用价格狂涨6倍。三个版本...

人工智能 2023-12-15 人工智能

769阅读

2023-12-2 AIGC-chatgpt4-功能-记录

摘要: 2023-12-2 AIGC-chatgpt4-功能-记录英文: ChatGPT-4, as an evolution of OpenAI's language models, has a wide range of capa...

人工智能 2023-12-15 人工智能

860阅读

QTNet：最新时序融合新方案！点云、图像、多模态检测器全适用（NeurIPS 2023）

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面 & 个人理解时序融合能够有效提升自动驾驶3D目标检测的感知能力，然而目前的时序融合方法由于成本开销等问题难以在实际自动驾驶场景中应用。NeurIPS 2023的最新研究文章《Qu...

大数据 2023-12-15 人工智能

1122阅读

扩散模型训练太难？来看看Meta AI最新提出的KNN-Diffusion

原文链接：https://www.techbeat.net/article-info?id=4323 作者：seven_ 最近AIGC社区中有趣的工作可谓是层出不穷，这都得益于扩散模型（Diffusion Models）的成功，扩散模型作为生成式AI...

大数据 2023-12-14 人工智能

922阅读

Gemini官网体验入口谷歌AI软件app免费下载地址

Gemini 是谷歌 DeepMind 推出的一款新一代人工智能系统，能够执行多模态推理，支持文本、图像、视频、音频和代码之间的无缝交互。它在语言理解、推理、数学、编程等多个领域表现卓越，成为最强大的 AI 系统之一。那么，Gemini 在哪里可以体验呢？...

生成式AI 2023-12-14 人工智能

902阅读

百度文心一言插件商城正式上线支持自主设计插件

百度文心一言插件商城正式上线，插件覆盖了办公提效、多模态内容理解生成、专业信息查询等多个实用场景，用户可以通过简单的指令实现 PPT 生成、音视频提取、思维导图制作等需求。插件商城的上线带来了许多超实用的插件，例如项目管理看板可以帮助用户生成多种项目任...

AIGC 2023-12-14 人工智能

868阅读

Gemini官网体验入口谷歌多模态AI软件app免费下载地址

《Gemini》是由 DeepMind 开发的一款先进的人工智能模型，它从根本上构建为多模态，能够在文本、图像、视频、音频和代码之间无缝进行推理。这标志着 AI 如何帮助改善我们日常生活的重大飞跃。想要亲自体验《Gemini》吗?下面为大家提供《Gemin...

大数据 2023-12-13 人工智能

920阅读

随意指定CLIP关注区域！上交复旦等发布Alpha-CLIP：同时保持全图+局部检测能力

CLIP是目前最流行的视觉基座模型，其应用场景包括但不限于：与LLM大语言模型结合成为视觉多模态大模型；作为图像生成(Stable Diffusion 、点云生成(Point-E 的condition model，实现image-to-3D；用于...

生成式AI 2023-12-13 人工智能

1068阅读

Together AI发布AI模型StripedHyena-7B 性能超越Llama-27B

Together AI最新发布了StripedHyena-7B，这一人工智能模型领域的创新力量引起了广泛关注。该模型的基础版本为StripedHyena-Hessian-7B（SH7B），同时还推出了聊天模型StripedHyena-Nous-7B(SH-...

人工智能 2023-12-13 人工智能

977阅读

AI视野：Midjourney正式上线Alpha网页版；OpenAI恢复会员注册；腾讯发布视频生成模型AnimateZero；微软发布小语言模型AI Phi-2

???AI应用 Midjourney正式上线Alpha网页版!支持已生成图片设置参数回填 Midjourney Alpha全新升级，生成用户界面更便捷，成功生成1万张图片即可获得权限，可视化图像参数支持点击回填到提示词输入框，提升生成体验。截图自归藏...

大数据 2023-12-13 人工智能

1027阅读

微软提出变色龙框架，让模型自带工具箱开挂，数学推理任务准确率98%

教大模型调用工具，已经是AI圈关注度最高的话题之一了。这不，又有一项研究登上最新NeurIPS 2023—— 它是一个叫做Chameleon（变色龙）的框架，号称能将大语言模型直接变成魔法师的工具箱，来自微软与加州大学洛杉矶分校（UCLA）。相比其它...

大数据 2023-12-13 人工智能

904阅读

Meta 推出雷朋智能眼镜的多模态 AI 功能测试：可识别物体并翻译语言

Meta 宣布将开始推出其多模态 AI 功能的早期访问测试，这些功能将应用于 Meta Ray-Ban （雷朋）智能眼镜，能够通过眼镜的摄像头和麦克风告知用户所看和所听的内容。马克·扎克伯格在 Instagram 的一个视频中展示了这次更新，他询问眼...

生成式AI 2023-12-13 人工智能

935阅读

Meta Ray-Ban智能眼镜引入AI，可识别物体和语言翻译

Meta公司最新宣布将在其Ray-Ban智能眼镜上推出引人注目的多模态AI功能，为用户提供更智能、交互式的体验。该功能利用眼镜的摄像头和麦克风，使Meta的AI助手能够感知用户周围的视听信息，并做出相应的反应。马克扎克伯格在Instagram的一段视频中...

生成式AI 2023-12-13 人工智能

885阅读

【Video-LLaMA】增强LLM对视频内容的理解

Paper:《Video-LLaMA : An Instruction-tuned Audio-Visual Language Model for Video Understanding》 Authors: Hang Zhang, Xin Li, Lid...

生成式AI 2023-12-13 人工智能

1284阅读

华科大发布AI大模型猴子：部分超越GPT-4

快科技12月12日消息，华中科技大学官方发文称，该校软件学院一团队发布了多模态大模型Monkey”。该模型擅长图像描述和视觉问答，能够实现对世界的观察”，对图片进行深入问答交流和精确描述。官方介绍称，在18个数据集上的实验中，华科大Monkey模型表...

生成式AI 2023-12-12 人工智能

844阅读

Gemini AI怎么申请内测资格谷歌AI聊天机器人有哪些功能

Google Gemini是一款多模态的人工智能模型，可以处理文本、图像、数据、代码等多种类型的信息。它是目前最强大的人工智能模型之一，将会为开发者提供创建新的人工智能应用和接口的能力。你可以了解一下Gemini的工作原理，它与其他人工智能模型的比较，以及...

人工智能 2023-12-12 人工智能

792阅读

UCLA推出Chameleon框架大模型表格数学推理准确率达98.78%

在NeurIPS2023上，UCLA等机构发布的Chameleon框架吸引了广泛关注。该框架通过融合多种工具，包括LLMs、视觉模型、搜索引擎、Python功能及基于规则的模块，解决了大型语言模型在实时信息获取和数学推理方面的不足。 Chameleon的核...

人工智能 2023-12-12 人工智能

883阅读

表格数学推理准确率达98.78%！UCLA推出全新「变色龙推理框架」

在自然语言处理任务中取得显著成就的大型语言模型（LLMs）尽管表现出色，但在实时信息获取、外部工具利用和精确数学推理方面仍显不足。为了应对这些挑战，来自UCLA等机构的研究人员打造了全新的Chameleon框架，其独特的即插即用模型融合了多种工具，包括...

大数据 2023-12-12 人工智能

892阅读

当GPT-4V充当机器人大脑，可能你都没AI会规划

GPT-4V 已经能帮我们设计网站代码，控制浏览器，这些应用集中在虚拟数字世界中。假如我们把 GPT-4V 带入现实世界，让它作为控制机器人的大脑，会有什么有趣的结果呢？最近，来自清华大学交叉信息研究院的研究者提出「ViLa」算法，实现了让 GPT-4...

大数据 2023-12-12 人工智能

847阅读