-
精读代码,实战进阶-Datawhale X魔搭AI夏令营 AIGC方向Task02学习笔记
基础知识 AIGC是未来人工智能的重点方向 AIGC高速发展的同时,也被一些心怀不轨之人当作牟利里的技术,如Deepfake技术。 AI生图最早的工具是机械臂输出作画,现代的AI生图模型大多基于深度神经网络基础上训练。 *一般来说,AI生图模型属于多模...
-
语言图像模型大一统!Meta将Transformer和Diffusion融合,多模态AI王者登场
【新智元导读】就在刚刚,Meta最新发布的Transfusion,能够训练生成文本和图像的统一模型了!完美融合Transformer和扩散领域之后,语言模型和图像大一统,又近了一步。也就是说,真正的多模态AI模型,可能很快就要来了! Transformer...
-
AIGC:clip-interrogator
文字生成图片是近年来多模态和大模型研究的热门方向,openai提出的CLIP提供了一个方法建立起了图片和文字的联系,但是只能做到给定一张图片选择给定文本语义最相近的那一个,实际项目开发中我们总是需要从一张图片获取描述,clip-interrogator应运...
-
最强终端部署的多模态MiniCPM-V模型部署分享(不看后悔)
MiniCPM-V模型是一个强大的端侧多模态大语言模型,专为高效的终端部署而设计。 目前该模型有MiniCPM-V 1.0、MiniCPM-V 2.0和MiniCPM-Llama3-V 2.5版本。 MiniCPM-V 1.0模型:该模型系列第一个版本...
-
ACM MM2024 | 网易伏羲多模态研究再获国际认可,推动特定领域跨模态理解新突破
近日,第32届ACM国际多媒体学术会议(ACM International Conference on Multimedia,简称ACM MM)公布论文接收结果,网易伏羲最新研究成果《Selection and Reconstruction of Key...
-
「深度探索:AIGC——从文本到视觉的奇迹之旅」
文章目录 1. 探讨AIGC技术的发展现状和未来趋势 1.1 引言 1.1.1 定义AIGC 1.1.2 重要性与应用领域 1.1.3 文章目的 2. AIGC技术的发展历程 2.1 起源与早期阶段 2.2 技术突破 2.2.1 深...
-
AI智能体,年轻人的情感搭子
「AI智能体太好了,现实生活当中,我永远没办法得到永远不变的爱。」这是一位网友使用AI情感陪伴类App后的真实感受。 现在每月都有成百上千万的年轻人,近乎沉醉地与各种AI智能体对话。 他们每月花费在这些软件上的时间,甚至超过一周。他们把智能体当做恋人、朋友...
-
Xinference安装及部署大模型
1. Xinference 介绍 Xorbits Inference (Xinference 是一个开源平台,用于简化各种 AI 模型的运行和集成。借助 Xinference,您可以使用任何开源 LLM、嵌入模型和多模态模型在云端或本地环境中运行推理...
-
华为昇腾Ascend系列 之 01 什么是昇腾芯片?AIGC浪潮已至,进一步推动对芯片和算力的需求,主流 GPGPU/ASIC 产品性能对比(Ascend 910、Ascend 910B)
什么是昇腾Ascend 910、Ascend 910B 昇腾 310 和 910 处理器为华为AI 算力领域核心产品,910 单卡 Int8 算力大致可达 0.6 P,最大功耗为 300W,已可对标国际主流 GPU。且昇腾计算产业在硬件方面坚持“硬件开...
-
如何高效微调多模态Transformers模型:从入门到实践指南
多模态大模型(Multimodal Large Models)是能够处理多种类型数据(如文本、图像、音频等)的机器学习模型。transformers 是当前多模态大模型中的一种重要架构。 目录 Transformers简介 多模态Transforme...
-
Datawhale X 魔搭 AI夏令营 第四期 魔搭-AIGC方向 Task03笔记
从零入门AI生图原理&实践 是 Datawhale 2024 年 AI 夏令营第四期的学习活动(“AIGC”方向),基于魔搭社区“可图Kolors-LoRA风格故事挑战赛”开展的实践学习。 Datawhale官方的速通教程链接: Task 1...
-
AI测试入门:认识AIGC与多模态技术
AI测试入门:认识AIGC与多模态技术 前言 一、 什么是AIGC? 二、 AIGC的技术基础 三、 AIGC的工作原理 四、AIGC的应用场景 4.1. 媒体与出版 4.2. 市场营销 4.3. 教育 4.4. 游戏开发 4.5. 艺术创作...
-
多模态合规分析平台,保障AIGC营销新时代对客服务高质合规
随着生成式人工智能技术加速应用于人类日常生产生活,AIGC(人工智能生成内容)正逐渐成为营销领域的新选择。 与此同时,全渠道数字化时代来临,企业与客户的互动形式更加丰富,包括线上营销平台、私域微信运营、5G视频客服等多形态媒介,沟通更加频繁,营销素材的影...
-
AI日报:新壹视频大模型2.0发布;LivePortrait支持用图片控制动画;OpenAI推GPT-4o模型微调功能;免费无水印!AI视频Hotshot最长可生成10秒
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、新壹视频大模型2.0发布:支持...
-
AIGC学习笔记
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 前言 提示:这里可以添加本文要记录的大概内容: 记录一下学习AIGC,参考链接: 爆火的AIGC到底是什么 提示:以下是本篇文章正文内容,下面案例可供参考 一、stab...
-
即刻体验 Llama3.1就在Amazon Bedrock!
引言 在人工智能的浪潮中,大型语言模型(LLMs)不断推动着技术边界的扩展。Meta 最新推出的 Llama 3.1 模型系列,以其卓越的性能和广泛的应用前景,引起了业界的广泛关注。现在,激动人心的消息来了——Llama3.1 已经在 Amazon Be...
-
AI日报:《黑神话:悟空》应该感谢AI;通义千问启用新域名“tongyi.ai”;Luma v1.5版本发布;claude被作家集体起诉
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、《黑神话:悟空》震撼上线,英伟...
-
尝试问AI:什么是AIGC?
本文内容为AI生成 介绍一下什么是AIGC Q: 介绍一下什么是AIGC A: AIGC,全称为Artificial Intelligence Generated Content(人工智能生成内容),是一种利用人工智能技术自动创造各种形式内...
-
AI日报:昆仑万维推AI短剧平台SkyReels;Glif工作流可一键生成时尚模特图;在线版FLUX提供LoRA训练;ControlNeXt让钢铁侠跳美女舞蹈
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、昆仑万维推出全球首个AI短剧平...
-
国产AI机器人好超前…弹琴泡茶打咏春,还能撸猫??
什么水平,让海外最火AI机器人Figure的CEO都第一时间关注? 国产人形机器人大秀肌肉,最新技能居然是弹琴泡功夫茶……和颠勺?! 手握琴竹,精准轻巧敲击每根琴弦,演奏动听音乐。 熟练泡一壶功夫茶,十几道工序、数个杯壶轻松拿捏。 搞定一份香喷喷的华夫饼...
-
Datawhale AI夏令营第四期魔搭-AIGC文生图方向Task 1笔记
引言 本笔记可以作为学习手册的扩充版本,也是一份快速上手的指南。灰色的备注部分包含了关于步骤的详细解释和扩展内容,建议你可以先跳过这些备注,等完成所有步骤后再回头查阅。 第一步:搭建代码环境 1.1 申请阿里云PAI-DSW 阿里云PAI-D...
-
哦吼,新模型?文生图领域的新模型FLUX.1(附模型下载网盘地址和详细使用方法)
🎡背景 Black Forest Labs 是由 Stable Diffusion 原班人马成立的公司,致力于研发优质的多模态模型并开源。该公司由多位前 Stability AI 研究员组成,包括 Robin Rombach 在内的团队成员,他们在图像和...
-
超逼真AI生成电影来了!《泰坦尼克号》AI重生!浙大&阿里发布MovieDreamer,纯AI生成电影引爆热议!
视频生成领域的最新进展主要利用了短时内容的扩散模型。然而,这些方法往往无法对复杂的叙事进行建模,也无法在较长时间内保持角色的一致性,而这对于电影等长篇视频制作至关重要。 对此,浙大&阿里发布了一种新颖的分层框架MovieDreamer,它将自回归...
-
【论文+中文文生图】Kolors:快手可图绘画模型实测(24.07.06开源)
代码:https://github.com/Kwai-Kolors/Kolors | 权重 论文原文:Kolors: Effective Training of Diffusion Model for Photorealistic Text-to-Imag...
-
这个除了会表达爱什么都不会的AI,凭什么能卖到7万块?
“它毛茸茸的,渴望得到关注。但更重要的是,它爱你。” 乍一看,它就像果宝特攻里的角色,神似橙留香,或菠萝吹雪。 上为LOVOT,下为果宝特攻 所以在第一眼看到它时,会让人感到熟悉又好奇。 它既是陈冠希喜爱的陪伴机器人。 也曾出演日本已故知名演员三浦春马的...
-
盘点目前有关数字人的开源项目
近年来,数字人技术的迅猛发展吸引了众多研究者和开发者的关注。开源社区也涌现出许多优秀的项目,为数字人技术的发展提供了强有力的支持。本文将对一些目前较为热门的数字人生成相关开源项目进行分类整理和总结,以供广大开发者和研究人员参考。 一、动画人像生成与动作...
-
Chameleon:Meta推出的图文混合多模态开源模型
目录 引言 一、Chameleon模型概述 1、早期融合和基于token的混合模态模型 1)早期融合的优势 2)基于token的方法 2、端到端训练 二、技术挑战与解决方案 1、优化稳定性问题 2、扩展性问题 3、架构创新 4、训练技...
-
GPT-4o mini:AI技术的平民化革命
目录 引言 一、GPT-4o mini简介 二、性能表现 三、技术特点 四、价格与市场定位 五、应用场景 六、安全性与可靠性 七、未来展望 八、代码示例 结语 引言 在人工智能的浪潮中,大模型技术一直是研究和应用的热点。然而,高...
-
Nature曝惊人内幕:论文被天价卖出喂AI!出版商狂赚上亿,作者0收入
Nature的一篇文章透露:你发过的paper,很可能已经被拿去训练模型了!有的出版商靠卖数据,已经狂赚2300万美元。然而辛辛苦苦码论文的作者们,却拿不到一分钱,这合理吗? 全球数据告急,怎么办? 论文来凑! 最近,Nature的一篇文章向我们揭露了这样...
-
【SD3】发布,送你3个ComfyUI工作流,轻松搞定AI绘画
这几天AI绘画界最轰动的消息莫过于Stable Diffusion 3(简称SD3)的发布。SD3是一个多模态的 Diffusion Transformer 模型,其在图像质量、排版、复杂提示理解和资源效率方面具有显著提升。 废话不多说,先给大家看看我使...
-
Meta发布新肥羊:Llama 3.1 大模型
Meta 的新 Llama 3.1 模型已经发布,开始与 GPT-4o 和 Claude 3.5 Sonnet 竞争。 Meta 在 23 号宣布其开源 AI 模型 Llama 已发布最新版本。据 Meta 称,随着 Llama 3.1 405B 的...
-
AI领域的《猫鼠游戏》,盘点那些打假“AI内容”的强大产品,这款检测器已经突破400万用户
莱昂纳多扮演的小弗兰克在《猫鼠游戏》中凭借着高超的假币伪造技术骗过了一众警察。现实中,AI领域的《猫鼠游戏》正在上演,一场有关人工制作内容和 AI 生成内容的判定成为越来越重要的议题。 Human or AI,这是一个问题。 本文介绍了 GPTZero 这...
-
华为发布全新OceanStor A800 AI存储:10TB级带宽 专攻AI大模型
快科技8月14日消息,近日,在2024华为数据存储用户精英论坛上,AI-Ready的数据基础设施”分论坛成功举行。 为促进AI大模型健康发展,华为推出了全新的OceanStor A800 AI存储。 华为表示,该存储采用数控分离架构,提供10TB级带宽和亿...
-
LLM大模型:一文彻底搞定 RAG、知识库、 Llama-3
简介: Llama-3 用于 RAG,增强大语言模型的性能,整合外部知识。关键组件包括:1 自定义知识库,存储更新的信息;2 分块处理,拆解文本便于管理;3 嵌入模型,转化多模态数据为数值向量;4 向量数据库,快速检索相似性;5 用户聊天界面,交...
-
AIGC大模型面经汇总,太全了!
字节 暑期实习 多模态算法 (二面凉经 一面 2024/3/28 下午17:00-18:00 1.上来没有自我介绍 2.直接介绍NeurIPS论文,中间穿插着一些提问 3.说一下Transformer的整体结构 4.了解有哪些位置编码方式吗 5.说一...
-
SD原班人马发布FLUX.1:打开AI绘画新世界
Black Forest Labs 旗下产品 AI 绘画工具如雨后春笋般涌现,让我们对创作的理解不断刷新。就在大家以为已经见识了 AI 绘画的天花板时,FLUX.1 出现了!这款由 Black Forest Labs 推出的 AI 绘画...
-
免费替代Midjourney!FLUX.1使用方法大全,支持ComfyUI
一:Flux.1概述 1.1 它是什么 如果你想直接查看使用教程,MeoAI建议你直接跳到第四章:4种使用方法教程。 Flux.1是由Black Forest Labs开发的一款开源AI图像生成模型。这个模型继承了Stable Diffusion...
-
【AIGC学习】一文带你了解AIGC基础知识(适用于AI入门/小白)
▌导读 写关于AI的文章内容已有一段时间,不少同学问博主怎么学习AI?有没有系统性学习AI知识及教程? 在这里,锅头整理了AIGC的基础知识和本文学习思维导图,方便提炼重点和学习总结。 在过去的几十年中,人工智能(AI)从科幻小说中的异想...
-
超9000颗星,优于GPT-4V!国内开源多模态大模型
国内著名开源社区OpenBMB发布了最新开源多模态大模型——MiniCPM-V2.6。 据悉,MiniCPM-V2.6一共有80亿参数,在单图像、多图像和视频理解方面超越了GPT-4V;在单图像理解方面优于GPT-4o mini、Gemini1.5Pro...
-
一文彻底搞定 RAG、知识库、 Llama-3!!
▼最近直播超级多,预约保你有收获 —1— 使用 Llama-3 搞定 RAG 检索增强生成(Retrieval Augmented Generation,RAG)是一种强大的工具,它通过将企业外部知识整合到生成过程中,增强了大语言...
-
AI日报:阿里开源最新数学模型Qwen2-Math;豆包上线音乐功能;苹果将推高级AI服务;谷歌机器人挑战巴黎奥运
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、阿里开源最新数学模型Qwen2...
-
从LLaMa 3 技术报告,再看LLM构建过程 ——《带你自学大语言模型》系列(番外)
本系列目录 《带你自学大语言模型》系列部分目录及计划,完整版目录见:带你自学大语言模型系列 —— 前言 第一部分 走进大语言模型(科普向) 第一章 走进大语言模型 1.1 从图灵机到GPT,人工智能经历了什么?——《带你自学大语言模型...
-
小米15蓄势待发!雷军预告小米旗舰将接入谷歌AI大模型
快科技8月8日消息,小米创办人雷军在社交平台上宣布,小米旗舰设备国际版将接入谷歌AI大模型Google Gemini,给用户带来更智能、更直观的使用体验。 据悉,Gemini是谷歌研发的多模态AI大模型,能够识别、理解和操作多种类型的信息。 比如你画个鸭子...
-
【03】LLaMA-Factory微调大模型——多模型部署
为了构建法律领域的垂直应用大模型,记录使用LLaMA-Factory微调大模型的过程,以期UU们可以复刻与应用。上文【02】LLaMA-Factory微调大模型——LLaMA-Factory搭建已在本机成功部署模型微调框架,本文则在本机部署多种基础模型,为...
-
AI日报:类GPT-5新模型将上线?奥特曼发草莓照片引热议;美图发布美图云修Pro版; ComfyUI已支持腾讯混元DiT与Flux模型
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、奥特曼发草莓图引发猜测暗示Op...
-
最强国产多模态刚刚易主!腾讯混元把GPT-4/Claude-3.5/Gemini-1.5都超了
国产大模型,多模态能力都开始超越GPT-4-Turbo了?? 权威榜单,中文多模态大模型测评基准SuperCLUE-V,新鲜出炉: 特别是腾讯的hunyuan-vision、上海AI Lab的InternVL2-40B,分别成为国内闭源和开源界两大领跑者...
-
llama模型,nano
目录 llama模型 Llama模型性能评测 nano模型是什么 Gemini Nano模型 参数量 MMLU、GPQA、HumanEval 1. MMLU(Massive Multi-task Language Understanding)...
-
谷歌发布大模型数据筛选方法:效率提升13倍,算力降低10倍
随着GPT-4o、Gemini等多模态大模型的出现,对训练数据的需求呈指数级上升。无论是自然语言文本理解、计算机视觉还是语音识别,使用精心标注的数据集能带来显著的性能提升,同时大幅减少所需的训练数据量。 但目前多数模型的数据处理流程严重依赖于人工筛选,不仅...
-
AI日报:智谱开源清影同源“兄弟”CogVideoX;阿里通义App推出角色扮演功能;即梦视频生成推动效画板功能;OpenAI领导层大动荡!
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、智谱AI宣布开源「清影」同源视...
-
【人工智能大模型】文心一言介绍以及基本使用指令
目录 一、产品背景与技术基础 二、主要功能与特点 基本用法 指令的使用 注意事项 文心一言(ERNIE Bot)是百度基于其文心大模型技术推出的生成式AI产品。以下是对文心一言的详细介绍: 一、产品背景与技术基础 技术背景:百度在...