-
AIGC入门(一) 从零开始搭建Transformer!(上)
前言 我记得曾经看过一篇综述,综述里曾这样讲过: 多模态使用Transformer作为基石模型的一个原因之一,就是因为它能够很好地统一视觉(ViT、DiT)和文本,并且无限制地扩大其参数。这是一个在工程上很有作用也很有实际意义的事情。 笔者...
-
对比体验 ChatGPT,聊聊文心一言的优缺点
在昨天文心一言发布后,我第一时间拿到了体验的资格,但第一次使用后却不禁有些失望。他的逻辑能力极度缺乏、创造力也差点意思。不过,今天再次高强度使用后,却又让我对这款产品的想法有了些许改变。 前言 将 2023 年称为 AI 纪元在我看来也没什么不合适的:...
-
AIGC发展方向和前景
引言 背景介绍 AIGC的定义及其发展历程 AIGC,即人工智能生成内容,是近年来在人工智能领域兴起的一项重要技术。它通过使用机器学习和深度学习等技术,使得计算机能够自动生成各种形式的数字内容,如文本、图像、音频和视频等。 AIGC的发展可以...
-
使用LMDeploy部署和量化Llama 3模型
## 引言 在人工智能领域,大型语言模型(LLMs)正变得越来越重要,它们在各种自然语言处理任务中发挥着关键作用。Llama 3是近期发布的一款具有8B和70B参数量的模型,它在性能和效率方面都取得了显著的进步。为了简化Llama 3的部署和量化过程,lm...
-
对标GPT-4 Turbo!科大讯飞刘庆峰:理性认识中美差距 绝不能盲目自信
快科技6月30日消息,科大讯飞最新发布的讯飞星火大模型V4.0,在多个关键能力上实现了对GPT-4 Turbo的超越。 在近日的发布会上,科大讯飞董事长刘庆峰宣布,星火V4.0在文本生成、语言理解、知识问答、逻辑推理和数学能力等方面均达到国际领先水平,在8...
-
【AIGC调研系列】全新的多模态小模型Phi-3-vision
全新的多模态小模型Phi-3-vision是微软在2024年推出的最新AI模型。Phi-3-vision是一个具有42亿参数的多模态模型,能够处理图像和文本数据,并对这些数据进行高效的推理和响应[12][13][14]。 Phi-3-vision特别适用...
-
2024年AIGC行业研究:多模态大模型与商业应用_
2024年2月,OpenAI发布其首款视频生成模型Sora,用户仅需输入一段文字即可生成长达一分钟场景切换流畅、细节呈现清晰、情感表达准确的高清视频,与一年前的AI生成视频相比,在各维度均实现了质的提升。这一突破再次将AIGC推向大众视野。AIGC即通过大...
-
国产大模型新高度!讯飞星火4.0发布:整体超越GPT-4 Turbo,8个国际权威测试集测评第一
国内大模型的能力,又来到了一个新高度! 6月27日,科大讯飞正式对外发布讯飞星火大模型V4.0,以及在医疗、教育、商业等多个领域的人工智能应用。 随着新版本的发布,讯飞星火V4.0七大核心能力全面升级,在8个国际主流测试集中排名第一,整体超越GPT-4Tu...
-
【大模型应用】使用 Windows 窗体作为 Copilot 应用程序的 Ollama AI 前端(测试llava视觉问答)...
项目 “WinForm_Ollama_Copilot” 是一个使用Windows Forms作为前端的Ollama AI Copilot应用程序。这个项目的目的是提供一个用户界面(UI ,通过它,用户可以与Ollama AI进行交互。以下是该项目的一...
-
Stable Diffusion 3: Research Paper
Stable Diffusion 3: Research Paper 1. 核心理念 扩展模型 (Stable Diffusion 在與 DALL·E 3、Midjourney v6 和 Ideogram v1这些图像生成系统相比,在书写效果以及...
-
每日一看大模型新闻(2024.1.20-1.21)英伟达新对话QA模型准确度超GPT-4,却遭吐槽:无权重代码意义不大;Llama 2打败GPT-4!Meta让大模型自我奖励自迭代,再证合成数据是LL
1.产品发布 1.1韩国Kakao:推出多模态大模型Honeybee 发布日期:2024.1.20 Kakao unveils multimodal large language model Honeybee - The Korea Ti...
-
AIGC技术的发展现状与未来趋势探讨
AIGC技术的发展现状与未来趋势探讨 随着人工智能(AI)技术的迅猛发展,AI生成内容(AI-Generated Content,AIGC)成为了一项颠覆性的技术,它能够自动生成文本、图像、音频和视频等多种内容。本文将探讨AIGC技术的发展现状及未来趋...
-
一句话可触达200 车控动作!讯飞星火大模型已赋能红旗、奇瑞、广汽等车企
快科技6月27日消息,在讯飞星火大模型V4.0发布会上,据科大讯飞董事长刘庆峰介绍: 讯飞语音交互已广泛应用于国内外汽车市场,产品前装累计搭载超5700万套,市占率位于行业首位。 并且,科大讯飞星火大模型已赋能红旗、奇瑞、广汽等多家车企,搭载该大模型的相关...
-
科大讯飞发布星火大模型4.0:整体超越GPT-4 Turbo!
快科技6月27日消息,科大讯飞今日在北京举办了一场主题为懂你的AI助手”的发布会,正式推出了全新的讯飞星火大模型V4.0,并展示了其在医疗、教育、商业等多个领域的人工智能应用。 据刘庆峰介绍,星火大模型V4.0的训练依托于国内首个国产万卡算力集群飞星一号”...
-
[Stable Diffusion/LDM] High-Resolution Image Synthesis with Latent Diffusion Models
这篇讲解很详细,可以参考:https://zhuanlan.zhihu.com/p/634573765 附上苏神的讲解:生成扩散模型漫谈(二十二):信噪比与大图生成(上) - 科学空间|Scientific Spaces...
-
百度文心一言插件商城正式上线!一键安装搞定PPT生成、音视频提取
快科技12月14日消息,日前,百度官方宣布,百度文心一言插件商城正式上线,插件覆盖办公提效、多模态内容理解生成、专业信息查询等实用场景。 用户一键安装插件后,只需通过简单指令,即可实现PPT生成、音视频提取、思维导图制作等多场景多模态下的需求。...
-
重磅发布!Stable Diffusion 3 Medium 终于开源,革新图像生成技术新时代
重磅发布!Stable Diffusion 3 Medium 终于开源,革新图像生成技术新时代 关键词:Stable Diffusion 3 Medium, MMDiT, 文本到图像模型, 图像质量, 排版, 复杂提示理解, 资源效率 原...
-
中国杀出全球首个烹饪大模型
什么?烹饪也有大模型?! 没有听错,这就是国产厨电龙头老板电器最新发布——“食神”大模型。 数十亿级行业数据,数千万级知识图谱加持,据称还是全球首个。 它能为每个人提供个性化量身定制的解决方案,不仅告诉用户怎么做菜,还能调动所有设备,协助你把菜做出来。...
-
Llama 3-V:以100倍小的模型和500美元匹敌GPT4-V视觉模型
概述 Llama3 的横空出世震惊了世界,它在几乎所有基准测试中都超越了 GPT-3.5,并在一些方面超越了 GPT-4。随后,GPT-4o 的出现凭借其多模态能力再次夺回了王座。今天,我们发布了一个改变现状的产品:Llama3-V,这是首个基于 Ll...
-
【AI学习】LLaMA 系列模型的进化(一)
一直对LLaMA 名下的各个模型关系搞不清楚,什么羊驼、考拉的,不知所以。幸好看到两篇综述,有个大致了解,以及SEBASTIAN RASCHKA对LLaMa 3的介绍。做一个记录。 一、文章《Large Language Models: A Surve...
-
Llama 3-V: 比GPT4-V小100倍的SOTA
大模型技术论文不断,每个月总会新增上千篇。本专栏精选论文重点解读,主题还是围绕着行业实践和工程量产。若在某个环节出现卡点,可以回到大模型必备腔调重新阅读。而最新科技(Mamba,xLSTM,KAN)则提供了大模型领域最新技术跟踪。若对于如果构建生成级别的A...
-
字节跳动回应AI处理器传闻:消息不实
快科技6月24日消息,有传闻称,字节跳动正在与美国芯片制造商博通合作开发先进的AI处理器。 据说,这款AI处理器将采用5nm工艺制造,由台积电负责生产,尽管设计工作进展顺利,但目前尚未开始流片”阶段,即设计阶段结束和制造开始的标志。 对此,字节跳动回应称,...
-
AI日报|微软Copilot全家桶造福十亿打工人,李开复称大模型狂降价是双输...
文章推荐 阿里通义降价,百度文心免费,一图对比谁是最具性价比大模型? AI晚报|微软推出Copilot+PC,通义主模型大幅降价,文心两大模型全面免费... AI Agent深度解析:潜力与挑战并存的智能新世界 微软Build 2024:Copil...
-
每日AIGC最新进展(24):用于图像质量和审美评估的统一视觉-语言预训练模型UniQA、可控生成图像压缩框架Control-GIC、3D感知扩散模型Ouroboros3D
Diffusion Models专栏文章汇总:入门与实战 UniQA: Unified Vision-Language Pre-training for Image Quality and Aesthetic Assessment 本文提出了一...
-
文心一言和GPT-4横向对比
文心一言和GPT-4在多个方面都存在明显的差异,下面进行详细的横向对比: 首先,从产品定位和发布时间来看,文心一言是百度推出的大语言模型产品,旨在提供文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成等多种能力。而GPT-4则是OpenAI在GP...
-
原生鸿蒙AI浓度要爆表了:鸿蒙原生智能加持,华为小艺进化成系统级智能体
“鸿蒙原生智能”Harmony Intelligence来了! 一年一度华为开发者大会上,余承东首次揭秘。 而在Harmony Intelligence革新下,华为小艺也迎来了重大升级—— 现在,它不仅仅是AI助手,而是系统级智能体。 基于盘古大模型5.0...
-
SiliconCloud上新:GLM-4-9B,通用能力超越Llama 3
今天,智谱发布了第四代 GLM 系列开源模型:GLM-4-9B。 GLM-4-9B 系列模型包括:基础版本 GLM-4-9B(8K)、对话版本 GLM-4-9B-Chat(128K)、超长上下文版本 GLM-4-9B-Chat-1M(1M)和多...
-
华为云发布盘古具身智能大模型:“夸父”人形机器人亮相
快科技6月21日消息,在今天的华为开发者大会上,华为云还发布了盘古大模型5.0,以及盘古具身智能大模型。 盘古具身智能大模型是人形机器人的灵魂,会上还展示了乐聚公司搭载该模型的夸父”人形机器人。 据介绍,盘古大模型能够让机器人完成10步以上的复杂任务规划...
-
华为云盘古大模型5.0发布:可控时空生成技术重塑自动驾驶开发
快科技6月21日消息,在今日召开的华为开发者大会(HDC 2024 上,华为云发布了盘古大模型5.0,其创新的多模态生成能力,可以为自动驾驶领域提供更高质量的数据支持。 华为常务董事、华为云CEO张平安表示,盘古5.0通过创新的可控时空生成,大规模的生成和...
-
LLaMA-Factory微调多模态大语言模型教程
本文旨在结合笔者自身的实践经历,详细介绍如何使用 LLaMA-Factory 来微调多模态大语言模型。目前仓库已支持若干流行的MLLM比如LLaVA-1.5,Yi-VL,Paligemma等。 2024.5.29 注:本文后续不再更新,如果想了解更新的特...
-
【AIGC调研系列】MiniMax 稀宇科技的abab 6.5 系列模型与国外先进模型相比的优缺点
MiniMax稀宇科技的abab 6.5系列模型与国外先进模型相比,具有以下优缺点: 优点: abab 6.5系列模型采用了MoE(Mixture of Experts)架构,这是国内首个采用此架构的大模型,标志着MiniMax在自然语言处理领域的技...
-
跟AI做搭子,还是这届年轻人会玩儿
这届年轻人越来越喜欢跟AI做搭子。 比如跟AI做生活搭子,让它帮自己挑水果,X平台网友“Cydiar”前不久发文,说自己用GPT-4o选出了水果店里薄皮沙瓤的一个甜西瓜。 对此,有超70万网友在线围观,还有不少人在评论区用AI选起了各种水果。 除了让...
-
AI日报:前百度高管推AI搜索产品Genspark;Kimi内测上下文缓存功能;TikTok推AI全家桶Symphony;橙篇已支持10万字长文生成
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、前百度高管景鲲创业AI搜索估值...
-
双排组到一个刀硬嘴甜的小姐姐,打完发现她竟是AI大模型。
永劫无间手游,终于在今天开启二测。 这意味着,在本次测试结束后,正式公测就真离我们不远了。 不知道差友里面多少人运气好,今天能顺利进入服务器。 反正官方的各种评论区下面,那些没抽到资格的玩家,已经有点走火入魔了。 而官方(24工作室和网易伏羲实验室 )...
-
探索AIGC时代:全球大模型产品的评估与未来展望
随着人工智能技术的快速发展,AIGC(人工智能生成内容)产品的应用已经成为科技领域的一大趋势。本文通过详细分析我个人使用过的全球知名的AI大模型产品,如OpenAI的GPT系列、Google的Gemini、阿里巴巴的通义和Kimi,深入探讨它们的功能、优势...
-
【学习笔记】文生图模型——Stable diffusion3.0
2.0原理才看到VAE,sd3.0就发布了,虽然还没看到源码和详解,但原来的那个小方向估计得弃。人已经麻了。 1.LDMs模型(stable diffusion≈LDMs+CLIP) 2.stable diffusion3.0模型架构图...
-
AI日报:Hedra图转说话视频免费开放;Deepmind发布超牛自动视频配音技术V2A;美图WHEE V2正式上线;开源版Sora可一键生成720p高清视频
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、Hedra的 Characte...
-
笔记本电脑安装属于自己的Llama 3 8B大模型和对话客户端
选择 Llama 3 模型版本(8B,80 亿参数) 特别注意: Meta 虽然开源了 Llama 3 大模型,但是每个版本都有 Meta 的许可协议,建议大家在接受使用这些模型所需的条款之前仔细阅读。 Llama 3 模型版本有几个,我们主要关注...
-
ChatGPT等模型疯狂训练,最快2026年消耗尽公开文本数据
AI发展科研机构Epochai在官网发布了一项,关于大模型消耗训练数据的研究报告。 目前,人类公开的高质量文本训练数据集大约有300万亿tokens。但随着ChatGPT等模大型的参数、功能越来越强以及过度训练,对训练数据的需求呈指数级增长,预计将在202...
-
【持续更新中!图像-文本对数据集汇总】Stable Diffusion 3 重磅开源,超全图像生成必备训练数据集、教程汇总
Stability AI 已经正式开源 Stable Diffusion 3(简称 SD3)!SD3 是一个图像生成模型,只要给定一段描述性的文字,就能够创造出与之匹配的视觉作品。下图就是由 SD3 生成的图像。 * prompt 史诗...
-
AI从来不是少数人的无限游戏
力大飞砖卷研发,到向下竞低卷价格,全球视野下的大模型与生成式AI已然走过创新扩散的兴趣阶段,行至社会评估其创新可行性的卡点。 正如红杉资本在“Generative AI’s Act Two”(《生成式AI的第二幕》)中指出的,目前生成式AI应用的最大问题,...
-
【机器学习】机器的登神长阶——AIGC
目录 什么是AIGC 普通用户接触AIGC网站推荐 通义千问 白马 普通用户如何用好AIGC 关键提示词的作用 AIGC的影响 就业市场: 教育领域: 创意产业: 经济活动: 社交媒体与信息传播: AIGC面临的挑战...
-
Gen-3 Alpha完全指南:Runway AI视频生成模型使用方法教程与免费体验地址入口
探索Gen-3 Alpha能为你带来哪些改变 为什么选择Gen-3 Alpha? Gen-3 Alpha不仅仅是一款产品——它是一项革命性的技术,致力于在新的基础设施上进行大规模多模态训练,专为创意专业人士、视频制作者和艺术家打造。致力于提供高保真度、一致...
-
Gemini视频推理遥遥领先GPT-4o,Jeff Dean连续转发三次,首个视频多模态基准Video-MME来了
OpenAI和谷歌接连两场发布会,把AI视频推理卷到新高度。 但业界还缺少可以全面评估大模型视频推理能力的基准。 终于,多模态大模型视频分析综合评估基准Video-MME,全面评估多模态大模型的综合视频理解能力,填补了这一领域的空白。 Gemini1.5P...
-
一周SOTA:Meta 发布 Llama 3;Mistral AI 开源 Mixtral 8x22B;阿里开源代码模型CodeQwen1.5;面壁 MiniCPM 2.0 发布
文章目录 一周SOTA:Meta 发布 Llama 3;Mistral AI 开源 Mixtral 8x22B;阿里开源代码模型CodeQwen1.5;面壁 MiniCPM 2.0 发布 1.Meta 震撼发布 Llama 3,8B、70B模...
-
震撼发布 - 本地运行最强开源大模型Llama 3整合包,创作无限可能!
4月19日,全球科技、社交巨头Meta在官网,正式发布了开源大模型——Llama-3。为了让大家能更好地享受开源大模型带来的便利,今天Glen特地给大家制作并分享一个Llama-3-8B大模型整合包。 Llama 3简介 Meta本次开源了8B和7...
-
AI日报:Luma官方亲自下场夸自家“孩子”;日本艺术家用Luma复活妻子看哭网友;苹果AI可能要放大家“鸽子”;北大快手联合推视频生成框架VideoTetris
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、Luma 官方发视频介绍Dre...
-
探索国内主要大模型AIGC产品以及未来的发展
随着近日腾讯元宝APP的正式上线,国内大模型产品又添一员。除此之外,还有大家已经耳熟能详的几个大模型产品,比如:CSDN官方推出的C知道、百度出品的文心一言、阿里达摩院出品的通义千问、360出品的360智脑、字节跳动出品的豆包、科大讯飞出品的讯飞星火。本文...
-
智谱AI 发布最新开源模型GLM-4-9B,通用能力超Llama-3-8B,多模态版本比肩GPT-4V
自 2023 年 3 月 14 日开源 ChatGLM-6B 以来,GLM 系列模型受到广泛关注和认可。特别是 ChatGLM3-6B 开源以后,开发者对智谱AI 第四代模型的开源充满期待。 为了使小模型(10B 以下)具备更加强大的能力,GLM 技术团...
-
了解AIGC:让AI创造内容,改变未来
人不走空 🌈个人主页:人不走空 💖系列专栏:算法专题 ⏰诗词歌赋:斯是陋室,惟吾德馨 目录 什么是AIGC? 定义和概念 🧠 关键技术 🤖 AIGC的发展历程 🕰️ 早期阶段:基...