-
“AIGC第一股”出门问问如愿登录港交所,能否喂饱饥饿的“序列猴子”?
大数据产业创新服务媒体 ——聚焦数据 · 改变商业 创立十二年后,历经两次递表,出门问问终于迎来了上市。 这家由前知名谷歌研究员李志飞创立的专注于提供人工智能服务和智能设备的公司,于今天正式亮相港交所,股票代码 “2438”...
-
大模型理解复杂表格,字节&中科大出手了
只要一个大模型,就能解决打工人遇到的表格难题! 字节联手中科大推出了一款统一表格理解大模型,可以以用户友好的方式解决多种表格理解任务。 同时提出的还有一套开源测试基准,可以更好地评估模型在表格理解任务上的表现。 该模型名为TabPedia,利用多模态大模...
-
规格拉满!Llama和Sora作者都来刷脸的中国AI春晚,还开源了一大堆大模型成果
本周国内最受关注的AI盛事,今日启幕。 活动规格之高,没有哪个关心AI技术发展的人能不为之吸引—— Sora团队负责人Aditya Ramesh与DiT作者谢赛宁同台交流,李开复与张亚勤炉边对话,Llama2/3作者Thomas Scialom,王小川、杨...
-
电脑发展下一阶段!2028年中国AI PC出货量将激增60倍
快科技6月14日消息,市场研究机构IDC最新数据显示,预计到2028年,中国下一代AI PC的年出货量将是2024年的60倍。 这一预测主要基于算力和大模型平台的显著加强,以及AI PC技术的不断进化。 2024年被视为AI PC发展的元年,芯片制造商和P...
-
大型语言模型(LLMs)在AIGC中的核心地位
本文收录于专栏:精通AI实战千例专栏合集 https://blog.csdn.net/weixin_52908342/category_11863492.html 从基础到实践,深入学习。无论你是初学者还是经验丰富的老手,对于本专栏案例和项目实践...
-
国产Sora来了!清华发布视频生成大模型“视界一粟YiSu”
快科技6月12日消息,据媒体报道,北京极佳视界科技有限公司联合清华大学自动化系正式发布我国首个超长时长、高性价比的Sora级视频生成大模型视界一粟 YiSu”。 该大模型拥有模型原生的16秒超长时长,并可生成至1分钟以上视频。据介绍,YiSu模型成本更低、...
-
AI生图格局大震!Stable Diffusion 3开源倒计时,2B单机可跑碾压闭源Midjourney
重磅消息!Stable Diffusion3,大概率会在明天开源。距离2月SD3的横空出世,已经过去了4个月。如果此事为真,生图圈子第一个出现开源碾压闭源的奇景!强大的MMDiT全新架构,将彻底改变AI生图的格局。现在,全体AI社区都在翘首以盼。 万众瞩目...
-
【AIGC】AIGC在虚拟数字人中的应用:塑造未来互动体验的革新力量
🚀 🚀 🚀随着科技的快速发展,AIGC已经成为引领未来的重要力量。其中,AIGC在虚拟数字人领域的应用更是引起了广泛关注。虚拟数字人作为一种先进的数字化表达形式,结合了3D建模、动画技术、人工智能等多种先进技术,能够呈现出高度逼真的虚拟人物,实现与用户的实...
-
【AIGC调研系列】进行大模型调用开发使用的框架有哪些
AIGC大模型进行调用开发使用的框架包括但不限于以下几种: LangChain:这是一个强大的框架,旨在帮助开发人员使用语言模型构建端到端的应用程序。它提供了一套工具、组件和接口,可简化创建由大型语言模型(LLM)和聊天机器人驱动的应用程序的过程[8...
-
生成式人工智能(AIGC)教学解决方案
一、前言 近年来,伴随计算能力跃升和数据量指数级增长,以多模态巨型模型为典型代表的生成式AI技术,在全球范围内引起了广泛关注与热烈追捧。在教育、医疗、法律等众多专业领域,生成式人工智能技术的影响力日益凸显,尤其在教育领域,它不仅是提升教学工具智能化的推手...
-
AIGC时代桌面软件开发技术展望
AIGC技术催生新一代桌面软件 现代大模型技术本质上是一种“NLP”技术,基于这个观点,文本描述驱动引擎就是AI技术落地无法规避的一道墙,每一个AI技术都必须实际的面对这个事实。就文本驱动技术而言,在一个token的两侧,分别插入一个...
-
探索国内大模型AIGC产品
人不走空 🌈个人主页:人不走空 💖系列专栏:算法专题 ⏰诗词歌赋:斯是陋室,惟吾德馨 目录 🌈个人主页:人不走空 💖系列专栏:算法专题 ⏰诗...
-
五一 Llama 3 超级课堂 | XTuner 微调 Llama3 图片理解多模态 实践笔记
基于 Llama3-8B-Instruct 和 XTuner 团队预训练好的 Image Projector 微调自己的多模态图文理解模型 LLaVA。 课程文档:Llama3-Tutorial/docs/llava.md at main · Smart...
-
AIGC中多模态Embedding技术的前沿进展与代码实战
AIGC中多模态Embedding技术的前沿进展与代码实战 作者:禅与计算机程序设计艺术 1. 背景介绍 1.1 AIGC的兴起与多模态技术的必要性 近年来,人工智能生成内容(AIGC)技术的飞速发展,掀起了一场内容生产方式的革命。从文本生成、图像...
-
AIGC你了解多少呢?
AIGC全面介绍 一、引言 随着人工智能技术的飞速发展,AIGC(Artificial Intelligence Generated Content)作为生成式人工智能的重要分支,正在逐渐改变我们的生产、生活和工作方式。AIGC是人工智能1.0时代进入...
-
2024年AIGC行业研究:多模态大模型与商业应用
2024年2月,OpenAI发布其首款视频生成模型Sora,用户仅需输入一段文字即可生成长达一分钟场景切换流畅、细节呈现清晰、情感表达准确的高清视频,与一年前的AI生成视频相比,在各维度均实现了质的提升。这一突破再次将AIGC推向大众视野。AIGC即通过大...
-
GPT-4欺骗人类高达99.16%惊人率!PNAS重磅研究曝出,LLM推理越强欺骗值越高
【新智元导读】最近,德国研究科学家发表的PANS论文揭示了一个令人担忧的现象:LLM已经涌现出「欺骗能力」,它们可以理解并诱导欺骗策。而且,相比前几年的LLM,更先进的GPT-4、ChatGPT等模型在欺骗任务中的表现显著提升。 此前,MIT研究发现,AI...
-
【AIGC半月报】AIGC大模型启元:2024.05(上)
AIGC大模型启元:2024.05(上) (1 Video Mamba Suite(Mamba视频领域应用) (2 KAN(全新神经网络架构) (3 Meshy 3(文本生成3D模型) (4 MemGPT(LLM记忆管理框架) (5 ...
-
【AIGC调研系列】DeepSeek模型的优势和劣势
DeepSeek模型的优势主要包括: 多模态能力:DeepSeek-VL能够在不丢失语言能力的情况下融入多模态能力,能够处理包括逻辑图、网页、公式识别、科学文献、自然图像等多种类型的数据,显示出其强大的通用多模式理解能力[1]。 高分辨率图片输入:...
-
每日AIGC最新进展(17):具有边缘引导运动细化的基于事件的视频帧插值、具有连续布朗桥扩散的帧插值、
Diffusion Models专栏文章汇总:入门与实战 Event-based Video Frame Interpolation with Edge Guided Motion Refinement 视频帧插值,即在连续视频帧之间合成中间帧...
-
中国AIGC最值得关注企业&产品榜单揭晓!首份应用全景图谱发布
组委会 发自 凹非寺 量子位 | 公众号 QbitAI “你好,新应用!” 站在大模型落地元年,是时候喊出这句话了。 从软件APP、智能终端乃至具身智能等等,AIGC开始席卷一切。 大模型玩家、互联网巨头、终端厂商、垂直场景玩家纷纷入场,办公、创作...
-
企业版ChatGPT用户激增至60万;百度文心一言推出个性化声音定制功能
🦉 AI新闻 🚀 企业版ChatGPT用户激增至60万 摘要:OpenAI首席运营官Brad Lightcap在接受采访时透露,企业版ChatGPT的注册用户已超60万,相较2024年1月的15万用户,短短三个月内增长了300%。这一版本自2023...
-
清北爸爸辅导数学崩溃瞬间,这个国产大模型有解!AI启发问答关键情绪稳定
【新智元导读】辅导孩子写作业这件事,竟难倒了一众清北爸爸、海淀妈妈。不过,最近爆火的这个国产大模型,让无数家长疯狂冲进视频留言,直接把它评为国内家长最想要的AI! 前几天,微博热搜上的这个话题,可以说是让家长们哭笑不得。 既然补习老师不靠谱,那亲自上阵辅...
-
照片特定风格变换Stylar AI;GPT-4V开源替代方案InternVL;纯C/C++实现的Stable Diffusion库;基于AI的数据爬取
✨ 1: AI Photo Filter Stylar AI是一款功能强大的AI图像编辑与设计工具,提供无与伦比的图片组合和风格控制。 AI Photo Filter,简言之,就是使用人工智能技术来改善或改变图片的风格、质量和元素组合的一种...
-
快手版Sora「可灵」开放测试:生成超120s视频,更懂物理,复杂运动也能精准建模
什么?疯狂动物城被国产AI搬进现实了? 与视频一同曝光的,是一款名为「可灵」全新国产视频生成大模型。 它采用了Sora相似的技术路线,结合多项自研技术创新,生成的视频不仅运动幅度大且合理,还能模拟物理世界特性,具备强大的概念组合能力和想象力。 数据上看...
-
AIGC还是二刺猿会玩:捏娃社区爆火,有脑洞就能当同人大佬
衡宇 西风 发自 凹非寺量子位 | 公众号 QbitAI 原来现在的二刺猿都是这样玩的—— AIGC辅助下,0绘画基础也能轻松捏崽展开幻想,没有喜欢的角色粮,根本没在怕的! 青山刚昌28年没有让《名侦探柯南》新兰党如愿,这就速速安排...
-
拍照可测脱发等级 支付宝上线AI毛发自测工具
根据国家卫健委此前公布的数据,我国超过2.5亿人有脱发困扰,平均每6人中就有1人脱发,且近些年来,脱发群体呈年轻化趋势。为了帮助应对“秃”如其来的脱发问题,今日,支付宝发布“AI毛发自测”工具,用户只需上传几张头皮照片,即可通过AI大模型能力识别脱发类型、...
-
清华大学与智谱AI重磅开源 GLM-4:掀起自然语言处理新革命
自 2023 年 3 月 14 日开源 ChatGLM-6B 以来,GLM 系列模型受到了广泛的关注和认可。特别是在 ChatGLM3-6B 开源之后,开发者对智谱 AI 推出的第四代模型充满了期待。而这一期待,随着 GLM-4-9B 的发布,终于得到了...
-
智谱AI Open Day:升级清言App、发布GLM-4开源模型、新一代MaaS平台,大模型商业化迎来“下一站”
“描绘宏大未来愿景的同时让更多人切身体会到大模型的强大能力,让大模型技术从炫酷的天空当中真正落到地面上、落到实处,是每一个大模型公司必须思考的问题。”——智谱 AI CEO 张鹏 6月5日,智谱AI Open Day在UCCA Lab北京艺术空间举办。...
-
北京9岁小学生,已经用AI出书了!罗永浩围观:有事找不到我找AI
一个年仅9岁的男孩,利用AI智能体,竟然出版了一本书! 他叫许萌萌,是来自北京市第二实验小学的一名三年级学生。 萌萌与AI智能体共创的书叫做《AI少年——火星生存大挑战》,是一本科普小说,讲述了发生在火星上的“密室逃脱”的故事。 而他所选用的AI,正...
-
盘点GPT-4o十大创意玩法!挑水果、看牙片、全自动化炒股,看完格局瞬间打开
自从OpenAI发布GPT-4o以来,“头号AI玩家”每天的状态be like:新语音模式上线了吗? 是的,还没有,但应该快了。 不过,毕竟GPT-4o已经上线半个月多,虽然新语音模式迟迟未来,但这不影响网友们用它整活儿。本期,“头号AI玩家”全方位盘点...
-
扩散模型的技术原理和应用价值
引言 一、扩散模型的基本概念 扩散模型(Diffusion Models 是一种基于概率论的生成模型,最初源自物理学中的扩散过程理论,比如墨水在水中的扩散过程。在机器学习领域,这一概念被创造性地应用于数据生成任务,特别是图像和声音的合成。它们通过模拟一个...
-
生数科技完成数亿元 Pre-A 轮融资 加速布局多模态大模型
生数科技完成数亿元 Pre-A 轮融资,该轮融资由北京市人工智能产业投资基金、百度联合领投,中关村科学城公司等跟投,启明创投等数位老股东继续支持。此前,生数科技已经获得来自蚂蚁集团、BV百度风投、卓源亚洲、锦秋基金、达泰资本、智谱AI等机构的投资。 本轮融...
-
智谱AI宣布开源 GLM 第四代模型 GLM-4-9B
GLM 技术团队于2023年3月14日开源了 ChatGLM-6B,引起了广泛的关注和认可。随后又开源了 ChatGLM3-6B,开发者对 GLM 第四代模型的开源充满期待。经过近半年的探索工作,GLM 技术团队推出了第四代 GLM 系列开源模型:GLM-...
-
迈向『闭环』| PlanAgent:基于MLLM的自动驾驶闭环规划新SOTA!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 中科院自动化所深度强化学习团队联合理想汽车等提出了一种新的基于多模态大语言模型MLLM的自动驾驶闭环规划框架—PlanAgent。该方法以场景的鸟瞰图和基于图的文本提示为输入,利用多模态大语言模型的多...
-
马斯克的Grok已经可以在xAI网站上单独访问
马斯克开发的Grok现在已经可以在xAI网站上单独访问。这个工具在xAI平台上的功能比之前在推特上展示的版本更加丰富。特别值得一提的是它的分支树模式,这个模式允许用户观察多轮对话中可能产生的不同回答路径,这对于分析和理解对话流程非常有用。 如果你对使用Gr...
-
一文读懂如何基于 Ollama 在本地运行 LLM
为什么要使用 Ollama 开源项目 ? 在当今人工智能技术飞速发展的时代,大型语言模型(LLM 无疑已成为焦点炯炯的科技明星。自从ChatGPT的推出以来,其强大的自然语言理解和生成能力便惊艳了全球,成为人工智能商业化进程中的杰出代表。 然而,这一领域...
-
斯坦福回应抄袭清华系大模型:将撤下所有模型
近日,斯坦福大学AI研究团队的Llama3-V开源模型因抄袭指控被推上风口浪尖。该模型被指涉嫌抄袭清华系明星创业公司面壁智能开发的开源模型“小钢炮”MiniCPM-Llama3-V2.5,这一事件迅速在网络上引发广泛关注和热议。 事件的起因在于,斯坦福AI...
-
被作者删库的Llama 3-V原文再现!效果匹敌GPT4-V,训练费用暴降,区区不到500 美元,尺寸小100 倍,如何做到的
编译 | 言征 作者 | Aksh Garg 备注:发稿前作者已经删掉原文 出品 | 51CTO技术栈(微信号:blog51cto) 近日,一款Llama3V最近被“先红后黑”的出了圈。作为全球顶尖研究学府的团队,身陷“抄袭”中国大模型的泥潭后,火速删稿...
-
套壳丑闻让斯坦福AI Lab主任怒了!抄袭团队2人甩锅1人失踪、前科经历被扒,网友:重新认识中国开源模型
斯坦福团队抄袭清华系大模型事件后续来了—— Llama3-V团队承认抄袭,其中两位来自斯坦福的本科生还跟另一位作者切割了。 最新致歉推文,由Siddharth Sharma(悉达多)和Aksh Garg(阿克什)发出。 不在其中、来自南加利福尼亚大学的M...
-
斯坦福回应抄袭清华系大模型 公开道歉并删除推文
斯坦福大学的一个AI团队在 5 月 29 日发布了一个名为Llama3-V的多模态大模型,并宣称只需 500 美元就能训练出一个性能与GPT4-V相媲美的模型。然而,该模型随后被指控抄袭,与国内由面壁智能和清华大学自然语言处理实验室联合推出的大模型Mini...
-
一文读懂如何基于Ollama在本地运行LLM
“Mixtral有46.7B的总参数,但每个令牌只使用12.9B参数。因此,它以与12.9B型号相同的速度和成本处理输入并生成输出。” 为什么要使用 Ollama 开源项目 ? 在当今人工智能技术飞速发展的时代,大型语言模型(LLM 无疑已成为焦点炯炯...
-
AI日报:AMD向英伟达亮剑推出最强AI芯片;斯坦福AI团队承认抄袭国产大模型;suno将推“哼歌”功能;昆仑万维开源2千亿稀疏大模型天工MoE
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、挑战英伟达!AMD亮出旗下最强...
-
多模态模型学会打扑克:表现超越GPT-4v,全新强化学习框架是关键
只用强化学习来微调,无需人类反馈,就能让多模态大模型学会做决策! 这种方法得到的模型,已经学会了看图玩扑克、算“12点”等任务,表现甚至超越了GPT-4v。 图片 这是来自UC伯克利等高校最新提出的微调方法,研究阵容也是相当豪华: 图灵奖三巨头之一、M...
-
OpenAI衍生公司人工智能模型 让机器人像人一样思考、学习
OpenAI曾于2021年夏天宣布解散其机器人团队,原因是缺乏足够的数据来训练机器人使用人工智能进行移动和推理。但三位来自OpenAI的早期研究科学家创立的初创公司Covariant,声称已经解决了这一难题。 Covariant AI系统的特点: 结合...
-
具身智能的视觉-语言-动作模型:综述
本文经自动驾驶之心公众号授权转载,转载请联系出处。 24年5月论文“A Survey on Vision-Language-Action Models for Embodied AI”。 深度学习已在计算机视觉、自然语言处理和强化学习等许多领域取得了显著...
-
港科大最新!Vista:一种具有高保真度和多功能可控的世界模型
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:Vista: A Generalizable Driving World Model with High Fidelity and Versatile Controllability 论文链接...
-
【AIGC调研系列】MiniCPM-Llama3-V2.5模型与GPT-4V对比
MiniCPM-Llama3-V2.5模型与GPT-4V的对比可以从多个方面进行分析,包括性能、应用场景和技术特点。 从性能角度来看,MiniCPM-Llama3-V2.5在OCR识别、模型幻觉能力和空间理解能力方面表现出色,实现了开源模型的性能SOTA...
-
2024最新GPT4.0使用教程,AI绘画,一站式解决
一、前言 ChatGPT3.5、GPT4.0、GPT语音对话、Midjourney绘画,文档对话总结+DALL-E3文生图,相信对大家应该不感到陌生吧?简单来说,GPT-4技术比之前的GPT-3.5相对来说更加智能,会根据用户的要求生成多种内容甚至也可以...
-
【AIGC半月报】AIGC大模型启元:2024.05(下)
AIGC大模型启元:2024.05(下) (1 豆包大模型(抖音大模型) (2 Project Astra(谷歌对标GPT-4o) (3 Chameleon(meta对标GPT-4o) (4 MiniCPM-Llama3-V 2.5(面...