多模态第8页 - AIGC资讯

套壳丑闻让斯坦福AI Lab主任怒了！抄袭团队2人甩锅1人失踪、前科经历被扒，网友：重新认识中国开源模型

斯坦福团队抄袭清华系大模型事件后续来了—— Llama3-V团队承认抄袭，其中两位来自斯坦福的本科生还跟另一位作者切割了。最新致歉推文，由Siddharth Sharma（悉达多）和Aksh Garg（阿克什）发出。不在其中、来自南加利福尼亚大学的M...

大数据 2024-06-04 人工智能

827阅读

斯坦福回应抄袭清华系大模型公开道歉并删除推文

斯坦福大学的一个AI团队在 5 月 29 日发布了一个名为Llama3-V的多模态大模型，并宣称只需 500 美元就能训练出一个性能与GPT4-V相媲美的模型。然而，该模型随后被指控抄袭，与国内由面壁智能和清华大学自然语言处理实验室联合推出的大模型Mini...

人工智能 2024-06-04 人工智能

789阅读

一文读懂如何基于Ollama在本地运行LLM

“Mixtral有46.7B的总参数，但每个令牌只使用12.9B参数。因此，它以与12.9B型号相同的速度和成本处理输入并生成输出。” 为什么要使用 Ollama 开源项目 ? 在当今人工智能技术飞速发展的时代，大型语言模型(LLM 无疑已成为焦点炯炯...

AIGC 2024-06-04 人工智能

1585阅读

AI日报：AMD向英伟达亮剑推出最强AI芯片；斯坦福AI团队承认抄袭国产大模型；suno将推“哼歌”功能；昆仑万维开源2千亿稀疏大模型天工MoE

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、挑战英伟达！AMD亮出旗下最强...

生成式AI 2024-06-04 人工智能

888阅读

多模态模型学会打扑克：表现超越GPT-4v，全新强化学习框架是关键

只用强化学习来微调，无需人类反馈，就能让多模态大模型学会做决策！这种方法得到的模型，已经学会了看图玩扑克、算“12点”等任务，表现甚至超越了GPT-4v。图片这是来自UC伯克利等高校最新提出的微调方法，研究阵容也是相当豪华：图灵奖三巨头之一、M...

生成式AI 2024-06-04 人工智能

829阅读

OpenAI衍生公司人工智能模型让机器人像人一样思考、学习

OpenAI曾于2021年夏天宣布解散其机器人团队，原因是缺乏足够的数据来训练机器人使用人工智能进行移动和推理。但三位来自OpenAI的早期研究科学家创立的初创公司Covariant，声称已经解决了这一难题。 Covariant AI系统的特点: 结合...

生成式AI 2024-06-04 人工智能

894阅读

具身智能的视觉-语言-动作模型：综述

本文经自动驾驶之心公众号授权转载，转载请联系出处。 24年5月论文“A Survey on Vision-Language-Action Models for Embodied AI”。深度学习已在计算机视觉、自然语言处理和强化学习等许多领域取得了显著...

人工智能 2024-06-04 人工智能

1508阅读

港科大最新！Vista：一种具有高保真度和多功能可控的世界模型

本文经自动驾驶之心公众号授权转载，转载请联系出处。原标题：Vista: A Generalizable Driving World Model with High Fidelity and Versatile Controllability 论文链接...

人工智能 2024-06-04 人工智能

1059阅读

【AIGC调研系列】MiniCPM-Llama3-V2.5模型与GPT-4V对比

MiniCPM-Llama3-V2.5模型与GPT-4V的对比可以从多个方面进行分析，包括性能、应用场景和技术特点。从性能角度来看，MiniCPM-Llama3-V2.5在OCR识别、模型幻觉能力和空间理解能力方面表现出色，实现了开源模型的性能SOTA...

大数据 2024-06-04 人工智能

1370阅读

2024最新GPT4.0使用教程，AI绘画，一站式解决

一、前言 ChatGPT3.5、GPT4.0、GPT语音对话、Midjourney绘画，文档对话总结+DALL-E3文生图，相信对大家应该不感到陌生吧？简单来说，GPT-4技术比之前的GPT-3.5相对来说更加智能，会根据用户的要求生成多种内容甚至也可以...

生成式AI 2024-06-04 人工智能

1531阅读

【AIGC半月报】AIGC大模型启元：2024.05（下）

AIGC大模型启元：2024.05（下） (1 豆包大模型（抖音大模型） (2 Project Astra（谷歌对标GPT-4o） (3 Chameleon（meta对标GPT-4o） (4 MiniCPM-Llama3-V 2.5（面...

人工智能 2024-06-04 人工智能

1001阅读

不想炸薯条的Ilya和不送GPU的英伟达，Hinton最新专访：道路千万条，安全第一条

从谷歌离职一年之际，「人工智能教父」Hinton接受了采访。 ——也许是因为徒弟Ilya终于被从核设施中放了出来？（狗头）视频地址：https://www.youtube.com/watch?v=tP-4njhyGvo 当然了，采访教父的小伙子也非等...

大数据 2024-06-03 人工智能

792阅读

一模一样！斯坦福AI团队被曝抄袭中国国产大模型：直接删库跑路

快科技6月3日消息，近日，斯坦福AI团队被曝出了抄袭事件，而且抄袭的还是中国国产的大模型成果，模型结构和代码，几乎一模一样。斯坦福的Llama3-V项目在5月29日发布，宣称仅需500美元就能训练出一个性能超越GPT-4V、Gemini Ultra、Cl...

大数据 2024-06-03 人工智能

809阅读

斯坦福爆火Llama3-V竟抄袭国内开源项目，作者火速删库

在 GPT-4o 出世后，Llama3 的风头被狠狠盖过。GPT-4o 在图像识别、语音理解上卓越的性能展现了它强大多模态能力。开源领域的领头羊 Llama3 曾在几乎所有基准测试中都超越了 GPT-3.5，甚至在某些方面超越了 GPT-4。这次就要闷声...

AIGC 2024-06-03 人工智能

847阅读

麦肯锡调查显示：生成式AI应用大中华区增长最快

据全球顶级咨询公司麦肯锡（McKinsey & Company）发布的最新调查报告《he state of AI in early2024:Gen AI adoption spikes and starts to generate value》，显...

生成式AI 2024-06-03 人工智能

854阅读

多模态大模型不够灵活，谷歌DeepMind创新架构Zipper：分开训练再「压缩」

最近的一系列研究表明，纯解码器生成模型可以通过训练利用下一个 token 预测生成有用的表征，从而成功地生成多种模态（如音频、图像或状态 - 动作序列）的新序列，从文本、蛋白质、音频到图像，甚至是状态序列。能够同时生成多种模态输出的多模态模型一般是通过某...

生成式AI 2024-06-03 人工智能

845阅读

【AIGC调研系列】LLaVA++整合Phi-3和Llama-3能够实现什么

LLaVA++能够为Phi-3和Llama-3带来的主要好处包括：视觉处理能力的增强：通过整合Phi-3和Llama-3模型，创建了具备视觉处理能力的Phi-3-V和Llama-3-V版本，这意味着这些模型现在能够理解和生成与图像相关的内容[1]。...

生成式AI 2024-06-03 人工智能

1125阅读

【AIGC调研系列】通义千问、文心一言、抖音云雀、智谱清言、讯飞星火的特点分析

通义千问、文心一言、抖音云雀、智谱清言、讯飞星火这五款AI大模型各有特色，它们在市场上的定位和竞争策略也有所不同。通义千问：由阿里巴巴推出，被认为是最接近ChatGPT水平的国产AI模型[7]。它不仅提供了长文档处理功能，还能够进行市场调研、竞品分...

AIGC 2024-06-01 人工智能

1867阅读

谷歌DeepMind：GPT-4高阶心智理论彻底击败人类！第6阶推理讽刺暗示全懂了

【新智元导读】刚刚，谷歌DeepMind、JHU、牛津等发布研究，证实GPT-4的心智理论已经完全达到成年人类水平，在更复杂的第6阶推理上，更是大幅超越人类!此前已经证实，GPT-4比人类更能理解语言中的讽刺和暗示。在心智理论上，人类是彻底被LLM甩在后面...

人工智能 2024-06-01 人工智能

788阅读

OpenAI正式重启机器人团队！之前曾一度被放弃

快科技5月31日消息，据媒体报道，OpenAI将重启其机器人团队。这一团队在2020年因多种原因被解散，但随着对人工智能机器人的投资升温，OpenAI决定再次进军机器人领域。据知情人士透露，OpenAI目前正在积极招募研究工程师，以重建曾经解散的机器人...

AIGC 2024-05-31 人工智能

752阅读

助力全球人工智能伦理建设马上消费AI防伪大模型成功入选联合国ITU AI for Good 全球案例集

随着Chat GPT等生成式人工智能技术快速发展，如何更加高效地使用以及监管AI应用，已成为全球科技界关注的核心议题之一。近日，联合国旗下国际电信联盟（ITU）在瑞士日内瓦召开2024人工智能向善全球峰会AI for Good，公布全球TOP40案例...

大数据 2024-05-31 人工智能

933阅读

Stable Diffusion 3.0技术论文解读

前几周 AI绘画领域扔出了一颗重磅炸弹那就是Stability AI发布了备受期待的Stable Diffusion 3.0 简称SD3 一周后官方放出了一篇详尽的技术论文阐述了SD3实现突破性进展的底层原理但是同时也引发了一连串疑问...

生成式AI 2024-05-31 人工智能

958阅读

这家产品AI用户过亿，月活第一，覆盖学习办公和家庭教育，还有人偷偷用来赚钱

谁是AI产品风口浪尖最当红的焦点? 不是有些盆友猜测的聊天Bot——在最新的AI产品榜上，百度文库才是高居榜首的那一位。显眼的排名背后，是超1.4亿的AI用户数，以及超15亿的AI新功能使用次数。 AI能用它帮大忙的场景，遍布学习办公、家庭教育和兼职赚...

人工智能 2024-05-31 人工智能

816阅读

【AIGC调研系列】llama 3与GPT4相比的优劣点

Llama 3与GPT-4相比，各有其优劣点。以下是基于我搜索到的资料的详细分析： Llama 3的优点：更大的数据集和参数规模：Llama 3基于超过15T token的训练，这相当于Llama 2数据集的7倍还多[1][3]。此外，它拥有40...

AIGC 2024-05-31 人工智能

1205阅读

筑基砥柱：EcomXL-万相实验室AIGC电商基础模型

✍? 本文作者：顾知、岁星、天扉、佳玏、允行一、背景随着生成式技术浪潮的兴起，Stable Diffusion结合Controlnet等控制能力在电商场景得到了广泛的应用，其中制作一张优秀的商品主图（亦或是广告的创意图，以下简称商品...

大数据 2024-05-30 人工智能

952阅读

百度发布AI原生应用“橙篇”APP 支持超长内容理解生成

5月30日，百度在2024移动生态万象大会上正式推出了AI原生应用——“橙篇”。 “橙篇”不仅让用户能够轻松应对超大、多格式、长内容的文件挑战，进行深度理解、精准总结和即时问答，更以其超长篇幅的长文生成、深度编辑和多模态自由创作能力，极大地丰富了用户的内容...

大数据 2024-05-30 人工智能

830阅读

降低AIGC检测的策略与方法

随着人工智能技术的飞速发展，AIGC（Artificial Intelligence Generated Content，人工智能生成内容）已经广泛应用于各个领域。然而，随之而来的是AIGC检测技术的挑战。如何降低AIGC检测成为了一个备受关注的研究课题。...

大数据 2024-05-30 人工智能

1174阅读

【AIGC调研系列】GPT-4O比GPT-4强在哪

GPT-4O与GPT-4在多个方面有所不同，主要体现在性能、响应速度、成本效益以及多模态处理能力上。性能提升：GPT-4O在文本分析、推理和编程能力上相较于GPT-4有显著提升。特别是在视觉和音频理解能力上，GPT-4O表现出更优越的性能[3][8...

生成式AI 2024-05-30 人工智能

1103阅读

OpenAI与普华永道合作，为10万员工提供ChatGPT

5月30日，全球四大会计事务所之一的普华永道（PwC）在官网宣布，与OpenAI达成技术、市场双向合作，成为其最大客户和首家产品经销商。根据协议，普华永道将向其美国75，000名和英国的26，000名员工提供ChatGPT Enterprise（企业版）...

生成式AI 2024-05-30 人工智能

959阅读

用GPT-3.5生成数据集！北大天工等团队图像编辑新SOTA，可精准模拟物理世界场景

高质量图像编辑的方法有很多，但都很难准确表达出真实的物理世界。那么，Edit the World试试。图片来自北京大学、Tiamat AI、天工AI、Mila实验室提出了EditWorld，他们引入了一种新的编辑任务，即世界指令（world-ins...

大数据 2024-05-30 人工智能

830阅读

微软、亚马逊、IBM 承诺公布 AI 模型的安全措施

在首尔举行的 AI 安全峰会上，微软、亚马逊和 IBM 等领先科技公司承诺在开发基础模型时公布他们所采取的安全措施。这些公司都同意，如果无法控制或减轻 AI 模型所带来的风险，将不会开发或部署该模型。图源备注：图片由AI生成，图片授权服务商Midjou...

人工智能 2024-05-29 人工智能

950阅读

Meta AI的首席执行官LeCun：不要从事LLM工作

出品 | 51CTO技术栈（微信号：blog51cto）在巴黎举行的初创企业年度技术大会VivaTech上，Meta AI的首席执行官Yann LeCun建议希望在AI生态系统中工作的学生不要从事LLM（大型语言模型）方面的工作。 “如果你是对构建下一...

AIGC 2024-05-29 人工智能

851阅读

AI日报｜微软推出Copilot+PC，通义主模型大幅降价，文心两大模型全面免费...

文章推荐 AI晚报｜GPT-4o最新语音交互模式即将上线，微软Build 2024开发者大会即将开幕... AI Agent深度解析：潜力与挑战并存的智能新世界 GPT-4o重磅发布，第一时间用户测评，OpenAI也存在夸张宣传？微软让Windo...

大数据 2024-05-29 人工智能

863阅读

AI编码，真需求还是噱头？

嘉宾 | 徐晓强采访 | 张晓楠撰稿 | 李美涵出品 | 51CTO技术栈（微信号：blog51cto）自从生成式AI大火以后，AI好像“杠上了”程序员这个角色。几乎每隔一段时间，关于AI编程工具是否能取代程序员的话题就会被再次讨论。 AI编程...

大数据 2024-05-28 人工智能

838阅读

最猛AI独角兽：一年估值1700亿，再造一个OpenAI！马斯克LeCun却吵起来了

马斯克搞大模型又融到60亿美元（约435亿元）！这是xAI最大的一轮融资，目前估值已来到240亿美元（约1738亿元），一举超过Anthropic，成为OpenAI之下第二位。借着这个势头，老马也亲自下场发起招聘广告：如果你相信我们理解宇宙的使命，...

人工智能 2024-05-28 人工智能

794阅读

百度文心大模型学习机“小度学习机Z30”发布

近日，百度旗下的小度科技正式推出了首款基于文心大模型的学习机Z30，已在京东平台全面开售。这款学习机以“重新定义AI老师”为核心理念，旨在通过先进的AI技术助力孩子主动学习，同时让家长享受全陪伴的超省心体验。其8GB RAM +256GB存储空间的版本售价...

大数据 2024-05-28 人工智能

837阅读

【AIGC调研系列】CogVLM2:第二代视觉大模型

CogVLM2是智谱AI推出的新一代多模态大模型，继承并优化了上一代模型的经典架构。CogVLM2采用了一个拥有50亿参数的强大视觉编码器，并创新性地在大语言模型中整合了一个70亿参数的视觉专家模块[1]。这一设计使得CogVLM2在视觉和语言理解方面实现...

人工智能 2024-05-28 人工智能

1670阅读

百度文心一言用户破 2 亿，李彦宏：文心大模型已成中国最领先的 AI 基础模型

过去，开发者用代码来改变世界，未来，自然语言将成为通用的编程语言。用代码书写历史的程序员会被 AI 取代吗？一个全知全能的大模型能适配一切吗？大模型成本过高怎么办？在这个 AI 时代，什么样的工具才能被称为最好用的工具？这些问题，并非空中楼阁，而是...

AIGC 2024-05-28 人工智能

894阅读

众神听令，王者归位！Meta最强开源大模型 Llama 3 重磅来袭

整理 | 王轶群责编 | 唐小引出品丨AI 科技大本营（ID：rgznai100） 4月19日凌晨，Meta重磅发布了全球最大开源大模型Llama 3，一夜间重新坐稳王者之位。模型下载链接：https://llama.meta.com/lla...

AIGC 2024-05-28 人工智能

882阅读

马斯克xAI官宣435亿元B轮融资：估值已突破1300亿！

快科技5月27日消息，埃隆马斯克旗下的人工智能初创企业xAI近日宣布，已经成功完成60亿美元（约合435亿元人民币）的B轮融资，公司估值达到180亿美元（约合1304亿元人民币）。本轮融资的主要投资者包括Valor Equity Partners、Vy...

人工智能 2024-05-27 人工智能

815阅读

港大字节提出多模态大模型新范式，模拟人类先感知后认知，精确定位图中物体

当前，多模态大模型（MLLM）在多项视觉任务上展现出了强大的认知理解能力。然而大部分多模态大模型局限于单向的图像理解，难以将理解的内容映射回图像上。比如，模型能轻易说出图中有哪些物体，但无法将物体在图中准确标识出来。定位能力的缺失直接限制了多模态...

AIGC 2024-05-27 人工智能

853阅读

模块化重构LLaVA，替换组件只需添加1-2个文件，开源TinyLLaVA Factory来了

TinyLLaVA 项目由清华大学电子系多媒体信号与智能信息处理实验室 (MSIIP 吴及教授团队和北京航空航天大学人工智能学院黄雷老师团队联袂打造。清华大学 MSIIP 实验室长期致力于智慧医疗、自然语言处理与知识发现、多模态等研究领域。北航团队长期...

人工智能 2024-05-27 人工智能

985阅读

换了30多种方言，我们竟然没能考倒中国电信的语音大模型

不管你来自哪个城市，相信在你的记忆中，都有自己的「家乡话」:吴语柔软细腻、关中方言质朴厚重、四川方言幽默诙谐、粤语古雅潇洒…… 某种意义上说，方言不只是一种语言习惯，也是一种情感连接、一种文化认同。我们「上网冲浪」遇到的新鲜词汇中，有不少就是来自各地方言。...

人工智能 2024-05-27 人工智能

930阅读

目标检测新SOTA，端侧实时识别，沈向洋罕见转发点赞

目标检测领域，迎来了新进展—— Grounding DINO 1.5，IDEA研究院团队出品，在端侧就可实现实时识别。这一进展获得AI大佬沈向洋转发，他一般都是一年一转的节奏。此次发布主要有两个版本：Pro和Edge。Pro版更强，Edge版更快。...

AIGC 2024-05-27 人工智能

843阅读

“巡云轻论坛爬虫”技术探秘：高效数据抓取与智能分析

随着互联网的飞速发展，论坛作为网民交流和信息共享的重要平台，承载了海量的数据资源。如何从这些论坛中高效抓取并分析数据，成为了许多研究者和开发者关注的焦点。本文将围绕“巡云轻论坛爬虫”展开探讨，介绍其技术原理、应用场景以及未来发展趋势。一、巡云轻论坛爬虫技术...

大数据 2024-05-26 大数据

901阅读

AIGC的崛起：定义未来内容创作的新纪元

?文章目录 ?AIGC简介 ? AIGC的相关技术与特点 ?AIGC有哪些应用场景？ ?AIGC对其他行业影响 ?面临的挑战与问题 ?AIGC未来发展 ?AIGC十大热门网站推荐：文心一言：https://aigc.izzi.c...

生成式AI 2024-05-25 人工智能

841阅读

长文干货！老程序员测评文心一言4.0模型代码能力！

目录前言：老程序员聊聊AI和国产大模型第一关：代码质量和可用性——写个可运行的游戏代码第二关：需求理解和记忆能力——多轮对话下的任务能力总结前言：老程序员聊聊AI和国产大模型大家好，我是一名老程序员了，大模型出来后我算是一...

大数据 2024-05-24 人工智能

1003阅读

惊掉下巴：GPT-4o现场爆改代码看图导航！OpenAI曝光LLM路线图，GPT Next年底发

这几天，在巴黎举办的最大科技活动VivaTech上，OpenAI再次带来了许多惊喜。从展示的模型智能进化路线图中，可以确定的是，今年OpenAI一定会发布新一代旗舰模型。而且，大概率不会以GPT-5命名，演示中将其称之为「GPT Next」。那么...

生成式AI 2024-05-24 人工智能

903阅读

马斯克预测AI世界：人类无需再为生计奔波工作将变成爱好

快科技5月24日消息，近日，埃隆马斯克在巴黎的欧洲科技创新展览会上分享了他对未来人工智能世界的预测。他认为，随着AI技术的快速发展，未来社会将能够按需提供所有商品和服务。在这样的环境下，人们将不再为了生计而工作，而是根据个人兴趣和爱好选择职业，更多地去...

AIGC 2024-05-24 人工智能

746阅读

AIGC实战——多模态模型DALL.E 2

AIGC实战——多模态模型DALL.E 2 0. 前言 1. 模型架构 2. 文本编码器 3. CLIP 4. 先验模型 4.1 自回归先验模型 4.2 扩散先验模型...

人工智能 2024-05-24 人工智能

785阅读