训练数据第9页 - AIGC资讯

字节携港大南大升级 LLaVA-NeXT：借 LLaMA-3 和 Qwen-1.5 脱胎换骨，轻松追平 GPT-4V

文 | 王启隆出品 | 《新程序员》编辑部 2023 年，威斯康星大学麦迪逊分校、微软研究院和哥伦比亚大学的研究人员共同开发的 LLaVA 首次亮相，彼时它被视为一个端到端训练的大型多模态模型，展现了在视觉与语言融合领域的潜力。今年...

生成式AI 2024-05-24 人工智能

1036阅读

AI大模型探索之路-训练篇25：ChatGLM3微调实战-基于LLaMA-Factory微调改造企业级知识库

系列篇章? AI大模型探索之路-训练篇1：大语言模型微调基础认知AI大模型探索之路-训练篇2：大语言模型预训练基础认知AI大模型探索之路-训练篇3：大语言模型全景解读AI大模型探索之路-训练篇4：大语言模型训练数据集概览AI大模型探索之路-训练篇5：大...

人工智能 2024-05-23 人工智能

1286阅读

简单通用：视觉基础网络最高3倍无损训练加速，清华EfficientTrain++入选TPAMI 2024

本文经计算机视觉研究院公众号授权转载，转载请联系出处。论文链接：https://arxiv.org/pdf/2405.08768 代码和预训练模型已开源：https://github.com/LeapLabTHU/EfficientTrain 会议...

生成式AI 2024-05-23 人工智能

590阅读

李彦宏出席VivaTech：中国AI与西方的最大区别在于应用

5月22日，在法国巴黎举办的“欧洲科技创新展览会”（Viva Technology）主论坛上，百度创始人、董事长兼首席执行官李彦宏与阳狮集团监事会主席莫里斯•列维（Maurice Levy）对谈时表示，中国AI与西方的最大区别在于应用，中国有数百个基础模型...

人工智能 2024-05-23 人工智能

561阅读

Meta首席科学家：大模型永远达不到人类智力

快科技5月23日消息，据媒体报道，Meta的首席人工智能科学家、深度学习领域的先驱杨立昆（Yann LeCun）近日对ChatGPT等生成式AI产品背后的大语言模型的能力提出了质疑。他表示，大模型永远无法实现像人类一样的推理和规划能力。杨立昆明确指出，...

人工智能 2024-05-23 人工智能

553阅读

Hinton万字访谈：用更大模型「预测下一个词」值得全力以赴

「这份访谈的每一秒都是精华。」最近，图灵奖得主 Geoffrey Hinton 的一个访谈视频得到了网友的高度评价。视频链接：https://www.youtube.com/watch?v=tP-4njhyGvo&t=660s 在访谈中，Hi...

生成式AI 2024-05-22 人工智能

741阅读

马斯克的xAI正努力实现Grok多模态化将支持上传照片获得文本回复

埃隆・马斯克的人工智能公司 xAI 正在努力为其 Grok 聊天机器人增加多模态输入功能。根据公开的开发者文件，埃隆·马斯克（Elon Musk）的人工智能公司xAI在向其Grok聊天机器人添加多模态输入方面取得了进展。这意味着，很快，用户就可以将照片上...

大数据 2024-05-22 人工智能

618阅读

微软发布Phi-3 Vision等最新大模型系列

微软发布了其最新的大型语言模型系列，Phi-3，包括Phi-3Vision、Phi-3Small7B和Phi-3Medium14B型号。这些模型在性能上与当前领先的大型模型相媲美，同时在特定领域提供了一些独特的优势。 Phi-3Medium14B 型号的...

AIGC 2024-05-22 人工智能

586阅读

拯救被「掰弯」的GPT-4！西交微软北大联合提出IN2训练治疗LLM「中间迷失」

【新智元导读】近日，西交微软北大联合提出信息密集型训练大法，使用纯数据驱动的方式，矫正LLM训练过程产生的偏见，在一定程度上治疗了大语言模型丢失中间信息的问题。辛辛苦苦给大语言模型输入了一大堆提示，它却只记住了开头和结尾? 这个现象叫做LLM的中间迷失（...

生成式AI 2024-05-22 人工智能

678阅读

Inflection AI揭示新团队和计划，将情感AI嵌入商业机器人

前不久，Inflection AI 的首席人工智能专家之一 Mustafa Suleyman 离职加入微软 AI 部门，这一消息在科技界引起了广泛的关注。然而，对于留在 Inflection AI 的命运，人们却没有过多讨论。Inflection AI 曾...

生成式AI 2024-05-21 人工智能

703阅读

拒绝AI生成代码！开源操作系统陆续举起“禁令”，Debian尚无行动

整理丨诺亚出品 | 51CTO技术栈（微信号：blog51cto）当下，AI的崛起已成大势。但是，当AI的触角伸向开源操作系统时，一些社区陆续亮起了“红灯”。先是Linux发行版Gentoo 在四月中旬发布了一项理事会政策，禁止使用AI工具生成...

生成式AI 2024-05-21 人工智能

650阅读

免费ai绘画网站高质量风格生成 100+中文AI绘画关键词汇总

什么是AI绘画？ AI绘画是一种利用人工智能技术进行艺术创作的方法。通过深度学习和计算机视觉技术，AI能够分析和模仿人类艺术家的风格，自动生成独特的艺术作品。这种技术不仅能够辅助艺术家创作，还能为非专业人士提供一个创作艺术的平台。 AI绘画的核心功能...

人工智能 2024-05-21 人工智能

679阅读

AI 框架Ambient Diffusion：从图像中获取灵感，而非复制

强大的人工智能模型有时会出现错误，包括虚构错误信息或将他人作品作为自己的。为了解决后者的问题，德克萨斯大学奥斯汀分校的研究团队开发了一种名为 "Ambient Diffusion" 的框架。该框架通过对无法辨认的图像数据进行训练，绕过了 AI 模型复制他人...

AIGC 2024-05-21 人工智能

665阅读

一文带您了解SHAP：机器学习的模型解释

在机器学习和数据科学领域，模型的可解释性一直是研究者和实践者关注的焦点。随着深度学习和集成方法等复杂模型的广泛应用，理解模型的决策过程变得尤为重要。可解释人工智能（Explainable AI ，XAI）通过提高模型的透明度，帮助建立对机器学习模型的信任...

生成式AI 2024-05-21 人工智能

1138阅读

蚂蚁多模态团队在视频多模态方向的技术探索

一、概述视频多模态检索在蚂蚁内部有着广泛的应用。视频多模态检索具体包括两个方向，一个是视频-文本的语义检索，另外一个是视频-视频的同源检索。视频-文本的语义检索方向旨在通过文本检索与其语义相近的视频，其检索文本未必在检索到的视频描述中直接出现，但检...

大数据 2024-05-21 人工智能

689阅读

Meta首发「变色龙」挑战GPT-4o，34B参数引领多模态革命！10万亿token训练刷新SOTA

GPT-4o的横空出世，再次创立了一个多模态模型发展的新范式！为什么这么说？ OpenAI将其称为「首个『原生』多模态」模型，意味着GPT-4o与以往所有的模型，都不尽相同。传统的多模态基础模型，通常为每种模态采用特定的「编码器」或「解码器」，将不...

大数据 2024-05-20 人工智能

679阅读

HuggingFace教你怎样做出SOTA视觉模型

前有OpenAI的GPT-4o，后有谷歌的系列王炸，先进的多模态大模型接连炸场。其他从业者在震撼之余，也再次开始思考怎么追赶这些超级模型了。刚好在这时，HuggingFace和法国索邦大学的一篇论文，总结出了构建视觉大模型的关键经验，给开发者指明了一...

生成式AI 2024-05-17 人工智能

713阅读

Ilya离职后第一个动作：点赞了这篇论文，网友抢着传看

自Ilya Sutskever官宣离职OpenAI后，他的下一步动作成了大家关注焦点。甚至有人密切关注着他的一举一动。这不，Ilya前脚刚刚点赞❤️了一篇新论文—— ——网友们后脚就抢着都看上了：论文来自MIT，作者提出了一个假说，用一句话总结...

AIGC 2024-05-17 人工智能

631阅读

70B模型秒出1000token，代码重写超越GPT-4o，来自OpenAI投资的代码神器Cursor团队

70B模型，秒出1000token，换算成字符接近4000！研究人员将Llama3进行了微调并引入加速算法，和原生版本相比，速度足足快出了快了13倍！不仅是快，在代码重写任务上的表现甚至超越了GPT-4o。这项成果，来自爆火的AI编程神器Curso...

人工智能 2024-05-17 人工智能

759阅读

OpenAI联合创始人：GPT-4性能在 “有限的数据量” 下面临挑战

OpenAI 的联合创始人 John Schulman 近在 Dwarkesh Patel 的播客节目中分享了他对 GPT-4性能的见解，并提到了由于有限的练数据而可能面临的挑战。Schulman 在2022年11月 ChatGPT 的推出中扮演了重要角色...

AIGC 2024-05-16 人工智能

618阅读

红帽用RHEL AI和OpenShift AI塑造开源AI的未来

发展至今，AI技术对工作方式、决策过程乃至商业模式的重塑已经逐渐具象化。红帽，作为开源解决方案的领军企业，在近日的在Red Hat Summit上，红帽展示了从RHEL AI的推出到InstructLab模型对齐工具的集成，再到OpenShift AI...

生成式AI 2024-05-16 人工智能

712阅读

使用开源GenAI时需要注意的十个问题

如今似乎任何人都可以制作AI模型。即使你没有训练数据或编程技巧，你也可以选择你喜欢的开源模型，对其进行调整，并以新的名字发布。根据斯坦福大学在4月发布的AI指数报告，2023年发布了149个基础模型，其中三分之二是开源的，而且有大量的变体。Huggi...

大数据 2024-05-16 人工智能

628阅读

微软发布 MatterSim 模型：模拟材料、预测性能，AI 探索材料设计的无限可能

5 月 15 日消息，微软研究院科学智能中心（Microsoft Research AI for Science）近日推出 MatterSim 模型，能够在广泛的元素、温度和压力范围内，准确高效地模拟材料和预测性能，助力材料设计的数字化转型。新材料探索...

生成式AI 2024-05-15 人工智能

573阅读

谷歌CEO：如果OpenAI在AI训练中滥用YouTube将采取行动

谷歌母公司 Alphabet 的 CEO Sundar Pichai 在接受 BC 采访时表示，如果谷歌发现由微软支持的 OpenAI 利用 YouTube 内容来训练能够生成视频的人工智模型，谷歌将采取行动来解决这个问题。这一表态是在 OpenAI 技...

大数据 2024-05-15 人工智能

664阅读

MIT最新！多模态LLM真的无所不能吗？大模型能解决一切难题吗？

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解本文对自动驾驶领域内多模态大型语言模型（MLLMs）的应用进行了审慎的审视，并对一些常见的假设提出了质疑/验证，重点关注它们通过闭环控制环境中的图像/帧序列推理和解释...

生成式AI 2024-05-15 人工智能

605阅读

为什么腾讯认为DiT架构是未来的主流？做了哪些改进？

OpenAI迭代ChatGPT的过程，发现随着参数量的提升，基于Transformer 架构的大语言模型出现了涌现现象。因此，在文生图领域，很可能参数量更大的模型，也会更“聪明”。而此前文生图领域大火的Unet 模型容易陷入性能瓶颈与可扩展性的问题，且...

生成式AI 2024-05-15 人工智能

753阅读

西浦、利物浦大学提出：点云数据增强首个全面综述

本论文的第一作者朱钦峰是西交利物浦大学和利物浦大学联合培养的一年级在读博士，其导师为范磊副教授。他的主要研究方向为语义分割、多模态信息融合、3D视觉、高光谱图像和数据增强。本文是对发表于模式识别领域顶刊Pattern Recognition 2024的...

生成式AI 2024-05-14 人工智能

731阅读

被追问Sora是否使用YouTube数据，OpenAI高管又语塞了

OpenAI 的另一位高管在被问及 Sora 视频生成器是否使用了 YouTube 数据时，同样陷入了困境。在最近举行的 Bloomberg 科技峰会上，OpenAI 席运营官 Brad Lightcap 在回答记者 Shirin Ghaffary 的问题...

人工智能 2024-05-14 人工智能

596阅读

思维链不存在了？纽约大学最新研究：推理步骤可省略

红极一时的思维链技术，可能要被推翻了！还在惊讶于大模型居然能够利用思维链分步骤思考？还在苦于不会写思维链提示词？来自纽约大学的研究人员表示：「没关系的，都一样」，推理步骤不重要，不想写提示词也可以不写，用省略号代替就行了。论文地址：https...

人工智能 2024-05-14 人工智能

628阅读

OPPO 下一代大数据 AI 一体架构实践

一、技术架构 OPPO 大数据场景丰富，拥有海外的 AWS 功能云，国内自建机房，机器规模超过万台，在印度则是使用混合云模式。首先来介绍一下 AWS 上功能云 EMR 的实践。 1. 云原生计算架构 OPPO 早期全部采用 EMR，其存在以下一些问题...

大数据 2024-05-14 人工智能

632阅读

网友缝合Llama3 120B竟意外能打，轻松击败GPT2-chatbot和GPT-4

Llama 3首发阵容里没有的120B型号竟意外“曝光”，而且十分能打？！最近这样一个号称是「Llama3-120b」的神秘大模型火了起来，原因在于它表现太出色了—— 轻松击败GPT-4、gpt2-chatbot那种。比如，面对像「观察希格斯场是否会...

大数据 2024-05-13 人工智能

641阅读

美国教授用2岁女儿训AI模型登Science！人类幼崽头戴相机训练全新AI

【新智元导读】为训练AI模型，纽约州立大学的一名教授Brenden Lake，竟让自己不到2岁女儿头戴相机收集数据!要知道，Meta训Llama3直接用了15万亿个token，如果Lake真能让AI模型学习人类幼崽，从有限的输入中学习，那LLM的全球数据荒...

AIGC 2024-05-13 人工智能

623阅读

Fine-Tuning Vs RAG ，该如何选择？

Hello folks，我是 Luga，今天我们来聊一下人工智能(AI 生态领域相关的技术 - LLM 构建块：向量、令牌和嵌入。随着技术的不断进步，LLM 带来了前所未有的机遇，吸引了开发者和组织纷纷尝试利用其强大的能力构建应用程序。然而，当预训...

人工智能 2024-05-13 人工智能

1112阅读

大神Karpathy强推，分词领域必读：自动钓鱼让大模型“发疯”的token，来自Transformer作者创业公司

关于大模型分词（tokenization），大神Karpathy刚刚推荐了一篇必读新论文。主题是：自动检测大模型中那些会导致“故障”的token。图片简单来说，由于大模型tokenizer的创建和模型训练是分开的，可能导致某些token在训练中很少...

人工智能 2024-05-13 人工智能

617阅读

企业如何管理生成式人工智能安全风险

事实表明，尽管有很多好处，但生成式人工智能也给企业带来了许多安全挑战，而且可能代价高昂。而企业需要审查可能的威胁和最佳实践以降低风险。在ChatGPT推出之后，生成式人工智能模型的迅速采用有望从根本上改变企业开展业务以及与客户和供应商互动的方式。生...

生成式AI 2024-05-10 人工智能

654阅读

原作者带队，LSTM真杀回来了！

20 世纪 90 年代，长短时记忆（LSTM）方法引入了恒定误差选择轮盘和门控的核心思想。三十多年来，LSTM 经受住了时间的考验，并为众多深度学习的成功案例做出了贡献。然而，以可并行自注意力为核心 Transformer 横空出世之后，LSTM 自身所...

大数据 2024-05-10 人工智能

615阅读

所有生命分子一夜皆可AI预测！AlphaFold 3改变人类对生命的理解，全球科学家都能免费使用

AlphaFold 3再登Nature！这次重磅升级，不再仅限于蛋白质结构预测——可以以前所未有的精度预测所有生命分子的结构和相互作用。只有了解它们如何在数百万种组合中相互作用，我们才能开始真正理解生命的过程。这次的最大创新之一，是用上了AI绘画...

AIGC 2024-05-09 人工智能

686阅读

大厂AI人，奔向香港

“现在在香港，遍地都是AI创业的前大厂人，百万融资不难拿到。” 30岁的大厂P7黄全，刚刚搬离西二旗的工位，就在2024年1月前往香港尝试AI创业，这是他寻找出路的首选。香港对科创类项目的鼎力支持，让他迎来了惊喜的开局。两大科创集群——香港科技园和香港数...

生成式AI 2024-05-09 人工智能

741阅读

时间序列概率预测的共形预测

前面我们介绍了用于时间序列概率预测的分位数回归，今天继续学习基于概率预测的时间序列概率预测方法--共形预测。现实世界中的应用和规划往往需要概率预测，而不是简单的点估计值。概率预测也称为预测区间或预测不确定性，能够提供决策者对未来的不确定性状况有更好的认...

生成式AI 2024-05-09 人工智能

709阅读

理论+实践，带你了解分布式训练

本文分享自华为云社区《大模型LLM之分布式训练》，作者：码上开花_Lancer。随着语言模型参数量和所需训练数据量的急速增长，单个机器上有限的资源已无法满足大语言模型训练的要求。需要设计分布式训练（Distributed Training）系统来解决...

AIGC 2024-05-09 人工智能

790阅读

LidaRF：研究用于街景神经辐射场的激光雷达数据（CVPR'24）

本文经自动驾驶之心公众号授权转载，转载请联系出处。光真实感模拟在自动驾驶等应用中发挥着关键作用，其中神经辐射场（NeRFs）的进步可能通过自动创建数字3D资产来实现更好的可扩展性。然而，由于街道上相机运动的高度共线性和在高速下的稀疏采样，街景的重建质...

人工智能 2024-05-09 人工智能

648阅读

港大开源图基础大模型OpenGraph: 强泛化能力，前向传播预测全新数据

图学习领域的数据饥荒问题，又有能缓解的新花活了！ OpenGraph，一个基于图的基础模型，专门用于在多种图数据集上进行零样本预测。背后是港大数据智能实验室的主任Chao Huang团队，他们还针对图模型提出了提示调整技术，以提高模型对新任务的适应性。...

生成式AI 2024-05-09 人工智能

629阅读

探索生成式人工智能的版权清算问题

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 法院正在探讨并决定生成式人工智能是否侵犯版权。本文中，让我们来谈谈这到底意味着什么。美国的版权法是一件复杂的事情。我们这些不是律师的...

大数据 2024-05-09 人工智能

651阅读

据报道，微软正在开发拥有5000亿个参数的MAI-1人工智能模型

据The Information近日报道，微软公司正在开发一个拥有约5000亿个参数的大型语言模型。据悉，这个在微软内部被称为MAI-1的大型语言模型预计最早将于本月亮相。 OpenAI在2020年中期推出 GPT-3 时，详细说明了该模型的初始版...

大数据 2024-05-08 人工智能

575阅读

使用LLMLingua-2压缩GPT-4和Claude提示

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 缩短发送给大型语言模型(LLM 的提示的长度可以减少推理时间并降低成本。这是提示压缩成为LLM研究的一个热门领域的原因。清华大学和微...

人工智能 2024-05-08 人工智能

724阅读

LeCun转发，AI让失语者重新说话！纽约大学发布全新「神经-语音」解码器

脑机接口（BCI）在科研和应用领域的进展在近期屡屡获得广泛的关注，大家通常都对脑机接口的应用前景有着广泛的畅享。比如，由于神经系统的缺陷造成的失语症不仅严重阻碍患者的日常生活，还可能限制他们的职业发展和社交活动。随着深度学习和脑机接口技术的迅猛发展，...

人工智能 2024-05-07 人工智能

640阅读

AI正在左右TikTok与Instagram观点？区块链或可解决问题

强大且易于使用的生成式AI正在快速崛起，并开始撼动社交媒体的基本格局。新的AI工具乃至AI影响者正在塑造我们通过TikTok及Instagram等平台开展交互的方式。这种影响不仅体现在内容的生成与传播方面，更对人类创作者构成了严峻的生存威胁。至于解决之...

AIGC 2024-05-07 人工智能

599阅读

挑战OpenAI，微软自研5000亿参数绝密武器曝光！前谷歌DeepMind高管带队

不需要OpenAI，微软或许也会成为AI领头羊！外媒Information爆料称，微软内部正在开发自家首款5000亿参数的大模型MAl-1。这恰好是，纳德拉带领团队证明自己的时候到了。在向OpenAI投资100多亿美元之后，微软才获得了GPT-3...

生成式AI 2024-05-07 人工智能

588阅读

手机可跑，3.8B参数量超越GPT-3.5！微软发布Phi-3技术报告：秘密武器是洗干净数据

过去几年，借助Scaling Laws的魔力，预训练的数据集不断增大，使得大模型的参数量也可以越做越大，从五年前的数十亿参数已经成长到今天的万亿级，在各个自然语言处理任务上的性能也越来越好。但Scaling Laws的魔法只能施加在「固定」的数据源上，...

AIGC 2024-05-07 人工智能

603阅读

报道称微软准备推新AI模型，内部代号MAI-1、约5000亿参数

据外媒the Information报道，微软正准备推出一种新的、内部 AI 语言模型。新模型内部代号为 MAI-1，由最近加入微软的梅斯塔法・苏莱曼负责，他是谷歌 DeepMind 的联合创始人，也是人工智能初创公司 Inflection 的前 CEO...

大数据 2024-05-07 人工智能

628阅读