上下文第11页 - AIGC资讯

Agents需要一个代码解释器

作者 | Vasek Mlejnsky 编译 | 言征出品 | 51CTO技术栈（微信号：blog51cto）构建人工智能代理很难。你将与幻觉作斗争，让agents智商不掉线，并引导他们使用正确的工具。不过，方法也不难，其中一种就是赋予代理代码执行...

AIGC 2024-05-15 人工智能

847阅读

谷歌推出新的 AI 模型 LearnLM，专注于教育领域

谷歌发布了它的新 AI 模型 LearnLM 将帮助学生解决作业问题。 LearnLM 是基于谷歌大型语言模型 Gemini 的一系列 AI 模型，旨在成为各个学科的专家，以不同的方式找到展示例子（如照片或视频），在学习过程中辅导学生，并激发学习的兴趣。谷...

生成式AI 2024-05-15 人工智能

817阅读

谷歌 I/O开发者大会汇总：AI模型全面更新几乎覆盖所有生成模型类型

在昨晚的Google I/O发布会上，Google宣布了一系列AI模型的更新，涵盖了从文本到视觉和音乐的多个领域: Gemini1.5Pro:支持200万上下文，针对翻译、编码、推理等关键用例进行了质量改进，但未发布测试结果。 Gemini Flash:针...

AIGC 2024-05-15 人工智能

841阅读

谷歌反击：Project Astra正面硬刚GPT-4o、Veo对抗Sora、新版Gemini变革搜索

通用的 AI，能够真正日常用的 AI，不做成这样现在都不好意思开发布会了。 5 月 15 日凌晨，一年一度的「科技界春晚」Google I/O 开发者大会正式开幕。长达 110 分钟的主 Keynote 提到了几次人工智能？谷歌自己统计了一下：是的，...

AIGC 2024-05-15 人工智能

791阅读

Llama-3的竞争对手来了——可运行在iPhone上的小体量高性能LLM模型Phi-3

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 简介熟悉我的文章的读者可能还记得我以前报道《课本就是你所需要的一切》(https://medium.com/@mgunton7/th...

生成式AI 2024-05-15 人工智能

942阅读

谷歌正式发布Gemini 1.5 Flash大模型：轻量化、响应速度极快

快科技5月15日消息，今天凌晨，谷歌正式召开了I/O大会，宣布谷歌已全面进入Gemini时代。在一年前的I/O大会上，谷歌才首次发布Gemini大模型，而今年大模型、AI等已经成为了绝对的主角，甚至连新版安卓都没提。除了专业的Gemini 1.5 Pr...

大数据 2024-05-15 人工智能

889阅读

谷歌硬刚GPT-4o！60秒视频生成模型虽迟但到，上下文窗口达200万

OpenAI出手再次惊艳世界，谷歌果然坐不住了。 GPT-4o掀起的一片“AGI已至”的惊呼声中，刚刚，Google DeepMind首席执行官哈萨比斯亲自携谷歌版《Her》登场。同样能会还有，不仅能几乎没有延迟地和人类流畅交流，通过摄像头，这个名为P...

人工智能 2024-05-15 人工智能

806阅读

腾讯混元文生图大模型宣布开源：首个中文原生DiT架构

今日，腾讯旗下引人注目的混元文生图大模型（混元DiT）宣布全面开源，这一重要举措标志着人工智能领域的又一里程碑。该模型已在Hugging Face和Github平台上发布，包含完整的模型权重、推理代码和算法，面向全球的企业与个人开发者免费开放商用。腾讯混...

生成式AI 2024-05-14 人工智能

873阅读

通义灵码技术解析，打造 AI 原生开发新范式

大家好，我是通义灵码的产品技术负责人陈鑫。过去有八年时间，我都是在阿里集团做研发效能，即研发工具相关的工作。我们从2015年开始做一站式 DevOps 平台，然后打造了云效，也就是将 DevOps 平台实现云化。到了2023年，我们明显感觉到大模型时代来...

人工智能 2024-05-13 人工智能

1098阅读

万字长文总结提示词技巧！新加坡首届GPT-4提示工程大赛冠军最新分享

新加坡（GovTech）举办了首届GPT-4提示工程竞赛，Sheila Teo很幸运地取得了胜利。提示工程是一门融合了艺术和科学的学科——它既是对技术的理解，也包含创造力和战略思维。这次她和我们分享了她在学习过程中学到的提示工程策略，这些策略可以让任...

AIGC 2024-05-13 人工智能

1189阅读

Refuel AI 推出专为数据标注和清洗设计的开源语言模型 RefuelLLM-2

Refuel AI 最近宣布推出两个新版本的大型语言模型（LLM），RefuelLLM-2和 RefuelLLM-2-small，这两个模型专为数据标注、清洗和丰富任务而设计，旨在提高处理大规模数据集的效率。 RefuelLLM-2的主要特点包括: 自...

人工智能 2024-05-13 人工智能

835阅读

力压Transformer？首篇Mamba综述来了！

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解 Mamba是一种新的选择性结构状态空间模型，在长序列建模任务中表现出色。Mamba通过全局感受野和动态加权，缓解了卷积神经网络的建模约束，并提供了类似于Transfo...

生成式AI 2024-05-13 人工智能

1435阅读

一文带您了解数据模型：概念模型、逻辑模型和物理模型

数据模型是组织数据管理的基石，是构建信息基础设施的关键组成部分。数据模型为组织提供了清晰的数据结构和逻辑框架，使得数据管理更加高效和可持续。在数字化时代，数据已成为企业最宝贵的资产之一，而数据模型的设计和实施，则决定了数据在企业运营和决策中的有效性和可信...

人工智能 2024-05-13 人工智能

1000阅读

Flash Attention稳定吗？Meta、哈佛发现其模型权重偏差呈现数量级波动

Meta FAIR 联合哈佛优化大规模机器学习时产生的数据偏差，提供了新的研究框架。众所周知，大语言模型的训练常常需要数月的时间，使用数百乃至上千个 GPU。以 LLaMA2 70B 模型为例，其训练总共需要 1,720,320 GPU hours。由...

AIGC 2024-05-13 人工智能

923阅读

生成式AI模型大PK——GPT-4、Claude 2.1和Claude 3.0 Opus

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 简介当前，RAG(检索增强生成系统的新评估似乎每天都在发布，其中许多都集中在有关框架的检索阶段。然而，生成方面——模型如何合成和表...

生成式AI 2024-05-13 人工智能

796阅读

外媒曝光苹果放弃造车真实原因！高管体验ChatGPT后担心掉队

快科技5月12日消息，近日，有国外媒体报道了苹果公司放弃自动驾驶汽车项目的原因。报道称，苹果高层在体验了OpenAI推出的聊天机器人ChatGPT后，对其背后的强大生成式人工智能技术感到震惊。苹果担心新兴AI技术可能威胁到iPhone的市场主导地位，甚...

大数据 2024-05-12 人工智能

807阅读

AI 音乐应用 Udio 推出音频修复扩展新功能和付费订阅计划

AI 音乐初创公司 Udio 推出了几项新功能，包括音频修复和更长的上下文口，以改善音乐创作体验。Udio 还宣布了新的订阅计划细节。新的 “音频修复工具让用户可以无缝地编辑和优化音轨的部分，Udio 表示。使用音频修复功能时，您选择轨的一部分，然后根据...

AIGC 2024-05-11 人工智能

882阅读

万字长文超全总结Pytorch核心操作！

在深度学习与人工智能领域，PyTorch已成为研究者与开发者手中的利剑，以其灵活高效的特性，不断推动着新技术的边界。对于每一位致力于掌握PyTorch精髓的学习者来说，深入了解其核心操作不仅是提升技能的关键，也是迈向高级应用与创新研究的必经之路。本文精心...

生成式AI 2024-05-10 人工智能

1083阅读

原作者带队，LSTM真杀回来了！

20 世纪 90 年代，长短时记忆（LSTM）方法引入了恒定误差选择轮盘和门控的核心思想。三十多年来，LSTM 经受住了时间的考验，并为众多深度学习的成功案例做出了贡献。然而，以可并行自注意力为核心 Transformer 横空出世之后，LSTM 自身所...

大数据 2024-05-10 人工智能

836阅读

当「软件研发」遇上 AI 大模型

作者：陈鑫（神秀）大家好，我是通义灵码的产品技术负责人陈鑫。过去有八年时间，我都是在阿里集团做研发效能，即研发工具相关的工作。我们从 2015 年开始做一站式 DevOps 平台，然后打造了云效，也就是将 DevOps 平台实现云化。到了 2023...

大数据 2024-05-10 人工智能

843阅读

DriveWorld：一个预训练模型大幅提升检测+地图+跟踪+运动预测+Occ多个任务性能

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面以视觉为中心的自动驾驶技术近期因其较低的成本而引起了广泛关注，而预训练对于提取通用表示至关重要。然而，当前的以视觉为中心的预训练通常依赖于2D或3D预训练任务，忽视了自动驾驶作为4D场景理解...

大数据 2024-05-10 人工智能

859阅读

LidaRF：研究用于街景神经辐射场的激光雷达数据（CVPR'24）

本文经自动驾驶之心公众号授权转载，转载请联系出处。光真实感模拟在自动驾驶等应用中发挥着关键作用，其中神经辐射场（NeRFs）的进步可能通过自动创建数字3D资产来实现更好的可扩展性。然而，由于街道上相机运动的高度共线性和在高速下的稀疏采样，街景的重建质...

人工智能 2024-05-09 人工智能

857阅读

DeepSeek Chat：AI对话助手 - 使用教程与免费体验入口

DeepSeek Chat是什么？ DeepSeek Chat，基于DeepSeek-V2 模型，是一款集成了 2 千亿参数量的MoE（Mixture of Experts）模型的AI技术产品。它在中文综合能力（AlignBench）和英文综合能力（MT-...

生成式AI 2024-05-08 人工智能

3170阅读

一览Occ与自动驾驶的前世今生！首篇综述全面汇总特征增强/量产部署/高效标注三大主题

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解近年来，自动驾驶因其在减轻驾驶员负担和提高驾驶安全方面的潜力而越来越受到关注。基于视觉的三维占用预测是一种新兴的感知任务，适用于具有成本效益的自动驾驶感知系统，它可以...

大数据 2024-05-08 人工智能

858阅读

OpenAI 与《People》出版商 Dotdash Meredith 达成合作

OpenAI 正在与另一家出版商合作，以授权获得培训数据。People和Better Homes & Gardens等品牌的所有者 Dotdash Meredith将向 OpenAI 授权其内容来训练ChatGPT，而出版商将使用 AI 公司的模型...

生成式AI 2024-05-08 人工智能

713阅读

一块钱100万token，超强MoE模型开源，性能直逼GPT-4-Turbo

开源大模型领域，又迎来一位强有力的竞争者。近日，探索通用人工智能（AGI）本质的 DeepSeek AI 公司开源了一款强大的混合专家 (MoE 语言模型 DeepSeek-V2，主打训练成本更低、推理更加高效。项目地址：https://gi...

人工智能 2024-05-07 人工智能

955阅读

国产开源MoE指标炸裂：GPT-4级别能力，API价格仅百分之一

最新国产开源MoE大模型，刚刚亮相就火了。 DeepSeek-V2性能达GPT-4级别，但开源、可免费商用、API价格仅为GPT-4-Turbo的百分之一。因此一经发布，立马引发不小讨论。从公布的性能指标来看，DeepSeek-V2的中文综合能力超越...

人工智能 2024-05-07 人工智能

1037阅读

OpenAI泄密者，投奔马斯克

刚被OpenAI开除的泄密者，光速投奔马斯克。当事人Pavel Izmailov（以下简称小P），正是Ilya盟友之一，在Ilya领导的超级对齐团队干过。半个月前，小P被指疑似泄露Q*相关机密而被开除。虽然不清楚他泄密了个啥，但当时闹得沸沸扬扬。说...

人工智能 2024-05-07 人工智能

776阅读

全球最强开源 MoE 模型来了，中文能力比肩 GPT-4，价格仅为 GPT-4-Turbo 的近百分之一

想象一下，一个人工智能模型，不仅拥有超越传统计算的能力，还能以更低的成本实现更高效的性能。这不是科幻，DeepSeek-V2[1]，全球最强开源 MoE 模型来了。 DeepSeek-V2 是一个强大的专家混合（MoE）语言模型，具有训练经济、推理高效...

大数据 2024-05-07 人工智能

986阅读

手机可跑，3.8B参数量超越GPT-3.5！微软发布Phi-3技术报告：秘密武器是洗干净数据

过去几年，借助Scaling Laws的魔力，预训练的数据集不断增大，使得大模型的参数量也可以越做越大，从五年前的数十亿参数已经成长到今天的万亿级，在各个自然语言处理任务上的性能也越来越好。但Scaling Laws的魔法只能施加在「固定」的数据源上，...

AIGC 2024-05-07 人工智能

812阅读

开发者的LlamaIndex入门指南

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ LlamaIndex是一个专注于检索增强生成(RAG 的工具，可以协助您丰富大模型的数据提示。本文将用实例向您展示和介绍。众所周知，...

AIGC 2024-05-07 人工智能

1277阅读

58行代码把Llama 3扩展到100万上下文，任何微调版都适用

堂堂开源之王Llama 3，原版上下文窗口居然只有……8k，让到嘴边的一句“真香”又咽回去了。在32k起步，100k寻常的今天，这是故意要给开源社区留做贡献的空间吗？开源社区当然不会放过这个机会：现在只需58行代码，任何Llama 3 70b的微调...

大数据 2024-05-06 人工智能

843阅读

AI音乐工具 Udio更新可制作长达15分钟音乐

AI音乐工具Udio最近宣布了一系列新功能的更新，这些更新致力于帮助用户创作出更长、更连贯的音乐作品，为音乐制作者提供了更多的创作自由和可能性。 Udio的新更新中，上下文窗口得到了扩展，现在在用户扩展一首歌曲的某个部分时，系统会考虑该部分前后最长两分钟...

大数据 2024-05-06 人工智能

814阅读

OpenAI下周将发布ChatGPT搜索引擎，挑战谷歌搜索！

5月3日，前Mila研究员、麻省理工讲师Lior S爆料，根据OpenAI最新的SSL证书日志显示，已经创建了search.chatgpt.com子域名（目前无法访问），将会进军搜索引擎全面挑战该领域的全球霸主谷歌。比较巧的是，OpenAI已经更新了网站...

生成式AI 2024-05-04 人工智能

838阅读

Llama 3细节公布！AI产品总监站台讲解：Llama系列超庞大生态系统

除了计算资源和训练数据这些硬实力外，Llama3模型开源的训练思路覆盖了LLM模型的全部生命周期，提供了各种开源生态系统下的工具。 Llama3的开源，再次掀起了一场大模型的热战，各家争相测评、对比模型的能力，也有团队在进行微调，开发衍生模型。最近，M...

生成式AI 2024-05-03 人工智能

817阅读

理解GraphRAG（一）：RAG的挑战

检索增强生成（RAG）是一种通过外部知识源增强现有大型语言模型（LLM）的方法，以提供和上下文更相关的答案。在RAG中，检索组件获取额外的信息，使响应基于特定来源，然后将这些信息输入到LLM提示中，以使LLM的响应基于这些信息（增强阶段）。与其他技术（例...

人工智能 2024-04-30 人工智能

883阅读

苹果推出理解、转化模型ReALM，性能超GPT-4

苹果的研究人员推出了一种创新模型ReALM，可将参考解析问题转化为语言建模问题，能极大提升AI助手处理很多描述复杂或模糊不清的内容。例如，我们网购时选好了橘子、鸭梨、苹果、橘子汽水、洗发水、短袖、拖鞋等物品，然后告诉AI助手只结算水果。这时传统的AI助手...

人工智能 2024-04-30 人工智能

890阅读

开源大模型王座再易主，通义千问1100亿参数拿下SOTA，3个月已推出8款模型

开源大模型，已经开启大卷特卷模式。全球范围，太平洋两岸，双雄格局正在呼之欲出。 Llama 3中杯大杯刚惊艳亮相，国内通义千问就直接开源千亿级参数模型Qwen1.5-110B，一把火上Hacker News榜首。不仅相较于自家720亿参数模型性能明...

AIGC 2024-04-30 人工智能

841阅读

LLM和RAG技术的比较探索

作者 | Ashok Gorantla 整理 | 言征出品 | 51CTO技术栈（微信号：blog51cto）在人工智能（AI）的动态环境中，两种开创性的技术——大型语言模型（LLM）和检索增强生成（RAG）——在理解和生成类人文本方面脱颖而出。本...

大数据 2024-04-30 人工智能

951阅读

如何利用AI实现文档处理自动化

译者 | 陈峻审校 | 重楼文件处理在许多企业及员工看来是一项必不可少、却又耗时费力的工作。每天，他们往往需要花费无数个小时去对文件进行分类、归档、以及搜索。不过，如今人工智能（AI）正在以自动化的方式改变着这些琐碎的工作。通过利用人工智能，企业...

人工智能 2024-04-30 人工智能

990阅读

AI日报：Awaker 1.0写真视频击败Sora？Sora视频被指大量后期；苹果首款AI平板曝光；百万网友围观博主和AI“谈恋爱”

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、写真视频击败Sora？人大自研...

大数据 2024-04-29 人工智能

977阅读

LLM 安全 | 大语言模型应用安全入门

一、背景 2023年以来，LLM 变成了相当炙手可热的话题，以 ChatGPT 为代表的 LLM 的出现，让人们看到了无限的可能性。ChatGPT能写作，能翻译，能创作诗歌和故事，甚至能一定程度上做一些高度专业化的工作，比如法律服务和医疗诊断咨询。...

大数据 2024-04-25 人工智能

823阅读

股价飙升！商汤大模型挑战GPT4

4月24日，商汤集团在港交所暂停交易前股价上涨31.15%。商汤集团表示，其大模型日日新5.0发布会受到市场极大关注，公司将进一步刊发相关公告。在“2024年商汤技术交流日”上，商汤发布了其最新的大模型——SenseNova5.0，旨在追赶GPT-4，这反...

大数据 2024-04-25 人工智能

870阅读

《这就是ChatGPT》登顶微信读书热搜榜第一名

今日，据微信读书热搜榜显示，《这就是ChatGPT》登顶微信读书热搜榜第一名。据悉，《这就是 ChatGPT》是一本由 [美] 斯蒂芬・沃尔夫拉姆（Stephen Wolfram）于2023年7月出版的图书，由人民邮电出版社出版。该书主要介绍了 Op...

大数据 2024-04-25 人工智能

929阅读

AI视频生成工具ID-Animator：可保持角色一致生成视频动画

近年来，生成具有指定身份的高保真人类视频引起了广泛关注。然而，现有技术在训练效率和身份保持之间往往难以取得平衡，要么需要繁琐的逐案微调，要么在视频生成过程中通常会丢失身份细节。研究提出了一种名为 ID-Animator 的零样本人类视频生成方法，可以在无需...

大数据 2024-04-25 人工智能

913阅读

这就是OpenAI神秘的Q*？斯坦福：语言模型就是Q函数

还记得去年 11 月底爆出来的 Q* 项目吗？这是传说中 OpenAI 正在秘密开展、或将带来颠覆性变革的 AI 项目。如果你想回忆一下，可参看机器之心当时的报道《全网大讨论：引爆 OpenAI 全员乱斗的 Q * 到底是什么？》简而言之，Q* 很可能是...

大数据 2024-04-24 人工智能

860阅读

一文读懂 LLM 的构建模块：向量、令牌和嵌入

在当今信息爆炸的时代，我们不断面临着海量文本数据的挑战。为了有效地处理和理解这些数据，自然语言处理（NLP）领域的研究者们一直在不断探索和创新。而其中一个重要的研究方向就是语言模型（Language Model）。在这篇文章中，我们将一起探索和理解...

大数据 2024-04-24 人工智能

1029阅读

CVPR 2024 | 面向真实感场景生成的激光雷达扩散模型

本文经自动驾驶之心公众号授权转载，转载请联系出处。原标题：Towards Realistic Scene Generation with LiDAR Diffusion Models 论文链接：https://hancyran.github.io/a...

生成式AI 2024-04-24 人工智能

1005阅读

月之暗面：Kimi 大模型API 已支持 Tool Calling 功能

月之暗面（Moonshot AI）宣布Kimi 大模型学会了使用工具，即 API 已支持 Tool Calling 功能。通过这个功能，开发者可以让 Kimi 大模型与各种自定义外部工具进行交互，从而拓展 AI 应用的想象空间。举例来说，Kimi 大模型...

AIGC 2024-04-24 人工智能

1078阅读