预训练第15页 - AIGC资讯

ChatGPT们的幕后先驱，斯坦福教授Manning的四十年NLP生涯

今年 1 月份，2024 年度 IEEE 冯诺伊曼奖项结果正式公布，斯坦福大学语言学和计算机科学教授、AI 学者克里斯托弗・曼宁（Christopher Manning）获奖。曼宁教授是将深度学习应用于 NLP 领域的早期领军人物，在词向量 GloVe...

AIGC 2024-05-06 人工智能

745阅读

AI可以改写人类基因组吗？首次由AI从头设计的基因编辑器成功编辑人类细胞中DNA

生成式 AI 可以对话、写诗、画图、做视频、作曲、写代码...... 那么，AI 可以改写人类基因组吗？现在，新的 AI 技术正在为可编辑 DNA 的微观生物机制绘制蓝图，这预示着未来科学家将以更高的精度和速度对抗疾病。近日，美国 AI 蛋白质设计初...

生成式AI 2024-05-06 人工智能

748阅读

终于有人调查了小模型过拟合：三分之二都有数据污染，微软Phi-3、Mixtral 8x22B被点名

当前最火的大模型，竟然三分之二都存在过拟合问题？刚刚出炉的一项研究，让领域内的许多研究者有点意外。提高大型语言模型的推理能力是当前研究的最重要方向之一，而在这类任务中，近期发布的很多小模型看起来表现不错，比如微软 Phi-3、Mistral 8x2...

人工智能 2024-05-06 人工智能

733阅读

专利大模型的实践与知识问答探索

一、专利大模型背景介绍智慧芽一直致力于为科技创新和知识产权领域提供信息服务。在小型模型时代（如 Bert），参数量较少，智能理解方面存在局限性。因此，在着手开发大模型之前，智慧芽深入思考了领域聚焦的重要性。在知识产权领域，专利检索、专利对比、标引工作...

生成式AI 2024-05-06 人工智能

1070阅读

Meta训AI，成本已超阿波罗登月！谷歌豪言投资超千亿美元，赛过OpenAI星际之门

【新智元导读】近日访谈中，LeCun亲口证实:Meta为购入英伟达GPU已经花费了300亿美元，成本超过阿波罗登月。相比之下，微软和OpenAI打造的星际之门耗资1000亿美元，谷歌DeepMind CEO Hassabis则放出豪言:谷歌投入的，比这个数...

大数据 2024-05-05 人工智能

715阅读

AI教母李飞飞首次创业！成立“空间智能”公司，已完成种子轮

AI教母李飞飞，创业了! 最新消息，斯坦福大学教授李飞飞正在建立一家AI公司，已完成种子轮融资。公司方向定为“空间智能”——旨在让AI能像人类一样对视觉信息进行高级推理。消息人士表示，这将是该技术的一次飞跃。投资方包括硅谷风投a16z和Radical...

生成式AI 2024-05-04 人工智能

735阅读

重启与OpenAI的谈判，苹果为iOS 18的AI找“备胎”

如果说在AI大模型崭露头角的2023年，苹果方面的做法是观望，那么到了2024年，他们显然已经不再认为这一轮人工智能浪潮是“AI炒作”（AI hype）了。继此前300亿参数规模的MM1模型亮相后，苹果又在不久前在AI开源社区Hugging Face放出了...

生成式AI 2024-05-03 人工智能

631阅读

Llama 3细节公布！AI产品总监站台讲解：Llama系列超庞大生态系统

除了计算资源和训练数据这些硬实力外，Llama3模型开源的训练思路覆盖了LLM模型的全部生命周期，提供了各种开源生态系统下的工具。 Llama3的开源，再次掀起了一场大模型的热战，各家争相测评、对比模型的能力，也有团队在进行微调，开发衍生模型。最近，M...

生成式AI 2024-05-03 人工智能

676阅读

开源大模型王座再易主，通义千问1100亿参数拿下SOTA，3个月已推出8款模型

开源大模型，已经开启大卷特卷模式。全球范围，太平洋两岸，双雄格局正在呼之欲出。 Llama 3中杯大杯刚惊艳亮相，国内通义千问就直接开源千亿级参数模型Qwen1.5-110B，一把火上Hacker News榜首。不仅相较于自家720亿参数模型性能明...

AIGC 2024-04-30 人工智能

685阅读

神秘GPT模型引爆社区，GPT-4.5、GPT-5谣言满天飞，奥特曼在线围观

这场等待「GPT-5」的游戏啥时候才能结束? GPT-5啥时候来?估计是 AI 领域最关心的问题之一了。是像 Sora 一样毫无预兆的发布，还是我们可以从边角料的爆料中得知一点点信息，大家对未来将要发布的这一模型充满了期待。但奥特曼在一次访谈中表示，Op...

生成式AI 2024-04-30 人工智能

733阅读

还在YOLO-World？DetCLIPv3出手！性能大幅度超出一众SOTA！

本文经自动驾驶之心公众号授权转载，转载请联系出处。现有的开词汇目标检测器通常需要用户预设一组类别，这大大限制了它们的应用场景。在本文中，作者介绍了DetCLIPv3，这是一种高性能检测器，不仅在开词汇目标检测方面表现出色，同时还能为检测到的目标生成...

AIGC 2024-04-30 人工智能

820阅读

大语言模型对汽车行业的影响和实践探索

汽车行业作为技术创新的重要领域，正迅速采纳大语言模型，如 GPT 系列，以推动行业的数字化转型。这些模型在提升车载智能系统的交互体验、优化客户服务、加速产品开发及市场营销策略方面展现出巨大潜力。通过具体应用案例分析，接下来我们一起揭示大语言模型如何为汽...

大数据 2024-04-28 人工智能

679阅读

利用TimeGPT的深度学习能力实现预测分析的革新

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 人工智能对预测分析产生了根本性的影响，使得预测比以往任何时候都更加精确。各行各业都在充分利用人工智能的强大能力，以预测未来趋势并为即将...

人工智能 2024-04-28 人工智能

817阅读

Llama 3低比特量化性能下降显著！全面评估结果来了 | 港大&北航&ETH

大模型力大砖飞，让LLaMA3演绎出了新高度：超15T Token数据上的超大规模预训练，既实现了令人印象深刻的性能提升，也因远超Chinchilla推荐量再次引爆开源社区讨论。与此同时，在实际应用层面上，另一个热点话题也浮出水面：资源有限场景下...

人工智能 2024-04-28 人工智能

771阅读

模糊图像重建重大进展！DeblurGS：相机位姿不准也能极致渲染！

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解尽管在从运动模糊图像中重建清晰的3D场景方面取得了重大进展，但向现实世界应用的过渡仍然具有挑战性。主要障碍源于严重的模糊，这导致通过“Structure-from-M...

生成式AI 2024-04-26 人工智能

765阅读

LLM 安全 | 大语言模型应用安全入门

一、背景 2023年以来，LLM 变成了相当炙手可热的话题，以 ChatGPT 为代表的 LLM 的出现，让人们看到了无限的可能性。ChatGPT能写作，能翻译，能创作诗歌和故事，甚至能一定程度上做一些高度专业化的工作，比如法律服务和医疗诊断咨询。...

大数据 2024-04-25 人工智能

674阅读

股价飙升！商汤大模型挑战GPT4

4月24日，商汤集团在港交所暂停交易前股价上涨31.15%。商汤集团表示，其大模型日日新5.0发布会受到市场极大关注，公司将进一步刊发相关公告。在“2024年商汤技术交流日”上，商汤发布了其最新的大模型——SenseNova5.0，旨在追赶GPT-4，这反...

大数据 2024-04-25 人工智能

723阅读

揭秘腾讯混元大模型：400+场景落地，协作SaaS产品全面接入

进入2024，大模型的风向变了。当初“百模大战”时，只要简单粗暴拿个Demo搞MaaS（模型即服务），也就是让用户直接和大模型交互就足以上牌桌。但现在，精耕细作搞应用，无论是原生AI应用，还是在已有产品上整合AI功能，成了最新潮流趋势。就连一向低调神...

大数据 2024-04-25 人工智能

795阅读

《这就是ChatGPT》登顶微信读书热搜榜第一名

今日，据微信读书热搜榜显示，《这就是ChatGPT》登顶微信读书热搜榜第一名。据悉，《这就是 ChatGPT》是一本由 [美] 斯蒂芬・沃尔夫拉姆（Stephen Wolfram）于2023年7月出版的图书，由人民邮电出版社出版。该书主要介绍了 Op...

大数据 2024-04-25 人工智能

767阅读

华为开发者大会定档将发布盘古大模型5.0

华为开发者大会定于6月21日至23日在东莞松山湖盛大举行，届时将见证盘古大模型5.0与HarmonyOS NEXT鸿蒙星河版的首次同台展示。盘古大模型系列，作为华为精心打造的一系列预训练大模型，涵盖了自然语言处理（NLP）、计算机视觉(CV 以及科学计算...

生成式AI 2024-04-25 人工智能

641阅读

与纯血鸿蒙同台亮相！华为盘古大模型5.0六月发布

快科技4月25日消息，华为开发者大会（HDC 2024）将于6月21日-23日在东莞松山湖举办，这将是华为史上规模最大的开发者大会。邀请函显示，华为将在大会上重磅发布盘古大模型5.0，并将和纯血鸿蒙”HarmonyOS NEXT鸿蒙星河版首次同台亮相。...

AIGC 2024-04-25 人工智能

691阅读

AI视频生成工具ID-Animator：可保持角色一致生成视频动画

近年来，生成具有指定身份的高保真人类视频引起了广泛关注。然而，现有技术在训练效率和身份保持之间往往难以取得平衡，要么需要繁琐的逐案微调，要么在视频生成过程中通常会丢失身份细节。研究提出了一种名为 ID-Animator 的零样本人类视频生成方法，可以在无需...

大数据 2024-04-25 人工智能

754阅读

苹果卷开源大模型，公开代码、权重、数据集、训练全过程，OpenELM亮相

要说 ChatGPT 拉开了大模型竞赛的序幕，那么 Meta 开源 Llama 系列模型则掀起了开源领域的热潮。在这当中，苹果似乎掀起的水花不是很大。不过，苹果最新放出的论文，我们看到其在开源领域做出的贡献。近日，苹果发布了 OpenELM，共四种变...

生成式AI 2024-04-25 人工智能

742阅读

AI信任危机之后，揭秘预训练如何塑造机器的「可信灵魂」

图表 1: 大模型的通用训练流程 [1] 在人工智能的前沿领域，大语言模型（Large Language Models，LLMs）由于其强大的能力正吸引着全球研究者的目光。在 LLMs 的研发流程中，预训练阶段占据着举足轻重的地位，它不仅消耗了大量的计...

人工智能 2024-04-25 人工智能

718阅读

挑战拯救痴心“舔狗”，我和大模型都尽力了

天降猛男，大模型化身为 “痴情男大”，等待人类玩家的拯救。一款名为 “拯救舔狗” 的大模型原生小游戏出现了。游戏规则很简单:如果玩家在几轮对话内说服 “他” 放弃追求对他并无青睐的女神，就算挑战成功。听起来并不难，然而游戏源于生活，模型人设是痴情属...

生成式AI 2024-04-24 人工智能

642阅读

微软3.8B模型媲美GPT-3.5！小到用iPhone就能跑起来，网友：Good data is all you need!

撰文、整理 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）这周，“小模型”之战打得可谓精彩非凡，让人目不暇接。前脚，小扎刚在采访中自豪地宣布Llama3 80亿模型几乎与此前Llama2 700亿模型的性能差不多...

AIGC 2024-04-24 人工智能

710阅读

一文了解大语言模型（LLM）

人工智能的发展给我们的生活带来很多不一样的体验。面部识别可以解锁设备，激光雷达可以实现自动驾驶。当2023年，OpenApi的chatGPT可以“理解”人类的语言并与我们进行沟通时，大语言模型的概念出现在我们面前。在自然语言处理领域的大语言模型（La...

AIGC 2024-04-23 人工智能

775阅读

牛津大学最新！Mickey：3D中的2D图像匹配SOTA！(CVPR'24)

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面项目链接：https://nianticlabs.github.io/mickey/ 给定两张图像，可以通过建立图像间的对应关系来估计它们之间的相机相对姿态。通常，这些对应关系是二维到二维的...

AIGC 2024-04-23 人工智能

696阅读

4000万蛋白结构训练，西湖大学开发基于结构词表的蛋白质通用大模型，已开源

蛋白质结构相比于序列往往被认为更加具有信息量，因为其直接决定了蛋白质的功能。而随着AlphaFold2带来的巨大突破，大量的预测结构被发布出来供人研究使用。如何利用这些蛋白质结构来训练强大且通用的表征模型是一个值得研究的方向。西湖大学的研究人员利用Fo...

人工智能 2024-04-22 人工智能

751阅读

微软紧急撤回最先进的AI大模型：居然忘了测试了

快科技4月21日消息，Meta发布超级彪悍的大语言模型Llama 3之后，微软也很快推出了自己的新一代WizardLM2 8x22B，号称迄今最强大，完全超越Claude 3 OpusSonnet、GPT-4等竞品，而且开源，但是马上又把它撤回去了。没有...

AIGC 2024-04-22 人工智能

685阅读

让玩家全程掌控游戏：自然语言指令驱动的游戏引擎到来了

对于每一位热爱打游戏的人而言，都曾经想过这样一个问题，「这游戏要是我来做就好了！」可惜的是，游戏开发有很高的门槛，需要专业的编程技巧。近日，来自上海交大的团队开展了一个名为「Instruction-Driven Game Engine, IDGE」的...

大数据 2024-04-21 人工智能

931阅读

综述！深度模型融合（LLM/基础模型/联邦学习/微调等）

23年9月国防科大、京东和北理工的论文“Deep Model Fusion: A Survey”。深度模型融合/合并是一种新兴技术，它将多个深度学习模型的参数或预测合并为一个模型。它结合了不同模型的能力来弥补单个模型的偏差和错误，以获得更好的性能。然而...

生成式AI 2024-04-21 人工智能

1186阅读

RAG 2.0架构详解：构建端到端检索增强生成系统

关于检索增强生成（RAG）的文章已经有很多了，如果我们能创建出可训练的检索器，或者说整个RAG可以像微调大型语言模型（LLM）那样定制化的话，那肯定能够获得更好的结果。但是当前RAG的问题在于各个子模块之间并没有完全协调，就像一个缝合怪一样，虽然能够工作...

人工智能 2024-04-20 人工智能

918阅读

全球首个「开源GPT-4」出世！Llama 3震撼发布，Meta AI免登录可用

LLM界的「真·Open AI」，又来整顿AI圈了! 业内惊呼:首个开源GPT-4级的模型，终于来了!开源模型追上闭源模型的历史性一刻，或许就在眼前了? 一石激起千层浪，Llama3才刚刚发布没几小时，就破纪录地登顶了Hugging Face排行榜。这...

人工智能 2024-04-20 人工智能

788阅读

开源大模型Llama 3王者归来！最大底牌4000亿参数，性能直逼GPT-4

扎克伯格:「有了 Llama3，全世界就能拥有最智能的 AI。」 ChatGPT 拉开了大模型竞赛的序幕，Meta 似乎要后来居上了。本周四，AI 领域迎来重大消息，Meta 正式发布了人们等待已久的开源大模型 Llama3。扎克伯格在 Faceboo...

生成式AI 2024-04-20 人工智能

918阅读

InternLM2官网体验入口中文AI聊天机器人模型使用地址

InternLM2是一个面向中文和英文的大型多语言预训练语言模型。它具有语言理解、自然语言生成、多模式推理、代码理解等强大的能力。模型采用Transformer架构并进行海量数据的预训练，在长文本理解、对话、数学运算等多个方向上都达到了业界领先水平。该系列...

AIGC 2024-04-12 人工智能

752阅读

【探索AI】人人都在讲AIGC，什么是AIGC？

AIGC 概述示例展示我们日常用到的一些工具/应用核心技术介绍核心技术的算法解析案例及部分代码实现 1. 艺术作品 2. 设计项目 3. 影视特效 4. 广告创意总结一张图先了解下：概述 "人工智能生成创造...

生成式AI 2024-04-11 人工智能

3302阅读

十个大型语言模型(LLM)常见面试问题和答案解析

今天我们来总结以下大型语言模型面试中常问的问题一、哪种技术有助于减轻基于提示的学习中的偏见? A.微调 Fine-tuning B.数据增强 Data augmentation C.提示校准 Prompt calibration D.梯度裁剪 Gra...

生成式AI 2024-04-11 人工智能

970阅读

「大模型+强化学习」最新综述！港中文深圳130余篇论文：详解四条主流技术路线

强化学习（RL）通过与环境交互的试错反馈来优化顺序决策问题。虽然RL在允许大量试错的复杂电子游戏环境中实现了超越人类的决策能力（例如王者荣耀，Dota 2等），但很难在包含大量自然语言和视觉图像的现实复杂应用中落地，原因包括但不限于：数据获取困难、样本...

人工智能 2024-04-11 人工智能

977阅读

多个SOTA ！OV-Uni3DETR：提高3D检测在类别、场景和模态之间的普遍性（清华&港大）

本文经自动驾驶之心公众号授权转载，转载请联系出处。这篇论文聚焦于3D目标检测的领域，特别是Open-Vocabulary的3D目标检测。在传统的3D目标检测任务中，系统旨在预测真实场景中物体的定向3D边界框和语义类别标签，这通常依赖于点云或RGB图像...

生成式AI 2024-04-11 人工智能

679阅读

探索ChatGLM-LLaMA-chinese：新一代AI聊天机器人与多语言建模的创新实践

探索ChatGLM-LLaMA-chinese：新一代AI聊天机器人与多语言建模的创新实践项目地址:https://gitcode.com/27182812/ChatGLM-LLaMA-chinese-insturct 在人工智能领域，语言模型的...

人工智能 2024-04-11 人工智能

890阅读

2024-03-26 AIGC-大模型学习路线

摘要: 2024-03-26 AIGC-大模型学习路线大模型学习路线建议先从主流的Llama开始，然后选用中文的Qwen/Baichuan/ChatGLM，先快速上手体验prompt工程，然后再学习其架构，跑微调脚本如果要深入学习，建...

大数据 2024-04-11 人工智能

2136阅读

谷歌向微软英特尔全面宣战：首款自研Arm CPU，最强大模型公测，AI视频对垒Sora

昨晚的Google Cloud Next2024大会上，谷歌接连放出一堆模型和产品王炸:Gemini1.5Pro公开可用、上线音频处理能力;代码模型CodeGemma上新，首款自研Arm处理器Axion正式向微软和亚马逊宣战……这次，谷歌要以量取胜。昨天...

人工智能 2024-04-10 人工智能

739阅读

RAG 修炼手册｜一文讲透 RAG 背后的技术

在之前的文章中《RAG 修炼手册｜RAG敲响丧钟？大模型长上下文是否意味着向量检索不再重要》，我们已经介绍过 RAG 对于解决大模型幻觉问题的不可或缺性，也回顾了如何借助向量数据库提升 RAG 实战效果。今天我们继续剖析 RAG，将为大家大家详细介绍...

AIGC 2024-04-10 人工智能

767阅读

陈巍：LLaMA-2的多模态版本架构与训练详解（收录于GPT-4/ChatGPT技术与产业分析）

陈巍：2023年9月，Meta的研究人员推出了AnyMAL（任意模态增强语言模型，Any-Modality Augmented Language Model）。该模型能够理解多种模态信号并生成文本回应，即多模态输入，单模态输出。输入的模态可包括图像、视频、...

AIGC 2024-04-10 人工智能

873阅读

谷歌向微软英特尔全面宣战！首款自研Arm CPU，最强大模型公测，AI视频对垒Sora

昨天的谷歌Next大会可是太精彩了，谷歌一连放出不少炸弹。 - 升级「视频版」Imagen 2.0，下场AI视频模型大混战 - 发布时被Sora光环掩盖的Gemini 1.5 Pro，正式开放 - 首款Arm架构CPU发布，全面对垒微软/亚马逊/英伟达/...

AIGC 2024-04-10 人工智能

703阅读

Llama架构比不上GPT2？神奇token提升10倍记忆？

一个 7B 规模的语言模型 LLM 能存储多少人类知识？如何量化这一数值？训练时间、模型架构的不同将如何影响这一数值？浮点数压缩 quantization、混合专家模型 MoE、以及数据质量的差异 (百科知识 vs 网络垃圾又将对 LLM 的知识容量...

大数据 2024-04-10 人工智能

623阅读

ELLA官网体验入口腾讯AI文本到图像语义对齐工具使用介绍

ELLA是一种轻量级方法，可将现有的基于CLIP的扩散模型配备强大的LLM。ELLA提高了模型的提示跟随能力，使文本到图像模型能够理解长文本。我们设计了一个时间感知语义连接器，从预训练的LLM中提取各种去噪阶段的时间步骤相关条件。我们的TSC动态地适应了不...

生成式AI 2024-04-10 人工智能

754阅读

AIGC-Stable Diffusion发展及原理总结

目录一. AIGC介绍 1. 介绍 2. AIGC商业化方向 3. AIGC是技术集合 4. AIGC发展三要素 4.1 数据 4.2 算力 4.3 算法 4.3.1 多模态模型CLIP 4.3.2 图像生成模型二. Stable...

生成式AI 2024-04-10 人工智能

1014阅读

大概是最全的开源大模型LLM盘点了吧！

LLM(Large Language Model, 大型语言模型是指那些规模庞大、参数数量众多的深度神经网络模型，用于理解和生成自然语言文本。在自然语言处理（NLP）领域有着广泛的应用，因其强大的语言理解和生成能力，能够处理各种复杂的文本任务，包括但不...

大数据 2024-04-10 人工智能

740阅读