预训练第17页 - AIGC资讯

LLaMA-Factory参数的解答

打开LLaMA-Factory的web页面会有一堆参数，但不知道怎么选，选哪个，这个文章详细解读一下，每个参数到底是什么含义这是个人写的参数解读，我并非该领域的人如果那个大佬看到有参数不对请反馈一下，或者有补充的也可以！谢谢（后续该文章可能会持续更新）...

大数据 2024-03-30 人工智能

1245阅读

AI绘画Imagen大力出奇迹生成图像

AI绘画Imagen大力出奇迹生成图像介绍 Imagen是一个文本到图像的扩散模型，由Google大脑团队研究所开发。 Imagen通过创新的设计，摈弃了需要预训练视觉-语言模型的繁琐步骤，直接采用了T5等大规模语言模型作为文...

大数据 2024-03-29 人工智能

969阅读

大佬出走后首个发布！Stability官宣代码模型Stable Code Instruct 3B

大佬出走后，第一个模型来了！就在今天，Stability AI官宣了新的代码模型Stable Code Instruct 3B。图片要说Stability也是真的很神奇，首席执行官辞职了，Stable Diffusion其中几位作者也离开了，投资公...

大数据 2024-03-29 人工智能

862阅读

知乎AI革命：智能搜索与实时问答的融合

在生成式人工智能（Generative AI）的信息技术跃迁背景下，如何看待知乎当下和未来，有三个基本的视角: 它是大语言模型预训练中文语料最重要来源之一，例如最近现象级的大模型聊天应用Kimi Chat，就以知乎为重要的训练资料来源（甚至是80%以上的...

AIGC 2024-03-29 人工智能

872阅读

金融新质生产力创新论坛在京召开发布全国首部《金融大模型》著作

近年来，以大模型为代表的人工智能技术进一步深刻提升数字金融新范式。2024年政府工作报告提出，要大力推进现代化产业体系建设，加快发展新质生产力，“人工智能+”被首次写入政府工作报告。可以显见，随着AI产业全面提升至国家战略高度，新一轮科技革命和产业革命将...

人工智能 2024-03-29 人工智能

834阅读

开源AI到底是什么？业界：超出开源软件范畴，需要重新界定

最近AI圈突然流行起开源概念。Meta承诺将会打造开源AI，马斯克起诉OpenAI，说它缺少开源模型。与此同时，一批科技领袖和科技企业纷纷为开源概念呐喊。不过科技界碰到一个难以解决的根本问题：它们对“开源AI”的概念无法达成共识。照字面意思，开源A...

AIGC 2024-03-29 人工智能

788阅读

大型语言模型如何教会自己遵循人类指令？

译者 | 李睿审校 | 重楼如今，人们对能够使大型语言模型(LLM 在很少或没有人为干预的情况下改进功能的技术越来越感兴趣。大型语言模型(LLM 自我改进的领域之一是指令微调(IFT ，也就是让大型语言模型教会自己遵循人类指令。指令微调(IFT ...

人工智能 2024-03-29 人工智能

906阅读

苹果研发多模态AI，这是研究人员迄今发现的结果

译者 | 布加迪审校 | 重楼如果我告诉你，在最近热议的多模态AI背后，苹果正在悄然酝酿一场革命，你会作何感想？苹果的一群研究人员一直在系统地研究如何构建功能最强大的多模态模型，揭露了质疑传统智慧的重要见解。现在他们让我们有机会一窥底层的细节。他...

人工智能 2024-03-28 人工智能

884阅读

量产杀器！P-Mapnet：利用低精地图SDMap先验，建图性能暴力提升近20个点！

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面在线HD Map生成算法是当前自动驾驶系统摆脱对高精地图依赖的方法之一，现有的算法在远距离范围下的感知表现依然较差。为此，我们提出了P-MapNet，其中的“P”强调我们专注于融合地图先验以...

AIGC 2024-03-28 人工智能

1055阅读

今日Arxiv最热NLP大模型论文：Llama-2上下文扩大48倍的方法来了，港大发布，无需训练

引言：大语言模型的长上下文理解能力在当今的人工智能领域，大语言模型（Large Language Models，简称LLMs）的长上下文理解能力成为了一个重要的研究方向。这种能力对于模型来说至关重要，因为它使得LLMs能够有效地应对各种应用场景，例如在...

大数据 2024-03-28 人工智能

930阅读

开源大模型DBRX：1320亿参数，比Llama2-70B快1倍

大数据公司Databricks最近发布了一款名为DBRX的MoE大模型，引发了开源社区的热议。DBRX在基准测试中击败了Grok-1、Mixtral等开源模型，成为了新的开源之王。这款模型的总参数量达到了1320亿，但每次激活只有360亿参数，并且其生成速...

人工智能 2024-03-28 人工智能

797阅读

铁了心要打败OpenAI！坚信开源打败闭源！这家知名数据厂商4个月打造最强开源大模型！性能超越Claude3，速度是羊驼2倍

撰稿 | 言征出品 | 51CTO技术栈（微信号：blog51cto）大模型领域，迭代的速度简直要以天计算。昨天，大家还在热议Claude3超大杯版Opus在Elo Rating榜单上取代GPT4-Turbo-1106成为了新王。今天大家又发现开源...

生成式AI 2024-03-28 人工智能

905阅读

新开源之王来了！1320亿参数，逻辑数理全面打赢Grok，还比Llama2-70B快1倍

“最强”开源大模型之争，又有新王入局：大数据巨头Databricks，刚刚发布MoE大模型DBRX，并宣称：它在基准测试中击败了此前所有开源模型。包括同为混合专家模型的Grok-1和Mixtral。新王搅局，迅速引发了开源社区的热议。毕竟，仅...

AIGC 2024-03-28 人工智能

891阅读

探秘Copilot Clone: 智能代码助手的开源新秀

探秘Copilot Clone: 智能代码助手的开源新秀项目地址:https://gitcode.com/hieunc229/copilot-clone 在当今的软件开发世界中，效率和生产力是每个开发者关注的核心。GitHub 的 Copilot...

大数据 2024-03-28 人工智能

945阅读

文心一言指令词宝典之职场效率篇

作者：哈哥撩编程（视频号、抖音、公众号同名）新星计划·全栈领域优秀创作者博客专家·全国博客之星第四名超级个体·COC上海社区主理人特约讲师·谷歌亚马逊演讲嘉宾科技博主·极星会首批签约作者 ? 推荐专栏： ? 程序员：...

生成式AI 2024-03-28 人工智能

988阅读

llama factory学习笔记

模型模型名模型大小默认模块 Template Baichuan2 7B/13B W_pack baichuan2 BLOOM 560M/1.1B/1.7B/3B/7.1B/176B query_key_value - BLOOM...

大数据 2024-03-28 人工智能

1207阅读

两分钟1200帧的长视频生成器StreamingT2V来了，代码将开源

广阔的战场，风暴兵在奔跑…… prompt：Wide shot of battlefield, stormtroopers running... 这段长达 1200 帧的 2 分钟视频来自一个文生视频（text-to-video）模型，尽管 AI 生成...

生成式AI 2024-03-27 人工智能

788阅读

今年，中国AI大模型产业发展看这些

现在的人工智能，已不是「可以用」，而是「非常好用」了。上个星期，谷歌与李世石一次久违的对话，唤起了人们的回忆: 仔细想来，自2016年 AlphaGo 在围棋上打败人类起已过去八年。如今人工智能技术的发展却丝毫没有减速，正在给我们创造更大的震撼。生成式...

AIGC 2024-03-27 人工智能

825阅读

Stable Diffusion生成式扩散模型代码实现原理

Stable Diffusion可以使用PyTorch或TensorFlow等深度学习框架来实现。这些框架提供了一系列的工具和函数，使得开发者可以更方便地构建、训练和部署深度学习模型。因此可以使用PyTorch或TensorFlow来实现Stable Di...

人工智能 2024-03-27 人工智能

1353阅读

Video-LLaMa:利用多模态增强对视频内容理解

在数字时代，视频已经成为一种主要的内容形式。但是理解和解释视频内容是一项复杂的任务，不仅需要视觉和听觉信号的整合，还需要处理上下文的时间序列的能力。本文将重点介绍称为video - llama的多模态框架。Video-LLaMA旨在使LLM能够理解视频中的...

AIGC 2024-03-27 人工智能

835阅读

近屿智能成功完成A轮融资，打造独家AIGC工程师与产品经理学习路径图引发热议

近屿智能OJAC的发展历程与行业实力在2024年1月，上海近屿智能科技有限公司（简称近屿智能）宣布成功完成A轮融资。智望资本作为领头投资者，金沙江创投也参与了增资。这一里程碑事件不仅突显了近屿智能在人力资源技术领域的领先地位，也显示了投资者对其技术实力...

AIGC 2024-03-27 人工智能

923阅读

详解Latte：去年底上线的全球首个开源文生视频DiT

随着 Sora 的成功发布，视频 DiT 模型得到了大量的关注和讨论。设计稳定的超大规模神经网络一直是视觉生成领域的研究重点。DiT [1] 的成功为图像生成的规模化提供了可能性。然而，由于视频数据的高度结构化与复杂性，如何将 DiT 扩展到视频生成领...

AIGC 2024-03-27 人工智能

867阅读

Stability AI开源3B代码生成模型：可补全，还能Debug

本周一，Stability AI 开源了小体量预训练模型 Stable Code Instruct 3B。 Stable Code Instruct 3B 是一个基于 Stable Code 3B 的指令调整编码语言模型（Code LM）。给出自然语言...

AIGC 2024-03-27 人工智能

841阅读

中国工程院院士唐志共：AI破解传统气动外形设计难题实现高效多样化创新

3月25日消息（赵婷婷）日前，在“昇思人工智能框架峰会2024”上，中国科学院院士、中国空气动力学会理事长唐志共表示，近年来，随着人工智能技术的高速发展，人工智能与科学计算的融合不断迸发出新的火花，形成AI的新范式。这种范式以物理驱动、物理+数据融...

人工智能 2024-03-26 人工智能

908阅读

继电动汽车之后，下一次汽车转型是否已经发生？

随着从内燃机汽车向电动汽车的转变从未消失，停在街边的汽车连接充电线如何迅速成为一种常见景象。而且似乎一些汽车制造商已经度过了过渡阶段。汽车数字化和计算机化是另一个重大转变，它拥有约1亿行代码和1,000多个半导体芯片，而且这一趋势还在持续增长。据估计，...

人工智能 2024-03-26 人工智能

803阅读

通用图大模型HiGPT：一己之力建模任何图结构关系！来自港大数据智能实验室&百度

一个模型建模所有图结构关系—— 香港大学数据智能实验室最新图结构大模型来了。它叫HiGPT，由GraphGPT原班人马打造。后者是将图数据与大模型结合的代表方法之一：通过用图指令微调将图数据与大模型对齐，在下游任务上一度彰显了惊人的泛化性（Zero...

人工智能 2024-03-26 人工智能

822阅读

CNN、Transformer、Uniformer之外，我们终于有了更高效的视频理解技术

视频理解的核心目标在于对时空表示的把握，这存在两个巨大挑战：短视频片段存在大量时空冗余和复杂的时空依赖关系。尽管曾经占主导地位的三维卷积神经网络 (CNN 和视频 Transformer 通过利用局部卷积或长距离注意力有效地应对其中之一的挑战，但它们在...

大数据 2024-03-26 人工智能

859阅读

利用MindsDB和Anyscale微调Mistral 7B模型

在我们为面向客户的聊天应用制作大语言模型 (LLM 时，预训练模型往往是很好的起点，但随着时间的推移，您可能希望去控制该模型聊天的整体行为和给客户带去的“感觉”，而不仅仅由基本模型所能提供。对此，我们虽然可以通过提示工程（prompt engineeri...

生成式AI 2024-03-26 人工智能

961阅读

3D版Sora来了？UMass、MIT等提出3D世界模型，具身智能机器人实现新里程碑

在最近的研究中，视觉-语言-动作（VLA，vision-language-action）模型的输入基本都是2D数据，没有集成更通用的3D物理世界。此外，现有的模型通过学习「感知到动作的直接映射」来进行动作预测，忽略了世界的动态性，以及动作和动态之间的关...

生成式AI 2024-03-26 人工智能

851阅读

AI 绘画 | Stable Diffusion 真实人物动漫二次元化

前言如何让一张真实人物变成动漫二次元风格的图片？Stable Diffusion WebUI加上contolNet扩展插件帮你快速实现。快来使用AI绘画打开异世界的大门吧！！！真人动漫化选择大模型首先选择一个二次元风格人物画风的大模型...

大数据 2024-03-26 人工智能

1877阅读

讨论下一个token预测时，我们可能正在走进陷阱

自香农在《通信的数学原理》一书中提出「下一个 token 预测任务」之后，这一概念逐渐成为现代语言模型的核心部分。最近，围绕下一个 token 预测的讨论日趋激烈。然而，越来越多的人认为，以下一个 token 的预测为目标只能得到一个优秀的「即兴表演艺...

人工智能 2024-03-25 人工智能

887阅读

剑桥团队开源：赋能多模态大模型RAG应用，首个预训练通用多模态后期交互知识检索器

论文链接：https://arxiv.org/abs/2402.08327 DEMO 链接：https://u60544-b8d4-53eaa55d.westx.seetacloud.com:8443/ 项目主页链接：https://preflm...

AIGC 2024-03-25 人工智能

1137阅读

3140参数Grok-1推理加速3.8倍，PyTorch+HuggingFace版来了

马斯克说到做到开源Grok-1，开源社区一片狂喜。但基于Grok-1做改动or商用，都还有点难题： Grok-1使用Rust+JAX构建，对于习惯Python+PyTorch+HuggingFace等主流软件生态的用户上手门槛高。 △图注：Grok登...

AIGC 2024-03-25 人工智能

828阅读

能玩3D游戏的AI玩家！谷歌新智能体SIMA发布，但水平还在“新手村”

编译 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）世界上第一位AI程序员Devin诞生，让大家纷纷转发感叹“饭碗保不住”。一转眼，具有里程碑意义的AI玩家也来了！谷歌（Google）旗下DeepMind发布新智能体SIMA。 S...

人工智能 2024-03-25 人工智能

909阅读

零样本6D物体姿态估计框架SAM-6D，向具身智能更进一步

物体姿态估计在许多现实世界应用中起到至关重要的作用，例如具身智能、机器人灵巧操作和增强现实等。在这一领域中，最先受到关注的任务是实例级别 6D 姿态估计，其需要关于目标物体的带标注数据进行模型训练，使深度模型具有物体特定性，无法迁移应用到新物体上。后来...

大数据 2024-03-25 人工智能

885阅读

32K上下文，Mistral 7B v0.2 基模型突然开源了

刚刚，Mistral AI 的模型又更新了。这次开源一如既往地「突然」，是在一个叫做 Cerebral Valley 的黑客松活动上公布的。 PPT 一翻页，全场都举起了手机拍照：这次开源的 Mistral 7B v0.2 Base Mod...

AIGC 2024-03-25 人工智能

728阅读

图像生成地表最强！Playground v2.5技术报告解读重磅来袭！超越SD、DALL·E 3和 Midjourney

文章链接：https://arxiv.org/pdf/2402.17245 模型地址： https://huggingface.co/playgroundai/playground-v2.5-1024px-aesthetic 本文分享了在文本到图像生成模...

AIGC 2024-03-25 人工智能

1221阅读

AIGC 实战：Ollama 和 Hugging Face 是什么关系？

HuggingFace（拥抱脸）和Ollama都与**大型语言模型（LLMs）**有关，但它们的用途不同： HuggingFace： HuggingFace 是一个知名的平台，提供各种预训练的LLMs，包括流行的模型如GPT-3、BERT和...

生成式AI 2024-03-24 人工智能

2045阅读

用Stable Diffusion生成同角色不同pose的人脸

随着技术的不断发展，我们现在可以使用稳定扩散技术（Stable Diffusion）来生成同一角色但不同姿势的人脸图片。本文将介绍这一方法的具体步骤，以及如何通过合理的提示语和模型选择来生成出更加真实和多样化的人脸图像。博客首发地址：用Stable D...

生成式AI 2024-03-24 人工智能

1127阅读

stable diffusion模型微调方法

文章目录 embeddings 准备训练集图片预处理裁剪打标签点击生成运行程序调节训练参数训练嵌入式模型使用微调模型进行生成 LoRA Kohya GUI 准备工作收集训练集图片预处理设置训练参数 Dream...

生成式AI 2024-03-23 人工智能

1235阅读

AI、AIGC、AGI、ChatGPT它们的区别？

今天咱们聊点热门话题，来点科普时间——AI、AIGC、AGI和ChatGPT到底是啥？这几个词听起来好像挺神秘的，但其实它们就在我们生活中。让我们一起探索这些术语的奥秘！ AI（人工智能）：先说说AI，这个大家可能都不陌生。AI，就是人工智能，它涵盖了各...

大数据 2024-03-23 人工智能

1468阅读

【八股】2024春招八股复习笔记1（搜索推荐、AIGC）

【八股】2024春招八股复习笔记1（搜索推荐、AIGC）文章目录 1、推荐系统 1.1 推荐系统流程 1.2 协同过滤、矩阵分解 1.3 逻辑回归 2、算法常识（应用算法） 2.1 重点复习 xgboost 2.2 大模型 t...

大数据 2024-03-23 人工智能

3226阅读

UniPAD：一种通用的自动驾驶预训练模式

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解 UniPAD研究了一个关键问题：如何有效地利用大量未标记的3D点云数据进行自监督学习，以增强其在3D目标检测和语义分割等下游任务中的应用效率。这个问题之所以重要，是...

AIGC 2024-03-22 人工智能

931阅读

大模型之Llama系列- LlaMA 2及LLaMA2_chat(上)

LlaMA 2是一个经过预训练与微调的基于自回归的transformer的LLMs，参数从7B至70B。同期推出的Llama 2-Chat是Llama 2专门为对话领域微调的模型。在许多开放的基准测试中Llama 2-Chat优于其他开源的聊天模型，此外...

AIGC 2024-03-22 人工智能

910阅读

Sora不开源，微软给你开源！全球最接近Sora视频模型诞生，12秒生成效果逼真炸裂

微软版Sora诞生了！ Sora虽爆火但闭源，给学术界带来了不小的挑战。学者们只能尝试使用逆向工程来对Sora复现或扩展。尽管提出了Diffusion Transformer和空间patch策略，但想要达到Sora的性能还是很难，何况还缺乏算力和数据集...

大数据 2024-03-22 人工智能

878阅读

微软NaturalSpeech语音合成推出第三代，网友惊呼：超自然！实至名归

文本到语音合成（Text to Speech，TTS）作为生成式人工智能（Generative AI 或 AIGC）的重要课题，在近年来取得了飞速发展。在大模型（LLM）时代下，语音合成技术能够扩展大模型的语音交互能力，更是受到了广泛的关注。多年来，微...

AIGC 2024-03-22 人工智能

743阅读

本地部署whisper模型（语音转文字）

Whisper是 OpenAI 2022年发布的一款语音预训练大模型，集成了多语种ASR、语音翻译、语种识别的功能。 Whisper使用弱监督训练的方法，可以直接进行多任务的学习 1. 安装ffmpeg 1.1 更新yum yum update...

人工智能 2024-03-22 人工智能

893阅读

文生图的基石CLIP模型的发展综述

CLIP的英文全称是Contrastive Language-Image Pre-training，即一种基于对比文本-图像对的预训练方法或者模型。CLIP是一种基于对比学习的多模态模型，CLIP的训练数据是文本-图像对：一张图像和它对应的文本描述，这里...

AIGC 2024-03-22 人工智能

995阅读

MIT研究员推新AI图片生成框架DMD：AI 单步生成高质量图像速度快30倍

在当今人工智能时代，计算机可以通过扩散模型生成自己的 “艺术”，逐步向嘈杂的初始状态添加结构，直到清晰的图像或视频出现。扩散模型突然变得异常受欢迎:输入几个词，即可体验现实与幻想交汇的梦幻景象。在幕后，这涉及一个复杂、耗时的过程，需要算法多次迭代才能完美...

生成式AI 2024-03-22 人工智能

831阅读

符尧大佬一作发文，仅改训练数据，就让LLaMa-2上下文长度扩展20倍！

引言：探索语言模型的长上下文能力近日，谷歌推出了Gemini Pro 1.5，将上下文窗口长度扩展到100万个tokens，目前领先世界。而其他语言模型也正在不断探索长上下文能力，也就是模型处理和理解超出其训练时所见上下文长度的能力。例如，一个模型可能...

生成式AI 2024-03-22 人工智能

984阅读