数据集第47页 - AIGC资讯

提高LLaMA-7B的数学推理能力

概述这篇文章探讨了利用多视角微调方法提高数学推理的泛化能力。数学推理在相对较小的语言模型中仍然是一个挑战，许多现有方法倾向于依赖庞大但效率低下的大语言模型进行知识蒸馏。研究人员提出了一种避免过度依赖大语言模型的新方法，该方法通过有效利用具有不同注释格式...

人工智能 2023-12-29 人工智能

809阅读

MonoLSS：用于视觉3D检测训练中的样本选择

本文经自动驾驶之心公众号授权转载，转载请联系出处。 MonoLSS: Learnable Sample Selection For Monocular 3D Detection 论文链接：https://arxiv.org/pdf/2312.14474...

生成式AI 2023-12-29 人工智能

816阅读

字节具身智能新成果：用大规模视频数据训练GR-1，复杂任务轻松应对

最近 GPT 模型在 NLP 领域取得了巨大成功。GPT 模型首先在大规模的数据上预训练，然后在特定的下游任务的数据上微调。大规模的预训练能够帮助模型学习可泛化的特征，进而让其轻松迁移到下游的任务上。但相比自然语言数据，机器人数据是十分稀缺的。而且机器...

人工智能 2023-12-29 人工智能

827阅读

这次重生，AI要夺回网文界的一切

重生了，这辈子我重生成了 MidReal。一个可以帮别人写「网文」的 AI 机器人。这段时间里，我看到很多选题，偶尔也会吐槽一下。竟然有人让我写写 Harry Potter。拜托，难道我还能写的比 J・K・Rowling 更好不成？不过，...

生成式AI 2023-12-29 人工智能

845阅读

人工智能 | Llama大模型：与AI伙伴合二为一，共创趣味交流体验

Llama 大模型介绍我们介绍 LLaMA，这是一个基础语言模型的集合，参数范围从 7B 到 65B。我们在数万亿个Token上训练我们的模型，并表明可以专门使用公开可用的数据集来训练最先进的模型，而无需诉诸专有的和无法访问的数据集。特别是，LL...

AIGC 2023-12-28 人工智能

926阅读

【AIGC】图片生成的原理与应用

前言近两年 AI 发展非常迅速，其中的 AI 绘画也越来越火爆，AI 绘画在很多应用领域有巨大的潜力，AI 甚至能模仿各种著名艺术家的风格进行绘画。目前比较有名商业化的 AI 绘画软件有 Midjourney、DALL·E2、以及百度出品...

大数据 2023-12-28 人工智能

1289阅读

Gemini偷师文心一言？这一局，百度给中国大模型找回了面子！

大数据产业创新服务媒体 ——聚焦数据 · 改变商业在模型表现方面，百度文心一言、阿里通义千问、华为盘古、腾讯混元、科大讯飞星火等，都在说超过ChatGPT-3.5，马上要追上GPT-4，甚至在某些领域的表现超越了GPT-4。...

生成式AI 2023-12-28 人工智能

938阅读

数据闭环！DrivingGaussian：逼真环视数据，驾驶场景重建SOTA

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解北大王选计算机研究所的最新工作，提出了DrivingGaussian，一个高效、有效的动态自动驾驶场景框架。对于具有移动目标的复杂场景，首先使用增量静态3D高斯对整个...

生成式AI 2023-12-28 人工智能

984阅读

KwaiAgents体验入口快手AI模型工具app免费下载地址

KwaiAgents是由快手科技KwaiKEG开源的一系列智能体相关工作。这个工具集包括KAgentSys-Lite系统，它是Paper中KAgentSys系统的精简版；KAgentLMs系列模型，这是具备计划、反思、工具使用等智能体功能的大语言模型；KA...

AIGC 2023-12-28 人工智能

1024阅读

嵌入和矢量数据库实操指南

译者 | 布加迪审校 | 重楼这场革命的核心是矢量数据库概念，这一突破性发展正在重塑我们处理复杂数据的方式。与传统的关系数据库不同，这种数据库具有管理和处理高维矢量数据的独特功能，这种数据是许多AI 和机器学习应用所固有的。随着我们更深入研究先进AI...

大数据 2023-12-28 人工智能

1249阅读

【扩散模型Diffusion Model系列】0-从VAE开始（隐变量模型、KL散度、最大化似然与AIGC的关系）

VAE VAE(Variational AutoEncoder ，变分自编码器，是一种无监督学习算法，被用于压缩、特征提取和生成式任务。相比于GAN(Generative Adversarial Network ，VAE在数学上有着更加良好的性质，有利...

AIGC 2023-12-28 人工智能

896阅读

2024年我期待的五个AI故事

在OpenAI于2022年11月发布ChatGPT之后，我喜欢称之为AI新闻的持续“海啸”，我不必等待很长时间：从GPT-4和欧盟AI法案到AI搜索之战，开放与封闭AI之争，以及对训练数据和计算能力的渴望，我多次写下了所有这些话题。现在，距离新年只有...

大数据 2023-12-27 人工智能

1003阅读

Llama2推理RTX3090胜过4090，延迟吞吐量占优，但被A800远远甩开

大型语言模型 (LLM 在学界和业界都取得了巨大的进展。但训练和部署 LLM 非常昂贵，需要大量的计算资源和内存，因此研究人员开发了许多用于加速 LLM 预训练、微调和推理的开源框架和方法。然而，不同硬件和软件堆栈的运行时性能可能存在很大差异，这使得选...

人工智能 2023-12-27 人工智能

998阅读

微软推大模型整合性工具库PromptBench

微软最近推出了一个专门用于评估大语言模型的整合性工具库，名为PromptBench。该工具库提供了一系列工具，包括创建不同类型的提示、进行数据集和模型加载、执行对抗性提示攻击等，以支持研究人员从不同方面对LLMs进行评估和分析。项目地址:https:/...

AIGC 2023-12-27 人工智能

889阅读

大模型+机器人，详尽的综述报告来了，多位华人学者参与

大模型的出色能力有目共睹，而如果将它们整合进机器人，则有望让机器人拥有一个更加智能的大脑，为机器人领域带来新的可能性，比如自动驾驶、家用机器人、工业机器人、辅助机器人、医疗机器人、现场机器人和多机器人系统。预训练的大型语言模型（LLM）、大型视觉 -...

AIGC 2023-12-27 人工智能

909阅读

2024 年数据管理在人工智能中的四大趋势

在 2023 年即将结束之际，我们会发现随着 ChatGPT 的引入，世界发生了不可逆转的变化。人工智能的主流化继续以强劲势头推进，我们如何应对这些不断变化的时代需要信念的飞跃。人工智能可能同时具有潜在的变革性和不准确性！但我们的未来不仅仅是人工智能，因...

生成式AI 2023-12-27 人工智能

906阅读

得物大模型平台，业务效果提升实践

一、背景得物大模型训练与推理平台上线几个月后，我们与公司内部超过 10 个业务领域展开了全面的合作。在一些关键业务指标方面，取得了显著的成效，例如：效率相关部门的合作，多维度打标总正确率取得 2 倍以上提升。利用大模型开辟了新的业务，提升了效...

大数据 2023-12-27 人工智能

849阅读

ai绘画，初级召唤师教程

前言 novel ai是最近以世界上最大的二次元D站为数据集训练出来的一个ai，所以生成二次元风格图的效果很不错，其他的就一般般了。我自己生成的图例声明：以下内容仅代表个人观点如存在一些问题请联系笔者资源来源于互联网，仅供学习...

人工智能 2023-12-27 人工智能

923阅读

什么？NeRF还能提升BEV泛化性能！首个BEV跨域开源代码并首次完成Sim2Real！

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人总结鸟瞰图(Bird eye's view, BEV 检测是一种通过融合多个环视摄像头来进行检测的方法。目前算法大部分算法都是在相同数据集训练并且评测，这导致了这些算法过...

AIGC 2023-12-27 人工智能

1064阅读

超越BEVFusion！Lift-Attend-Splat：最新BEV LV融合方案

本文经自动驾驶之心公众号授权转载，转载请联系出处。论文：Lift-Attend-Splat: Bird’s-eye-view camera-lidar fusion using transformers 链接：https://arxiv.org/pd...

AIGC 2023-12-27 人工智能

860阅读

关于stable diffusion的embedding训练的一篇随笔

前言嗯，因为最近ai绘画很火啊，而且可以本地部署，很多人开始投喂ai然后画一些喜欢的东西，这是刚接触4天的笔记，那么我整理下目录，来展示一下这篇笔记都有什么吧。 1,绘画的关键词和反向关键词 2，调参，高清与面部修复 3，embeddin...

生成式AI 2023-12-27 人工智能

811阅读

百度文心一言，不做ChatGPT的中国翻版

‍数据智能产业创新服务媒体 ——聚焦数智 · 改变商业 3月16日，百度的文心一言终于正式邀请测试了。据李彦宏介绍，文心一言可以实现文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成等。通过观看直...

大数据 2023-12-26 人工智能

902阅读

量子人工智能的实践：现实世界的应用和用例

量子人工智能的实践：现实世界的应用和用例优化问题量子计算机的关键优势之一在于，其比经典计算机更有效地处理优化问题的能力。物流、金融和制造业等行业每天都在努力应对复杂的优化挑战。量子人工智能算法可以为路线优化、投资组合管理和供应链物流等问题找到最...

大数据 2023-12-26 人工智能

912阅读

处理不平衡数据的过采样技术对比总结

在不平衡数据上训练的分类算法往往导致预测质量差。模型严重偏向多数类，忽略了对许多用例至关重要的少数例子。这使得模型对于涉及罕见但高优先级事件的现实问题来说不切实际。过采样提供了一种在模型训练开始之前重新平衡类的方法。通过复制少数类数据点，过采样平衡了训...

生成式AI 2023-12-26 人工智能

905阅读

一文读懂常用的 “生成式 AI 库”

Hello folks，我是 Luga，今天我们继续来聊一下人工智能（AI）生态领域相关的技术 - GenerativeAI Library（生成式 AI 库），本文将继续聚焦在针对 Gen AI Library 的技术进行解析，使得大家能够了解 G...

AIGC 2023-12-26 人工智能

1260阅读

模型量化和边缘人工智能如何定义交互方式

人工智能与边缘计算的融合承诺为许多行业带来变革。模型量化的快速创新在这方面发挥着关键作用，模型量化是一种通过提高可移植性和减小模型大小来加快计算速度的技术。模型量化弥补了边缘设备的计算限制与部署高精度模型的需求之间的差距，以实现更快、更高效、更具成本效...

大数据 2023-12-26 人工智能

873阅读

华为诺亚的盘古Agent来了，让智能体学会结构化推理

自 AI 诞生以来，开发能够解决和适应复杂工作的多任务智能体（Agent）一直是个重要的目标。 AI 智能体对于许多应用至关重要，研究者通常用强化学习方法通过环境交互来培养智能体的决策技能。基于模型和无模型的深度强化学习方法都已取得了广为人们所知的成就，...

AIGC 2023-12-26 人工智能

973阅读

折射OpenAI新一年技术路线图，透视Sam Altman的12个愿望清单

当地时间12月24日，Sam Altman 在X 平台上罕见地发起了一个「许愿池」，「希望 OpenAI 在2024年构建/修复什么?」，这条推文迅速吸引 AI 领域众多大佬和网友的参与。两个小时后，Sam Altman 挑选了12个期望值最高的愿望清...

生成式AI 2023-12-26 人工智能

938阅读

大模型微调非得依赖人类数据吗？DeepMind：用带反馈的自训练更好

如你我所见，大语言模型（LLM）正在改变深度学习的格局，在生成人类质量的文本和解决各种语言任务方面展现出了卓越的能力。虽然业界通过对人类收集的数据进行监督微调进一步提升了在具体任务上的性能，但获取高质量人类数据却面临着重大瓶颈。这对于要解决复杂问题的任务...

人工智能 2023-12-26 人工智能

846阅读

你的云网络准备好拥抱生成式人工智能了吗?

生成式人工智能(AI 有可能为企业释放数万亿美元的价值，并从根本上改变我们的工作方式。这项突破性的技术已经进入了全球经济的几乎每个领域，以及我们生活的许多方面，人们已经使用人工智能来查询其银行账单，甚至要求医疗处方。当前的预测表明，生成式人工智能可以自动...

人工智能 2023-12-26 人工智能

882阅读

DrivingGaussian：逼真环视数据，驾驶场景重建SOTA

本文经自动驾驶之心公众号授权转载，转载请联系出处。原标题：DrivingGaussian: Composite Gaussian Splatting for Surrounding Dynamic Autonomous Driving Scenes...

大数据 2023-12-26 人工智能

921阅读

Chat、GPT-4 加上 Midjourney = 一个完美的团队？我可以使用这两种工具创建更好的 AI 图像吗？

每个使用 AI 的人都听说过 Chat GPT，我也听说过。当然，您可以将它用于不同的目的，但我立即想到将它用作 Midjourney 的文本提示编写器。我在 openai 网站上用我的电子邮件和电话号码注册了一个新帐户，然后开始玩。什么是“聊天...

生成式AI 2023-12-26 人工智能

869阅读

AIGC音乐生成#riff + diffusion 以生成频谱图图像来转换为音乐 | 无界日报第2期

小杜无界日报第2期，本期头条 - stable diffusion 微调模型 riff + diffusion 以生成频谱图图像来转换为音乐。无界日报 2022.12.16 第02期 - 头条 - riff +...

AIGC 2023-12-26 人工智能

970阅读

基于whisper模型的在线添加视频字幕网站（持续更新）

1.什么是whisper Whisper 是一个自动语音识别（ASR，Automatic Speech Recognition）系统，OpenAI 通过从网络上收集了 68 万小时的多语言（98 种语言）和多任务（multitask）监督数据对 Whi...

大数据 2023-12-26 人工智能

1432阅读

谷歌Bard更新中文支持；GPT-4：1.8万亿参数、混合专家模型揭秘； Meta推出商用版本AI模型

? AI新闻 ? 谷歌的AI聊天工具Bard更新，增加中文支持摘要：谷歌的AI聊天工具Bard新增中文环境，用户可以使用简体和繁体中文进行交流。然而，与竞品相比，Bard的回复略显生硬，语义理解还有待提升。此外，谷歌还更新了Bard的日志页面，新...

大数据 2023-12-26 人工智能

965阅读

AI绘画是什么？怎样提高AI绘画技巧

大家好，我是网媒智星，今天跟大家探讨一下AI绘画是什么？怎样才能提高AI绘画技巧的问题。随着人工智能技术的迅速发展，AI绘画已成为一项具有前瞻性的技术。在过去几年中，涌现出了许多功能强大的人工智能绘画工具，这些工具利用机器学习和计算机视觉技术，...

大数据 2023-12-25 人工智能

933阅读

LLM微调（四）| 微调Llama 2实现Text-to-SQL，并使用LlamaIndex在数据库上进行推理

Llama 2是开源LLM发展的一个巨大里程碑。最大模型及其经过微调的变体位居Hugging Face Open LLM排行榜（https://huggingface.co/spaces/HuggingFaceH4/open_llm_lea...

AIGC 2023-12-25 人工智能

920阅读

10条行之有效的实践途径，将ChatGPT融入开发

在不断变化的技术领域中，ChatGPT及其AI聊天机器人的同类产品正在引领潮流，获得全球的关注。这类产品正在通过提供被认为不可实现的独特价值主张，重新塑造行业格局。对于软件开发人员来说，这些机器人提供了无限的可能性。本文介绍开发人员如何利用AI聊天机器人...

生成式AI 2023-12-25 人工智能

880阅读

Python+AI实现AI绘画

? 运行环境：Python ? 撰写作者：左手の明天 ? 精选专栏：《python》 ? 推荐专栏：《算法研究》 ?#### 防伪水印——左手の明天 ####? ? 大家好???，我是左手の明天！好久不见? ?今天分享py...

人工智能 2023-12-25 人工智能

939阅读

AI视野：必应推出GPT-4Turbo模型；抖音测试“AI搜”功能；小红书内测AI聊天机器人；OpenAI计划新一轮融资

????大模型动态必应推出GPT-4Turbo模型微软推出Bing Chat的最新模型，GPT-4Turbo，为用户提供更准确和最新的信息。目前仅限部分用户试用，使用方法需通过检查资格确认。阿里团队推新AI模型I2VGen-XL 视频合成领域迎来...

人工智能 2023-12-25 人工智能

851阅读

一篇综述，看穿基础模型+机器人的发展路径

机器人是一种拥有无尽可能性的技术，尤其是当搭配了智能技术时。近段时间创造了许多变革性应用的大模型有望成为机器人的智慧大脑，帮助机器人感知和理解这个世界并制定决策和进行规划。近日，CMU 的 Yonatan Bisk 和 Google DeepMind...

大数据 2023-12-25 人工智能

900阅读

OCR终结了？旷视提出支持文档级OCR的多模态大模型，支持中英文，已开源！

想将一份文档图片转换成Markdown格式？以往这一任务需要文本识别、布局检测和排序、公式表格处理、文本清洗等多个步骤—— 这一次，只需一句话命令，多模态大模型Vary直接端到端输出结果：图片无论是中英文的大段文字：图片还是包含了公式的文档图片...

AIGC 2023-12-25 人工智能

1009阅读

Tracking Any Object Amodally ：让AI像人一样可以追踪任何对象

Tracking Any Object Amodally是由卡内基梅隆大学和丰田研究所开发的项目使得人工智能能够像人一样追踪物体的整体，即使在部分遮挡或不完全可见的情况下也能理解其完整结构。在这个项目中，计算机被训练成能够“理解”并追踪到部分遮挡物体的完...

人工智能 2023-12-25 人工智能

827阅读

机器学习模型性能的十个指标

尽管大模型非常强大，但是解决实践的问题也可以不全部依赖于大模型。一个不太确切的类比，解释现实中的物理现象，未必要用到量子力学。有些相对简单的问题，或许一个统计分布就足够了。对机器学习而言，也不用言必深度学习与神经网络，关键在于明确问题的边界。那么在...

AIGC 2023-12-25 人工智能

910阅读

Point Transformer V3：更简单、更快、更强!

本文经自动驾驶之心公众号授权转载，转载请联系出处。原标题：Point Transformer V3: Simpler, Faster, Stronger 论文链接：https://arxiv.org/pdf/2312.10035.pdf 代码链接：h...

生成式AI 2023-12-25 人工智能

1122阅读

阿里团队推新AI模型I2VGen-XL：单张静止图像就能生成高质量视频

视频合成最近取得了显著的进步，这得益于扩散模型的快速发展。然而，它在语义准确性、清晰度和时空连续性方面仍然存在挑战。它们主要源于文本-视频数据的稀缺性和视频的复杂固有结构，使得模型难以同时确保语义和定性的卓越性。阿里巴巴、浙江大学和华中科技大学的研究人员...

AIGC 2023-12-25 人工智能

834阅读

大火的AIGC是什么？能用到工作中哪些地方？

一.AIGC是什么？ AIGC（即Artificial Intelligence Generated Content），中文译为人工智能生成内容。简单来说，就是以前本来需要人类用思考和创造力才能完成的工作，现在可以利用人工智能技术来替代我们完成。在...

生成式AI 2023-12-24 人工智能

1326阅读

AI绘画中CLIP文本-图像预训练模型

介绍 OpenAI 在 2021 年提出了 CLIP（Contrastive Language–Image Pretraining）算法，这是一个先进的机器学习模型，旨在理解和解释图像和文本之间的关系。CLIP 的核心思想是通过大规模的图像和文本对进行...

AIGC 2023-12-24 人工智能

1048阅读

【AIGC】baichuan-7B大模型

百川智能｜开源可商用的大规模预训练语言模型baichuan-7B大模型概述 baichuan-7B 是由百川智能开发的一个开源可商用的大规模预训练语言模型。基于 Transformer 结构，在大约1.2万亿 tokens 上训练的70亿参数模型，支持...

人工智能 2023-12-24 人工智能

1052阅读

CMU权威对比Gemini，GPT-3和Mistral8×7B！GPT-3.5依旧拿捏Gemini，开源模型差距依然不小

谷歌最近发布的Gemini掀起了不小的波澜。毕竟，大语言模型领域几乎是OpenAI的GPT一家独大的局面。不过作为吃瓜群众，当然希望科技公司都卷起来，大模型都打起来！所以，作为科技巨无霸谷歌的亲儿子，Gemini自然承受了很高的期待。虽然Gemi...

大数据 2023-12-24 人工智能

1021阅读