-
两只羊驼掐头去尾拼一起,屠榜HuggingFace
HuggingFace开源大模型排行榜,又被屠榜了。 前排被清一色的SOLAR 10.7B微调版本占据,把几周之前的各种Mixtral 8x7B微调版本挤了下去。 SOLAR大模型什么来头? 相关论文刚刚上传到ArXiv,来自韩国公司Upstage A...
-
史上最大AI版权案深度分析!OpenAI必败,还是纽约时报胜率为0?
纽约时报起诉OpenAI和微软的案子,可能成为影响AI技术发展的里程碑式案例。 《纽约时报》作为西方传统媒体中影响力最大的机构之一,下场与代表AI技术「最先进生产力」的OpenAI开撕,本身就话题性十足。 图片 一位传统媒体人Jason Kint,在读完...
-
在自定义数据集上微调Alpaca和LLaMA
本文将介绍使用LoRa在本地机器上微调Alpaca和LLaMA,我们将介绍在特定数据集上对Alpaca LoRa进行微调的整个过程,本文将涵盖数据处理、模型训练和使用流行的自然语言处理库(如Transformers和hugs Face 进行评估。此外还将介...
-
用扩散模型监督NeRF,清华文生3D新方法成新SOTA
用文字合成3D图形的AI模型,又有了新的SOTA! 近日,清华大学刘永进教授课题组提出了一种基于扩散模型的文生3D新方式。 无论是不同视角间的一致性,还是与提示词的匹配度,都比此前大幅提升。 图片 文生3D是3D AIGC的热点研究内容,得到了学术界和工...
-
抗生素研究新突破!麻省理工用AI发现新抗生素类别 可对抗MRSA
最近,麻省理工大学的科学家们利用人工智能技术取得了突破性的发现,发现了一种新的抗生素类别,用于对抗耐药性金黄色葡萄球菌(MRSA)。60年来的抗生素研究已经有60多年没有取得重要的进展了,这是60年来发现的首个新型抗生素。该研究结果发表在了《自然》杂志上。...
-
提高LLaMA-7B的数学推理能力
概述 这篇文章探讨了利用多视角微调方法提高数学推理的泛化能力。数学推理在相对较小的语言模型中仍然是一个挑战,许多现有方法倾向于依赖庞大但效率低下的大语言模型进行知识蒸馏。研究人员提出了一种避免过度依赖大语言模型的新方法,该方法通过有效利用具有不同注释格式...
-
MonoLSS:用于视觉3D检测训练中的样本选择
本文经自动驾驶之心公众号授权转载,转载请联系出处。 MonoLSS: Learnable Sample Selection For Monocular 3D Detection 论文链接:https://arxiv.org/pdf/2312.14474...
-
字节具身智能新成果:用大规模视频数据训练GR-1,复杂任务轻松应对
最近 GPT 模型在 NLP 领域取得了巨大成功。GPT 模型首先在大规模的数据上预训练,然后在特定的下游任务的数据上微调。大规模的预训练能够帮助模型学习可泛化的特征,进而让其轻松迁移到下游的任务上。 但相比自然语言数据,机器人数据是十分稀缺的。而且机器...
-
这次重生,AI要夺回网文界的一切
重生了,这辈子我重生成了 MidReal。一个可以帮别人写「网文」的 AI 机器人。 这段时间里,我看到很多选题,偶尔也会吐槽一下。竟然有人让我写写 Harry Potter。拜托,难道我还能写的比 J・K・Rowling 更好不成?不过,...
-
人工智能 | Llama大模型:与AI伙伴合二为一,共创趣味交流体验
Llama 大模型介绍 我们介绍 LLaMA,这是一个基础语言模型的集合,参数范围从 7B 到 65B。我们在数万亿个Token上训练我们的模型,并表明可以专门使用公开可用的数据集来训练最先进的模型,而无需诉诸专有的和无法访问的数据集。特别是,LL...
-
【AIGC】图片生成的原理与应用
前言 近两年 AI 发展非常迅速,其中的 AI 绘画也越来越火爆,AI 绘画在很多应用领域有巨大的潜力,AI 甚至能模仿各种著名艺术家的风格进行绘画。 目前比较有名商业化的 AI 绘画软件有 Midjourney、DALL·E2、以及百度出品...
-
Gemini偷师文心一言?这一局,百度给中国大模型找回了面子!
大数据产业创新服务媒体 ——聚焦数据 · 改变商业 在模型表现方面,百度文心一言、阿里通义千问、华为盘古、腾讯混元、科大讯飞星火等,都在说超过ChatGPT-3.5,马上要追上GPT-4,甚至在某些领域的表现超越了GPT-4。...
-
数据闭环!DrivingGaussian:逼真环视数据,驾驶场景重建SOTA
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 北大王选计算机研究所的最新工作,提出了DrivingGaussian,一个高效、有效的动态自动驾驶场景框架。对于具有移动目标的复杂场景,首先使用增量静态3D高斯对整个...
-
KwaiAgents体验入口 快手AI模型工具app免费下载地址
KwaiAgents是由快手科技KwaiKEG开源的一系列智能体相关工作。这个工具集包括KAgentSys-Lite系统,它是Paper中KAgentSys系统的精简版;KAgentLMs系列模型,这是具备计划、反思、工具使用等智能体功能的大语言模型;KA...
-
嵌入和矢量数据库实操指南
译者 | 布加迪 审校 | 重楼 这场革命的核心是矢量数据库概念,这一突破性发展正在重塑我们处理复杂数据的方式。与传统的关系数据库不同,这种数据库具有管理和处理高维矢量数据的独特功能,这种数据是许多AI 和机器学习应用所固有的。随着我们更深入研究先进AI...
-
【扩散模型Diffusion Model系列】0-从VAE开始(隐变量模型、KL散度、最大化似然与AIGC的关系)
VAE VAE(Variational AutoEncoder ,变分自编码器,是一种无监督学习算法,被用于压缩、特征提取和生成式任务。相比于GAN(Generative Adversarial Network ,VAE在数学上有着更加良好的性质,有利...
-
2024年我期待的五个AI故事
在OpenAI于2022年11月发布ChatGPT之后,我喜欢称之为AI新闻的持续“海啸”,我不必等待很长时间:从GPT-4和欧盟AI法案到AI搜索之战,开放与封闭AI之争,以及对训练数据和计算能力的渴望,我多次写下了所有这些话题。 现在,距离新年只有...
-
Llama2推理RTX3090胜过4090,延迟吞吐量占优,但被A800远远甩开
大型语言模型 (LLM 在学界和业界都取得了巨大的进展。但训练和部署 LLM 非常昂贵,需要大量的计算资源和内存,因此研究人员开发了许多用于加速 LLM 预训练、微调和推理的开源框架和方法。然而,不同硬件和软件堆栈的运行时性能可能存在很大差异,这使得选...
-
微软推大模型整合性工具库PromptBench
微软最近推出了一个专门用于评估大语言模型的整合性工具库,名为PromptBench。该工具库提供了一系列工具,包括创建不同类型的提示、进行数据集和模型加载、执行对抗性提示攻击等,以支持研究人员从不同方面对LLMs进行评估和分析。 项目地址:https:/...
-
大模型+机器人,详尽的综述报告来了,多位华人学者参与
大模型的出色能力有目共睹,而如果将它们整合进机器人,则有望让机器人拥有一个更加智能的大脑,为机器人领域带来新的可能性,比如自动驾驶、家用机器人、工业机器人、辅助机器人、医疗机器人、现场机器人和多机器人系统。 预训练的大型语言模型(LLM)、大型视觉 -...
-
2024 年数据管理在人工智能中的四大趋势
在 2023 年即将结束之际,我们会发现随着 ChatGPT 的引入,世界发生了不可逆转的变化。人工智能的主流化继续以强劲势头推进,我们如何应对这些不断变化的时代需要信念的飞跃。人工智能可能同时具有潜在的变革性和不准确性!但我们的未来不仅仅是人工智能,因...
-
得物大模型平台,业务效果提升实践
一、背景 得物大模型训练与推理平台上线几个月后,我们与公司内部超过 10 个业务领域展开了全面的合作。在一些关键业务指标方面,取得了显著的成效,例如: 效率相关部门的合作,多维度打标总正确率取得 2 倍以上提升。利用大模型开辟了新的业务,提升了效...
-
ai绘画,初级召唤师教程
前言 novel ai是最近以世界上最大的二次元D站为数据集训练出来的一个ai,所以生成二次元风格图的效果很不错,其他的就一般般了。 我自己生成的图例 声明: 以下内容仅代表个人观点 如存在一些问题请联系笔者 资源来源于互联网,仅供学习...
-
什么?NeRF还能提升BEV泛化性能!首个BEV跨域开源代码并首次完成Sim2Real!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人总结 鸟瞰图(Bird eye's view, BEV 检测是一种通过融合多个环视摄像头来进行检测的方法。目前算法大部分算法都是在相同数据集训练并且评测,这导致了这些算法过...
-
超越BEVFusion!Lift-Attend-Splat:最新BEV LV融合方案
本文经自动驾驶之心公众号授权转载,转载请联系出处。 论文:Lift-Attend-Splat: Bird’s-eye-view camera-lidar fusion using transformers 链接:https://arxiv.org/pd...
-
关于stable diffusion的embedding训练的一篇随笔
前言 嗯,因为最近ai绘画很火啊,而且可以本地部署,很多人开始投喂ai然后画一些喜欢的东西,这是刚接触4天的笔记,那么我整理下目录,来展示一下这篇笔记都有什么吧。 1,绘画的关键词和反向关键词 2,调参,高清与面部修复 3,embeddin...
-
百度文心一言,不做ChatGPT的中国翻版
数据智能产业创新服务媒体 ——聚焦数智 · 改变商业 3月16日,百度的文心一言终于正式邀请测试了。 据李彦宏介绍,文心一言可以实现文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成等。 通过观看直...
-
量子人工智能的实践:现实世界的应用和用例
量子人工智能的实践:现实世界的应用和用例 优化问题 量子计算机的关键优势之一在于,其比经典计算机更有效地处理优化问题的能力。物流、金融和制造业等行业每天都在努力应对复杂的优化挑战。量子人工智能算法可以为路线优化、投资组合管理和供应链物流等问题找到最...
-
处理不平衡数据的过采样技术对比总结
在不平衡数据上训练的分类算法往往导致预测质量差。模型严重偏向多数类,忽略了对许多用例至关重要的少数例子。这使得模型对于涉及罕见但高优先级事件的现实问题来说不切实际。 过采样提供了一种在模型训练开始之前重新平衡类的方法。通过复制少数类数据点,过采样平衡了训...
-
一文读懂常用的 “生成式 AI 库”
Hello folks,我是 Luga,今天我们继续来聊一下人工智能(AI)生态领域相关的技术 - GenerativeAI Library(生成式 AI 库) ,本文将继续聚焦在针对 Gen AI Library 的技术进行解析,使得大家能够了解 G...
-
模型量化和边缘人工智能如何定义交互方式
人工智能与边缘计算的融合承诺为许多行业带来变革。模型量化的快速创新在这方面发挥着关键作用,模型量化是一种通过提高可移植性和减小模型大小来加快计算速度的技术。 模型量化弥补了边缘设备的计算限制与部署高精度模型的需求之间的差距,以实现更快、更高效、更具成本效...
-
华为诺亚的盘古Agent来了,让智能体学会结构化推理
自 AI 诞生以来,开发能够解决和适应复杂工作的多任务智能体(Agent)一直是个重要的目标。 AI 智能体对于许多应用至关重要,研究者通常用强化学习方法通过环境交互来培养智能体的决策技能。基于模型和无模型的深度强化学习方法都已取得了广为人们所知的成就,...
-
折射OpenAI新一年技术路线图,透视Sam Altman的12个愿望清单
当地时间12月24日,Sam Altman 在X 平台上罕见地发起了一个「许愿池」, 「希望 OpenAI 在2024年构建/修复什么?」,这条推文迅速吸引 AI 领域众多大佬和网友的参与。 两个小时后,Sam Altman 挑选了12个期望值最高的愿望清...
-
大模型微调非得依赖人类数据吗?DeepMind:用带反馈的自训练更好
如你我所见,大语言模型(LLM)正在改变深度学习的格局,在生成人类质量的文本和解决各种语言任务方面展现出了卓越的能力。虽然业界通过对人类收集的数据进行监督微调进一步提升了在具体任务上的性能,但获取高质量人类数据却面临着重大瓶颈。这对于要解决复杂问题的任务...
-
你的云网络准备好拥抱生成式人工智能了吗?
生成式人工智能(AI 有可能为企业释放数万亿美元的价值,并从根本上改变我们的工作方式。这项突破性的技术已经进入了全球经济的几乎每个领域,以及我们生活的许多方面,人们已经使用人工智能来查询其银行账单,甚至要求医疗处方。当前的预测表明,生成式人工智能可以自动...
-
DrivingGaussian:逼真环视数据,驾驶场景重建SOTA
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:DrivingGaussian: Composite Gaussian Splatting for Surrounding Dynamic Autonomous Driving Scenes...
-
Chat、GPT-4 加上 Midjourney = 一个完美的团队?我可以使用这两种工具创建更好的 AI 图像吗?
每个使用 AI 的人都听说过 Chat GPT,我也听说过。当然,您可以将它用于不同的目的,但我立即想到将它用作 Midjourney 的文本提示编写器。 我在 openai 网站上用我的电子邮件和电话号码注册了一个新帐户,然后开始玩。 什么是“聊天...
-
AIGC音乐生成#riff + diffusion 以生成频谱图图像来转换为音乐 | 无界日报 第2期
小杜 无界日报第2期,本期头条 - stable diffusion 微调模型 riff + diffusion 以生成频谱图图像来转换为音乐。 无界日报 2022.12.16 第02期 - 头条 - riff +...
-
基于whisper模型的在线添加视频字幕网站(持续更新)
1.什么是whisper Whisper 是一个自动语音识别(ASR,Automatic Speech Recognition)系统,OpenAI 通过从网络上收集了 68 万小时的多语言(98 种语言)和多任务(multitask)监督数据对 Whi...
-
谷歌Bard更新中文支持;GPT-4:1.8万亿参数、混合专家模型揭秘; Meta推出商用版本AI模型
? AI新闻 ? 谷歌的AI聊天工具Bard更新,增加中文支持 摘要:谷歌的AI聊天工具Bard新增中文环境,用户可以使用简体和繁体中文进行交流。然而,与竞品相比,Bard的回复略显生硬,语义理解还有待提升。此外,谷歌还更新了Bard的日志页面,新...
-
AI绘画是什么?怎样提高AI绘画技巧
大家好,我是网媒智星,今天跟大家探讨一下AI绘画是什么?怎样才能提高AI绘画技巧的问题。 随着人工智能技术的迅速发展,AI绘画已成为一项具有前瞻性的技术。在过去几年中,涌现出了许多功能强大的人工智能绘画工具,这些工具利用机器学习和计算机视觉技术,...
-
LLM微调(四)| 微调Llama 2实现Text-to-SQL,并使用LlamaIndex在数据库上进行推理
Llama 2是开源LLM发展的一个巨大里程碑。最大模型及其经过微调的变体位居Hugging Face Open LLM排行榜(https://huggingface.co/spaces/HuggingFaceH4/open_llm_lea...
-
10条行之有效的实践途径,将ChatGPT融入开发
在不断变化的技术领域中,ChatGPT及其AI聊天机器人的同类产品正在引领潮流,获得全球的关注。这类产品正在通过提供被认为不可实现的独特价值主张,重新塑造行业格局。对于软件开发人员来说,这些机器人提供了无限的可能性。本文介绍开发人员如何利用AI聊天机器人...
-
Python+AI实现AI绘画
? 运行环境:Python ? 撰写作者:左手の明天 ? 精选专栏:《python》 ? 推荐专栏:《算法研究》 ?#### 防伪水印——左手の明天 ####? ? 大家好???,我是左手の明天!好久不见? ?今天分享py...
-
AI视野:必应推出GPT-4Turbo模型;抖音测试“AI搜”功能;小红书内测AI聊天机器人;OpenAI计划新一轮融资
????大模型动态 必应推出GPT-4Turbo模型 微软推出Bing Chat的最新模型,GPT-4Turbo,为用户提供更准确和最新的信息。目前仅限部分用户试用,使用方法需通过检查资格确认。 阿里团队推新AI模型I2VGen-XL 视频合成领域迎来...
-
一篇综述,看穿基础模型+机器人的发展路径
机器人是一种拥有无尽可能性的技术,尤其是当搭配了智能技术时。近段时间创造了许多变革性应用的大模型有望成为机器人的智慧大脑,帮助机器人感知和理解这个世界并制定决策和进行规划。 近日,CMU 的 Yonatan Bisk 和 Google DeepMind...
-
OCR终结了?旷视提出支持文档级OCR的多模态大模型,支持中英文,已开源!
想将一份文档图片转换成Markdown格式? 以往这一任务需要文本识别、布局检测和排序、公式表格处理、文本清洗等多个步骤—— 这一次,只需一句话命令,多模态大模型Vary直接端到端输出结果: 图片 无论是中英文的大段文字: 图片 还是包含了公式的文档图片...
-
Tracking Any Object Amodally :让AI像人一样可以追踪任何对象
Tracking Any Object Amodally是由卡内基梅隆大学和丰田研究所开发的项目使得人工智能能够像人一样追踪物体的整体,即使在部分遮挡或不完全可见的情况下也能理解其完整结构。 在这个项目中,计算机被训练成能够“理解”并追踪到部分遮挡物体的完...
-
机器学习模型性能的十个指标
尽管大模型非常强大, 但是解决实践的问题也可以不全部依赖于大模型。一个不太确切的类比,解释现实中的物理现象,未必要用到量子力学。有些相对简单的问题,或许一个统计分布就足够了。对机器学习而言, 也不用言必深度学习与神经网络,关键在于明确问题的边界。 那么在...
-
Point Transformer V3:更简单、更快、更强!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:Point Transformer V3: Simpler, Faster, Stronger 论文链接:https://arxiv.org/pdf/2312.10035.pdf 代码链接:h...