-
基于因果推断的推荐系统:回顾和前瞻
本次分享的主题为基于因果推断的推荐系统,回顾过去的相关工作,并提出本方向的未来展望。 为什么在推荐系统中需要使用因果推断技术?现有的研究工作用因果推断来解决三类问题(参见 Gao et al.的 TOIS 2023 论文 Causal Inference...
-
“梗王”大模型,靠讲笑话登上CVPR | 中山大学
谁能想到,只是让大模型讲笑话,论文竟入选了顶会CVPR! 没开玩笑,这还真真儿的是一项正儿八经的研究。 例如看下面这张图,如果让你根据它来讲个笑话或梗,你会想到什么? 现在的大模型看完后会说: 脑子短路。 再看一眼 蜘蛛侠 的海报,大模型会配一句“刚擦的...
-
效率狂增16倍!VRSO:纯视觉静态物体3D标注,打通数据闭环!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 标注之殇 静态物体检测(Static object detection,SOD),包括交通信号灯、导向牌和交通锥,大多数算法是数据驱动深度神经网络,需要大量的训练数据。现在的做法通常是对大量的训练样本...
-
史上首次,AI超越人类奥赛金牌得主!吴方法加持,30题做出27道破纪录
首位超越国际奥林匹克竞赛金牌得主的AI,刚刚诞生了! 印度理工学院海得拉巴分校、图宾根AI中心、剑桥大学的研究者发现—— 通过「吴方法」,可以让AI变成和人类数学奥赛银牌得主同样的水平,而「AI数学大师」AlphaGeometry,则直接超越了IMO金牌...
-
十个大型语言模型(LLM)常见面试问题和答案解析
今天我们来总结以下大型语言模型面试中常问的问题 一、哪种技术有助于减轻基于提示的学习中的偏见? A.微调 Fine-tuning B.数据增强 Data augmentation C.提示校准 Prompt calibration D.梯度裁剪 Gra...
-
文生图——stable diffusion生成有趣的动漫图像
Stable Diffusion是一个文本转图像的模型,由CompVis、Stability AI和LAION共同开发。它能够从一段简单的文本输入中快速生成相应的图像。此外,它还可以导入图像并配合文本对其进行处理。从技术角度来看,Stable Diffus...
-
生成式AI大模型之提示词工程实践
提示工程是一个新兴的领域,专注于开发、设计和优化提示,以增强 LLM 的输出,从而满足您的需求。它为您提供了一种引导模型的行为从而达到您想要实现的结果的方法。 提示工程与微调不同。在微调中,使用训练数据调整权重或参数,目标是优化成本函数。就计算时间和实...
-
Llama架构比不上GPT2?神奇token提升10倍记忆?
一个 7B 规模的语言模型 LLM 能存储多少人类知识?如何量化这一数值?训练时间、模型架构的不同将如何影响这一数值?浮点数压缩 quantization、混合专家模型 MoE、以及数据质量的差异 (百科知识 vs 网络垃圾 又将对 LLM 的知识容量...
-
美国新法案要AI公司透露用于训练AI模型受版权保护的作品
美国国会于周二提出了一项法案,旨在强制人工智能公司透露他们用于训练生成 AI 模型的受版权保护的材料。这项立法进一步加入了立法者、新闻机构和艺术家为了确定 AI 公司如何使用诸如歌曲、视觉艺术、书籍和电影等创作作品来训练他们的软件,并且这些公司是否违法侵犯...
-
【总结】在嵌入式设备上可以离线运行的LLM--Llama
文章目录 Llama 简介 运用 另一种:MLC-LLM 一个令人沮丧的结论在资源受限的嵌入式设备上无法运行LLM(大语言模型)。 一丝曙光:tinyLlama-1.1b(10.1亿参数,需要至少2.98GB的RAM) Llam...
-
破解36年前魔咒!Meta推出反向训练大法消除大模型「逆转诅咒」
【新智元导读】大语言模型的「逆转诅咒」,被解开了。近日,来自Meta FAIR的研究人员推出了反向训练大法,让模型从反方向上学到了事实之间的逻辑,终于改进了这个困扰人们已久的问题。 大语言模型的「逆转诅咒」,被解开了! 这个诅咒在去年9月首次被发现,一时间...
-
120亿Stable LM 2上线即开源!2万亿token训练,碾压Llama 2 70B
继16亿轻量级Stable LM 2推出之后,12B参数的版本在今天亮相了。 见状,不少网友纷纷喊话:干的漂亮!但,Stable Diffusion 3啥时候出啊? 总得来说,Stable LM 2 12B参数更多,性能更强。 120亿参数版本包含了...
-
一文了解人工智能如何让机器进行学习?
在《一文了解人工智能(AI)》文章中我们介绍了AI可以解决哪些复杂的问题。这些问题无法通过固定的规则进行解决,需要机器根据以往的事例进行比较评估,作出最终的判断。机器需要模仿人类对事物进行学习。 人类的学习过程可以拆分为以下几个阶段:感知、记忆、对比和...
-
RWKV 模型启动工具 RWKV Runner 进阶教程(下)
在 RWKV Runner 教程的上篇(新手教程),我们讲述了如何使用 RWKV Runner 本地部署并运行 RWKV 模型: RWKV模型启动工具RWKV Runner新手教程(上) 而在今天发布的教程下篇,我们将主要介绍 RWKV Runner...
-
破除36年前魔咒!Meta推出反向训练大法消除大模型「逆转诅咒」
大语言模型的「逆转诅咒」,被解开了! 这个诅咒在去年9月首次被发现,一时间引起LeCun、Karpathy、马库斯等一众大佬的惊呼。 因为风光无两、不可一世的大模型竟存在着“阿克琉斯之踵”:一个在「A是B」上训练的语言模型,并不能正确回答出「B是A」。...
-
融汇生成式人工智能,全面提升HPE Aruba Networking Central平台AIOps能力
美国德克萨斯州休斯顿-2024年4月8日-Hewlett Packard Enterprise(NYSE:HPE)日前宣布将在HPE Aruba Networking Central上集成多个生成式AI大语言模型,以拓展其AIOps网络管理能力。HPE...
-
Nightshade:使AI模型在未经许可的情况下无法训练图片
据报道,芝加哥大学的研究人员开发了一种名为Nightshade的工具,旨在防止未经许可的AI图像生成。该工具可以使AI图像生成器无法使用未经许可的图像进行训练,从而保护了艺术家和版权所有者的作品。 Nightshade的工作原理是在图像中添加隐藏信息,这...
-
你在小红书上关注的美女博主,可能是AI
在近年来,虚拟偶像、虚拟主播(VTuber)似乎已经不是什么新鲜事,人们就算没有成为虚拟偶像的粉丝,也一定都曾听说过初音未来的名字。只不过,一提及“初音未来们”,人们脑海里首先出现的标签或许还是“二次元”。但如今,在小红书等社交平台,一大批AI博主正凭借足...
-
标题:探索AI绘画:使用深度学习生成艺术
正文: 随着计算机技术的发展,人工智能在各个领域取得了显著的成果。 通过训练深度学习模型,AI可以学习大量的艺术作品,从而生成具有独特风格和创意的新作品。 本文将介绍如何使用Python和TensorFlow实现一个简单的AI绘画程序。...
-
大模型技术实践(二)|关于Llama 2你需要知道的那些事儿
在上期文章中,我们简要回顾了Llama模型的概况,本期文章我们将详细探讨【关于Llama 2】,你需要知道的那些事儿。 01-Llama 2的性能有多好? 作为Meta新发布的SOTA开源大型语言模型,Llama 2是Llama模型的延续和升级。Lla...
-
守护生成式人工智能之门,规避人工智能进化中的安全挑战
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 生成式人工智能(GenAI 代表了人工智能的一个重大飞跃,能够创建文本、音频、图像、代码等新颖而逼真的数据。虽然这项创新具有巨大的...
-
AIGC进入应用之争,谁能抢占流量入口?
文 | 智能相对论 作者 | 范柔丝 2023年卷了一年大模型之后,业内的普遍共识是,2024年将是AI大模型应用的浪潮年。 虽然底层模型技术还在爬坡,应用层普遍都处于早期阶段,但业内已经开始期待Killer App的出现。特别是年初Sora的横空出...
-
刚刚发布!一键生成动漫风格图片的开源模型
向大家介绍一个最新的AIGC开源项目——Animagine XL 3.1。这个项目是动漫主题文本到图像模型的最新迭代,旨在为用户提供更加优化和强大的动漫图像生成体验。 在Animagine XL 3.1中,开发团队着重优化了几个关键方面,以确保模型...
-
陶哲轩转发、菲尔兹奖得主领衔:AI正在颠覆数学家的工作方式
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 陶哲轩点赞转发,《美国数学学会通报》用一整期特刊介绍了AI给数学带来的改变。 这些文章读起来很有趣,尽管使我自己即将发表的一篇文章显得多...
-
阿里刚开源32B大模型,我们立马测试了“弱智吧”
阿里的通义千问(Qwen),终于拼齐了1.5系列的最后一块拼图—— 正式开源Qwen 1.5-32B。 话不多说,直接来看“成绩单”。 这次官方pick同台竞技的“选手”是Mixtral 8x7B模型和同为Qwen 1.5系列的72B模型。 从结果上...
-
机器学习如何提高商业智能
机器学习(ML 在商业智能(BI 的持续发展中发挥着关键作用。随着ML的出现,企业正在超越传统分析,采用更复杂的方法来解读庞大的数据集。本文探讨了ML为BI带来的革命,标志着从单纯的数据分析到预测洞察和决策策略的重大转变。 ML在BI中的集成 将ML集...
-
CVPR 2024满分论文,英伟达开源BOP排行榜6D物体姿态第一名方法
想了解更多AIGC的内容, 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 物体姿态估计对于各种应用至关重要,例如机器人操纵和混合现实。实例级方法通常需要纹理 CAD 模型来生成训练数据,并且不能应用于测试时未...
-
斯坦福团队新作:喊话就能指导机器人,任务成功率暴增,网友:特斯拉搞快点
斯坦福的ALOHA家务机器人团队,发布了最新研究成果—— 项目名为Yell At Your Robot(简称YAY),有了它,机器人的“翻车”动作,只要喊句话就能纠正了! 而且机器人可以随着人类的喊话动态提升动作水平、即时调整策略,并根据反馈持续自我改进...
-
太全了!多模态深度学习的综述!
1.介绍 我们对世界的体验是多模态的 —— 我们看到物体,听到声音,感觉到质地,闻到气味,尝到味道。模态是指某件事发生或经历的方式,当一个研究问题包含多个模态时,它就具有多模态的特征。为了让人工智能在理解我们周围的世界方面取得进展,它需要能够同时解释这些...
-
拒绝白人与亚洲人同框,Meta图像生成器的「歧视」,被人挖出来了
想了解更多AIGC的内容, 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 在人工智能构筑的世界中,AI 有时会像人一样存在着某种偏见或倾向性。比如对于大语言模型而言,由于训练数据的影响会不可避免地存在性别偏见...
-
大模型存储实践:性能、成本与多云
大模型应用领域的迅猛发展,也推动着基础技术领域持续探索和进步。文件存储服务在 AI 基础设施中成为不可或缺的重要部分。 在过去 18 个月的时间里,JuiceFS 团队与 MiniMax,阶跃星辰,智谱 AI,面壁智能,零一万物等大模型团队展开了交流与合...
-
你的自拍和聊天记录,正被硅谷大厂砸数十亿美元疯抢!
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 谁能想到,我们多年前的聊天记录、社交媒体上的陈年照片,忽然变得价值连城,被大科技公司争相疯抢。 现在,硅谷大厂们已经纷纷出动,买下所有能...
-
OpenAI 为训练 GPT-4模型转录了超过一百万小时的 YouTube 视频
AI 公司在获取高质量训练数据方面遇到的挑战,OpenAI 为了训练其最先进的大型语言模型 GPT-4,使用了超过一百万小时的 YouTube 视频副本。 据了解,该公司通过其 Whisper 音频转录模型转录这些视频,尽管这一做法在法律上具有争议性,Op...
-
AI日报:可以在手机上跑的大模型Octopusv2一夜爆火;90后小伙AI“复活”逝者订单超1000;OpenAI允许构建自定义模型;第一个具有情商的对话型AI来了
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ ???AI新鲜事 斯坦福推可以在...
-
谷歌DeepMind发布Gecko:专攻检索,与大7倍模型相抗衡
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 文本嵌入模型在自然语言处理中扮演着重要角色,为各种文本相关任务提供了强大的语义表示和计算能力。 在语义表示上,文本嵌入模型将文本转换为高...
-
[论文笔记]LLaMA: Open and Efficient Foundation Language Models
引言 今天带来经典论文 LLaMA: Open and Efficient Foundation Language Models 的笔记,论文标题翻译过来就是 LLaMA:开放和高效的基础语言模型。 LLaMA提供了不可多得的大模型开发思路,为很多国...
-
OpenAI 转录了超过一百万小时的 YouTube 视频来训练 GPT-4
近日,《华尔街日报》报道称,人工智能公司在收集高质量训练数据方面遇到了困难。随后,《纽约时报》详细介绍了一些公司处理这一问题的方法,其中涉及到了人工智能版权法的模糊灰色区域。 故事从OpenAI开始。该公司迫切需要训练数据,据报道开发了Whisper音频转...
-
报告称 OpenAI 采集了超一百万小时的 YouTube 视频来训练 GPT-4
IT之家 4 月 7 日消息,本周早些时候,《华尔街日报》报道称 AI 公司在收集高质量训练数据方面遇到了困难。今天,《纽约时报》详细介绍了 AI 公司处理此问题的一些方法,其中涉及到属于 AI 版权法模糊灰色区域的内容。 报道称,OpenAI 迫切需...
-
论文笔记:Llama 2: Open Foundation and Fine-Tuned Chat Models
导语 Llama 2 是之前广受欢迎的开源大型语言模型 LLaMA 的新版本,该模型已公开发布,可用于研究和商业用途。本文记录了阅读该论文的一些关键笔记。 链接:https://arxiv.org/abs/2307.09288 1 引言 大型语言...
-
AI写作查重率怎么降低:探索深度策略与优化实践
大家好,小发猫降重今天来聊聊AI写作查重率怎么降低:探索深度策略与优化实践,希望能给大家提供一点参考。 以下是针对论文重复率高的情况,提供一些修改建议和技巧,可以借助此类工具: AI写作查重率怎么降低:探索深度策略与优化实践 随着人工智能(AI)...
-
首个开源世界模型!百万级上下文,长视频理解吊打GPT-4,UC伯克利华人一作
想了解更多AIGC的内容, 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 首个开源「世界模型」来了! 来自UC berkeley的研究人员发布并开源了LWM(LargeWorldModel)系列模型: 论文...
-
Stable Diffusion【进阶篇】:如何实现人脸一致
大家好,我是程序员晓晓。 在AI绘画中,一直都有一个比较困难的问题,就是如何保证每次出图都是同一个人。今天就这个问题分享一些个人实践,大家和我一起来看看吧。 一. 有哪些实现方式 方式1:固定Seed种子值。 固定Seed种子值出来的图片人物确实可...
-
llama-factory简介
llamafactory是什么,能干什么 LLaMA-Factory 是一个易于使用的大规模语言模型(Large Language Model, LLM)微调框架,它支持多种模型,包括 LLaMA、BLOOM、Mistral、Baichuan、Qwen ...
-
什么是生成式AI?有哪些特征类型
生成式AI是人类一种人工智能技术,可以生成各种类型的内容,包括文本、图像、音频和合成数据。那么什么是人工智能?人工智能和机器学习之间的区别是什么?有哪些技术特征? 人工智能是一门学科,是计算机科学的一个分支,研究智能代理的创建,这些智能代理是可以推理、...
-
华为诺亚频域LLM「帝江」:仅需1/50训练成本,7B模型媲美LLaMA,推理加速5倍
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 基于 Transformer 架构的大语言模型在 NLP 领域取得了令人惊艳的效果,然而,Transformer 中自注意力带来的二次复...
-
还得是抖音,字节推出竖屏视频理解数据集,入选CVPR2024
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 短视频在当下社交媒体逐渐成为主导的视频格式。传统视频处理技术和研究一般都专注于横屏视频的理解和解析,而竖屏视频因其拍摄手法和内容重点不同...
-
AI帮写会重复吗?揭秘AI写作工具的重复率问题
大家好,小发猫降重今天来聊聊AI帮写会重复吗?揭秘AI写作工具的重复率问题,希望能给大家提供一点参考。 以下是针对论文重复率高的情况,提供一些修改建议和技巧,可以借助此类工具: AI帮写会重复吗?揭秘AI写作工具的重复率问题 在自媒体时代,AI写...
-
开源!超越ZoeDepth! DepthFM:快速且精确的单目深度估计!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 0. 这篇文章干了啥? 提出了DepthFM:一个多功能且快速的最先进的生成式单目深度估计模型。除了传统的深度估计任务外,DepthFM还展示了在深度修复等下游任务中的最先进能力。DepthFM效率高...
-
Meta LLaMA 2实操:从零到一搭建顶尖开源大语言模型【超详篇】
前言 本文章由 [jfj] 编写,所有内容均为原创。涉及的软件环境是在nvidia-docker环境进行的,如对docker未了解如何使用的,可以移步上一篇文章nvidia-docker安装详解。 在 nvidia-docker 容器中运行时,Dock...
-
好书推荐 《AIGC重塑金融》
作者:林建明 来源:IT 阅读排行榜 本文摘编自《AIGC 重塑金融:AI 大模型驱动的金融变革与实践》,机械工业出版社出版 这是最好的时代,也是最坏的时代。尽管大模型技术在金融领域具有巨大的应用潜力,但其应用也面临不容忽视的风险和挑战。本文将深入研...