-
央视财经推出两会AI主播,蚂蚁灵境数字人平台技术支持
还记得杭州亚运会开幕式点燃主火炬环节,让世界惊艳的“数字火炬手”吗?如今,用“同款”技术打造的AI主播在央视财经亮相了! (央视财经客户端上线两会AI主播) 今年两会,央视财经新媒体以总台央视主持人郭若天、孟湛东为原型“复刻”了AI主播——小天、小东。两...
-
GPT-4时代已过?全球网友实测Claude 3,只有震撼
大模型的纯文本方向,已经卷到头了? 昨晚,OpenAI 最大的竞争对手 Anthropic 发布了新一代 AI 大模型系列 ——Claude 3。 该系列包含三个模型,按能力由弱到强排列分别是 Claude 3 Haiku、Claude 3 Sonnet...
-
Cohere 与埃森哲合作加速企业 AI 应用
Cohere 很高兴宣布与 埃森哲合作,旨在将我们最先进的 Command 和 Embed 模型以及业界领先的检索增强生成(RAG)功能带给企业,助力企业跨部门推广生成式人工智能的应用。这两家公司将联手为企业提供由 Cohere 的旗舰专有生成 LLM 模...
-
0.5秒,无需GPU,Stability AI与华人团队VAST开源单图生成3D模型TripoSR
最近,文生视频模型 Sora 掀起了新一轮生成式 AI 模型浪潮,模型的多模态能力引起广泛关注。 现在,AI 模型在 3D 内容生成方面又有了新突破。 专长于视觉内容生成的 Stability AI 继图片生成(Stable Difussion 3 上线...
-
谷歌发布最新「读屏」AI!PaLM 2-S自动生成数据,多项理解任务刷新SOTA
【新智元导读】谷歌在语言和声控计算机界面的漫长道路上又迈出了重要一步。最新ScreenAI视觉语言模型,能够完成各种屏幕QA问答、总结摘要等任务。 每个人想要的大模型,是真·智能的那种...... 这不,谷歌团队就做出来了一个强大的「读屏」AI。 研究人员...
-
AI辅写疑似度多少正常:探索智能写作的边界
大家好,小发猫降ai今天来聊聊AI辅写疑似度多少正常:探索智能写作的边界,希望能给大家提供一点参考。降ai辅写 以下是针对论文AI辅写率高的情况,提供一些修改建议和技巧,可以借助此类工具: 还有: AI辅写疑似度多少正常:探索智能写作的边界...
-
xiunobbs采集技巧与最佳实践
由于“xiunobbs采集”似乎是一个特定的主题或术语,但在我的训练数据中没有明确的上下文或广泛认可的定义,因此我将根据一般的理解和可能的应用场景来构建这篇文章。请注意,这篇文章将是假设性的,并且会努力达到1500字的要求。---标题:探索xiunobbs...
-
全面超越GPT-4,Claude 3终于来了,有大学生智商,支持百万token
大模型的纯文本方向,已经卷到头了? 刚刚,OpenAI 最大的竞争对手 Anthropic 发布了新一代 AI 大模型系列 ——Claude3。 该系列包含三个模型,按能力由弱到强排列分别是 Claude3Haiku、Claude3Sonnet 和 Cla...
-
DeepMind携Mamba华人作者推Transformer革命之作!性能暴涨媲美Llama 2,推理能效大幅碾压
Transformer又又又被挑战了! 这次的挑战者来自大名鼎鼎的谷歌DeepMind,并且一口气推出了两种新架构,——Hawk和Griffin。 论文地址:https://arxiv.org/abs/2402.19427 这种将门控线性RNN与局部注...
-
Beeble AI与纽约大学合作 发布创新的人像重照明技术SwitchLight
近日,Beeble AI与纽约大学联手发布了一项新的研究成果,一种创新的人像重照明技术。这项技术能够在非常低的成本下,将人物与虚拟环境的光照完美融合,效果令人印象深刻。 论文地址:https://arxiv.org/pdf/2402.18848.pdf...
-
从AI推理性能优化角度看LLaMA的模型结构和源码
本篇文章讲讲LLaMA的结构,已经有很多文章已经对LLaMA在一些结构上任务表现上做了一些解析,本文主要从优化的角度、实现kernel的角度解析一下LLaMA,读者事先对transformer的结构有基本认识最好。本文首发于我的公众号“AI不止算法”,文章...
-
AI帮写会重复吗:解析AI写作工具的独特性与重复性
大家好,小发猫降ai今天来聊聊AI帮写会重复吗:解析AI写作工具的独特性与重复性,希望能给大家提供一点参考。降ai辅写 以下是针对论文AI辅写率高的情况,提供一些修改建议和技巧,可以借助此类工具: 还有: AI帮写会重复吗:解析AI写作工具的...
-
前沿资讯!文心一言和ChatGPT最全对比!
文心一言和ChatGPT都是基于深度学习技术的自然语言处理模型,有各自的优势和使用场景,无法简单地比较 ChatGPT 和文心一言哪一个功能更强大,它们各自具有优势和局限性,需要根据具体需求进行选择,以下一些具体对比: 为方便观看,...
-
揭秘AI写作疑似度检测:从困惑到明晰的七大秘籍
大家好,今天来聊聊揭秘AI写作疑似度检测:从困惑到明晰的七大秘籍,希望能给大家提供一点参考。 以下是针对论文重复率高的情况,提供一些修改建议和技巧,可以借助此类工具: 标题:揭秘AI写作疑似度检测:从困惑到明晰的七大秘籍 随着AI技术的普及,AI...
-
十分钟读完 Meta提出Llama 2模型的经典论文:Llama 2: Open Foundation and Fine-Tuned Chat Models
超越GPT-3:Meta AI发布新一代开源人工智能对话大模型Llama 2 引言:介绍 Llama 2 的发布背景和其在对话用例中的优化。 随着人工智能技术的飞速发展,大型语言模型(LLMs)已经成为了人类智能助手的代表,它们在需要专业知识的复杂推理...
-
AIGC专题:2023生成式人工智能发展与监管白皮书-中国AI治理的独立思考
今天分享的是AIGC系列深度研究报告:《AIGC专题:2023生成式人工智能发展与监管白皮书-中国AI治理的独立思考》。 (报告出品方:南方财经全媒体集团) 报告共计:42页 来源:人工智能学派 发展:生成式 AI 治理的第一视角 2022年 1...
-
Stable Diffusion 训练
文章目录 前言 一、主要训练方式 二、kohya_ss安装(Linux 1.打开终端并切换到所需的安装目录 2.通过运行以下命令克隆存储库 3.切换到kohya_ss目录 4.通过执行命令来运行安装脚本 5.安装完成后,在kohya_ss目...
-
对抗「概念飘逸」难题!谷歌发布全新时间感知框架:图像识别准确率提升15%
在机器学习领域,概念漂移(concept drift)问题长期困扰着研究者,即数据分布随时间发生变化,使得模型难以持续有效。 一个显著的例子是CLEAR非稳态学习基准的图像展示,它揭示了物体视觉特征在十年间发生的显著变化。 这种现象被称为「缓慢的概念漂移...
-
OpenAI或用3D引擎/虚幻引擎训练视频模型Sora
OpenAI最近发布了多段由Sora生成的视频,展示了令人惊叹的3D效果。这些视频内容丰富,包括潜水探索沉船、描述日本江户时代宁静场景的立体模型等。 除此之外,Sora还展示了一些新功能,比如无缝衔接。这意味着在两个输入视频之间可以逐渐进行插值,呈现出更加...
-
【AIGC】AutoKeras 进行 RNN 循环神经网络训练
由于最近这些天都在人工审查之前的哪些问答数据,所以迟迟都没有更新 AutoKeras 的训练结果。现在那部分数据都已经整理好了,20w+ 的数据最后能够使用的高质量数据只剩下 2k+。这 2k+ 的数据已经经过数据校验并且对部分问题的提问方式和答案内容进行...
-
如何使用小型自动生成的数据集训练编码LLM
译者 | 李睿 审校 | 重楼 虽然像GPT-4这样的大型语言模型(LLM 在编写软件代码方面非常精通,但是这些模型的成本和不透明性激发了人们对更加经济、规模更小的编码LLM的兴趣。 这些替代方案可以针对特定任务进行微调,并且成本很低。开发这些LLM的...
-
使用Rust的Linfa和Polars库进行机器学习:线性回归
在这篇文章中,我们将使用Rust的Linfa库和Polars库来实现机器学习中的线性回归算法。 Linfa crate旨在提供一个全面的工具包来使用Rust构建机器学习应用程序。 Polars是Rust的一个DataFrame库,它基于Apache Ar...
-
陈丹琦团队新作:Llama-2上下文扩展至128k,10倍吞吐量仅需1/6内存
陈丹琦团队刚刚发布了一种新的LLM上下文窗口扩展方法: 它仅用8k大小的token文档进行训练,就能将Llama-2窗口扩展至128k。 最重要的是,在这个过程中,只需要原来1/6的内存,模型就获得了10倍吞吐量。 除此之外,它还能大大降低训练成本:...
-
英伟达、Hugging Face和ServiceNow发布用于代码生成的新StarCoder2 LLM
这些模型目前有三种不同的大小,已经在600多种编程语言(包括低资源语言 上进行了培训,以帮助企业在其开发工作流中加速各种与代码相关的任务,它们是在开放的BigCode项目下开发的,该项目是ServiceNow和Huging Face联合发起的,以确保...
-
英伟达发布Nemotron-4:150亿参数通用大模型,目标单张A100/H100可跑
英伟达最新推出的Nemotron-4语言模型引起广泛关注。这一通用大模型拥有150亿参数,经过在8T token上的训练,在英语、多语言和编码任务中表现出色。具体而言,Nemotron-4在7个评估基准上的15B模型表现优异,超越同等参数规模的模型,甚至击...
-
AI写作:探索人类文字的边界
大家好,今天来聊聊AI写作:探索人类文字的边界,希望能给大家提供一点参考。 以下是针对论文重复率高的情况,提供一些修改建议和技巧,可以借助此类工具: AI写作:探索人类文字的边界 在信息爆炸的时代,AI写作已经从科幻概念逐渐成为我们生活的一部分。...
-
英伟达最强通用大模型Nemotron-4登场!15B击败62B,目标单张A100/H100可跑
最近,英伟达团队推出了全新的模型Nemotron-4,150亿参数,在8T token上完成了训练。 值得一提的是,Nemotron-4在英语、多语言和编码任务方面令人印象深刻。 论文地址:https://arxiv.org/abs/2402.1681...
-
厦门大学、Intel、大疆联合出品,从网络视频中学习零样本图像匹配大模型
图像匹配是计算机视觉的一项基础任务,其目标在于估计两张图像之间的像素对应关系。图像匹配是众多视觉应用如三维重建、视觉定位和神经渲染 (neural rendering 等的基础和前置步骤,其精确度和效率对于后续处理十分重要。 传统算法(SIFT)在面临...
-
谷歌豪掷6000万美元买「美版贴吧」数据,只为训AI模型!Altman竟是第三大股东
破案了! 上周,Reddit被发现签署了一项价值6000万美元的协议,允许一家不知名公司访问其用户内容,来训练AI模型。 今天大家发现,Reddit数据的神秘买家,居然就是谷歌? 图片 目前,双方已同时官宣达成合作协议:Reddit的数据将帮助谷歌训练A...
-
报道称,Tumblr 所有者正在与 OpenAI 和 Midjourney 就训练数据达成协议
Tumblr 和 WordPress.com 的所有者 Automattic 正与 AI 公司 Midjourney 和 OpenAI 就提供用户帖子的训练数据进行谈判。 据报道,Automattic 计划推出一个新设置,允许用户选择退出与第三方(包括 A...
-
探索生成式人工智能和云的相互优势
近年来对生成式人工智能和云融合的兴趣是有原因的。生成人工智能(AI 和云计算都彻底改变了IT格局,分别重塑了行业并为新技术工具提供了前所未有的功能。让我们探讨一下生成式人工智能对云的深远影响,以及云如何赋能和增强生成式人工智能的能力。 云为业务用例释放...
-
Sora阴影之下,焦虑的中国AI
“跟不上的可能就要被淘汰了。”看到Sora演示视频后,从业10多年的动画制作师黄斌得出了这样的判断。 随着影视业失业潮呼声渐起,Sora的诞生也给中国AI行业带来了巨大的焦虑。 360集团创始人周鸿祎认为,Sora模型展现出了超越当前中国同类产品的性能...
-
OpenAI:纽约时报雇黑客攻击我
堂堂AI巨头,怎么就被一家报纸雇黑客攻击了? 《纽约时报》诉OpenAI侵犯版权索赔数十亿美元案最新进展: 在最新提交的法庭文件中,OpenAI声称《纽约时报》花钱找黑客攻击ChatGPT,人为制造侵权结果。 使用欺骗性手段进行数万次尝试,才得到高度异常...
-
copilot和chatGPT的区别
区别: Copilot和ChatGPT是由OpenAI开发的两个不同的工具,用于不同的任务和场景。以下是它们的主要区别: 用途: ChatGPT: ChatGPT是一个生成式语言模型,设计用于与用户进行自然语言交互。它被训练用于回答用户提...
-
谷歌豪掷6000万美元购买Reddit 数据 用来训练AI模型
Reddit 最近宣布与一家未透露的公司签署了一份价值6000万美元的合作协议,允许对 Reddit 用户内容进行访问以训练 AI 模型。而后,揭晓这家神秘公司正是谷歌。 图源备注:图片由AI生成,图片授权服务商Midjourney 根据合同,谷歌每年将...
-
微软推出用于发现AI模型风险的工具PyRIT
微软公司一个负责利用黑客手段发现网络安全问题的团队开源了一个内部工具PyRIT,该工具可以帮助开发人员发现人工智能模型中的风险。 研究人员于本周四发布了该框架的代码。微软表示,PyRIT可以自动生成数以千计的对抗性人工智能提示,来测试神经网络能否有效抵...
-
“谷歌版Sora”被嘲画质好糊,但在世界模拟器上又前进了一步
谷歌110亿参数Genie,用来打造交互虚拟世界,它来了! 划重点:不受视频监督训练;只用给它单张图像,就能提示生成可玩的2D虚拟世界;这个交互式的虚拟世界还自主可控。 但令人撇嘴的点,就是Genie最后出的效果,画质太糊了。 像这样: 或者这样:...
-
VAD v2端到端SOTA | 远超DriveMLM等方法(地平线)
从大规模驾驶演示中学习类似人类的驾驶策略是很有前途的,但规划的不确定性和非确定性本质使得这一任务充满挑战。在这项工作中,为了应对不确定性问题,作者提出了VADv2,一个基于概率规划的端到端驾驶模型。VADv2以流方式输入多视角图像序列,将传感器数据转换为...
-
南大俞扬深度解读:什么是「世界模型」?
随着媒体狂炒Sora,OpenAI的介绍材料中称Sora是「world simulator」,世界模型这个词又进入视野,但很少有文章来介绍世界模型。 这里回顾一下什么是世界模型,以及讨论Sora是不是world simulator。 什么是world...
-
跨越千年医学对话:用AI技术解锁中医古籍知识,构建能够精准问答的智能语言模型,成就专业级古籍解读助手(LLAMA)
跨越千年医学对话:用AI技术解锁中医古籍知识,构建能够精准问答的智能语言模型,成就专业级古籍解读助手(LLAMA) 介绍:首先在 Ziya-LLaMA-13B-V1基线模型的基础上加入中医教材、中医各类网站数据等语料库,训练出一个具有中医知识理解力的预...
-
AI写作的疑似度:一场探寻真相与未来的冒险
大家好,今天来聊聊AI写作的疑似度:一场探寻真相与未来的冒险,希望能给大家提供一点参考。 以下是针对论文重复率高的情况,提供一些修改建议和技巧,可以借助此类工具: 标题:AI写作的疑似度:一场探寻真相与未来的冒险 在这个AI技术日新月异的时代,A...
-
高质量论文中文翻译:Lag-Llama: 朝向基础模型的概率时间序列预测 Lag-Llama: Towards Foundation Models for Probabilistic Time S
Lag-Llama: 朝向基础模型的概率时间序列预测Lag-Llama: Towards Foundation Models for Probabilistic Time Series Forecasting 文章目录 摘要 介绍 我们的贡献...
-
全球最强开源大模型一夜易主!谷歌Gemma 7B碾压Llama 2 13B,今夜重燃开源之战
一声炸雷深夜炸响,谷歌居然也开源LLM了?! 这次,重磅开源的Gemma有2B和7B两种规模,并且采用了与Gemini相同的研究和技术构建。 有了Gemini同源技术的加持,Gemma不仅在相同的规模下实现SOTA的性能。 而且更令人...
-
AI写作的奥秘:如何掌控Perplexity与Burstiness的魔力
大家好,今天来聊聊AI写作的奥秘:如何掌控Perplexity与Burstiness的魔力,希望能给大家提供一点参考。 以下是针对论文重复率高的情况,提供一些修改建议和技巧,可以借助此类工具: 标题:AI写作的奥秘:如何掌控Perplexity与B...
-
Sora训练数据疑暴露,网友:绝对用了UE5
好消息,好消息,真·Sora视频上新了!走过路过不要错过! (不用苦苦等候,或撑大眼睛费劲吧啦鉴别真假Sora产品了)。 就在过去短短几个小时里,包括Bill Peebles、Tim Brooks两位负责人在内的工作人员唰唰唰N连发。 (好了好了,知...
-
用扩散模型生成网络参数,LeCun点赞尤洋团队新研究
如果你有被 Sora 生成的视频震撼到,那你就已经见识过扩散模型在视觉生成方面的巨大潜力。当然,扩散模型的潜力并不止步于此,它在许多其它不同领域也有着让人期待的应用前景,更多案例可参阅机器之心不久前的报道《爆火Sora背后的技术,一文综述扩散模型的最新发...
-
Sora神图惊掉下巴,好莱坞导演急撤掉8亿美元摄影棚! Sora「内测」提前开放,影视失业潮将至
就在昨天,Sora又有全新「神作」炸出了! 两位Sora作者,Bill Peebles、Tim Brooks纷纷甩出全新图片。(顺便还秀了一把基友情?) 「一只小熊猫和一只巨嘴鸟是最好的朋友,在蓝色时刻漫步在圣托里尼岛」,Peebles称这个场景简直就和...
-
AI和RPA:它们如何协同工作,以及为什么你的企业需要两者
根据高盛的一份报告,AI可以使全球劳动生产率每年提高1%以上,到2025年可能吸引超过2000亿美元的投资,与此同时,虽然RPA市场活跃在比无所不在的AI窄得多的领域,但到2029年,RPA市场的规模将超过140亿美元。 就个人而言,这两项独立的技术重...
-
VideoPrism官网体验入口 AI视频理解编码器使用介绍
VideoPrism是一个通用的视频编码模型,可在各种视频理解任务上取得领先的性能,包括分类、定位、检索、字幕生成和问答等。其创新点在于预训练的数据集非常大且多样,包含 3600 万高质量的视频-文本对,以及5. 82 亿带有嘈杂文本的视频剪辑。预训练采用...
-
GPT-4、Gemini同时被曝重大缺陷,逻辑推理大翻车!DeepMind上交校友团队发现LLM严重降智
最近,谷歌DeepMind和斯坦福的研究人员发现:大模型在处理逻辑推理任务时,问题中信息呈现的顺序对模型的表现有着决定性的影响。 论文地址:https://arxiv.org/abs/2402.08939 具体来说,当信息按照逻辑上的自然顺序排列时,模...