-
三只羊卢总的录音AI到底能不能做出来?我的答案是:当然能。
今天凌晨,N多人给我发了一张图,说警方通报了,问我到底怎么看三只羊录音是不是AI这事。 还有朋友跟我说,有个号称国内AI第一人的,之前信誓旦旦的说这录音必不可能是AI,AI做不出来。所以这个通报背后,会不会背后是有些阴谋论? 我差点都喷了,国内AI第一人...
-
AIGC时代,仅用合成数据训练模型到底行不行?来一探究竟 | CVPR 2024
首个针对使用合成数据训练的模型在不同稳健性指标上进行详细分析的研究,展示了如SynCLIP和SynCLR等合成克隆模型,其性能在可接受的范围内接近于在真实图像上训练的对应模型。这一结论适用于所有稳健性指标,除了常见的图像损坏和OOD(域外分布)检测。另一方...
-
小心!AI能「看懂」你的唇语,悄悄话不再安全!
小心悄悄话被AI听见!(嘘) 最近国外一款可以读唇语的AI软件火了! 具体效果如下: 红毯上布莱克·莱弗利小声说:“好紧张”,笑着说话时肉眼很难分辨唇语,但AI可以。 乍一看只能看见一排白牙(bushi)的侃爷,唇语也能被轻松破解。 看完后网友们开始纷...
-
国内最大智算中心正式投用:每秒690亿亿次浮点运算 可训练万亿参数大模型
快科技8月31日消息,日前,由中国移动承建的国内运营商最大单集群智算中心在哈尔滨正式运营。 据悉,该智算中心具有单集群算力规模最大、国产化网络设备组网规模最大等特点。 单集群智算中心把所有AI加速卡打造成1个集群,用以支持千万亿级参数的大模型进行训练。 这...
-
Datawhale AI夏令营第四期 魔搭-AIGC方向 task 01笔记
简介 从零入门AI生图原理&实践,是 Datawhale 2024 年 AI 夏令营第四期的学习活动(“AIGC”方向),基于魔搭社区“可图Kolors-LoRA风格故事挑战赛”开展的实践学习 适用人群: 想入门并实践 AIGC文生图、工...
-
深度解读 Llama 3.1 技术报告:从405B参数到24000块H100集群
Meta在最近发布了他们的开源大模型Llama 3.1,引起了广泛的关注和讨论。随着热度逐渐退潮,Llama 3.1 的详细技术报告也公开了。这份报告揭示了很多关于Llama 3.1 的技术细节和实现原理。本文将从模型参数、基础设施、预训练、后训练等方面,...
-
标题:微调Whisper模型,打造超高效语音识别利器!
标题:微调Whisper模型,打造超高效语音识别利器! Whisper-FinetuneFine-tune the Whisper speech recognition model to support training without timesta...
-
摩尔线程开源音频理解大模型MooER:38小时训练5000小时数据
快科技8月23日消息,摩尔线程官方宣布,音频理解大模型MooER”(摩耳)已经正式开源,并公布在GitHub上:https://github.com/MooreThreads/MooER 目前开源的内容包括推理代码,以及5000小时数据训练的模型,后续还将...
-
AI日报:新壹视频大模型2.0发布;LivePortrait支持用图片控制动画;OpenAI推GPT-4o模型微调功能;免费无水印!AI视频Hotshot最长可生成10秒
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、新壹视频大模型2.0发布:支持...
-
多语言声音克隆,CosyVoice模型最强部署
CosyVoice是由阿里通义实验室开源的一款多语言语音理解模型,它主要聚焦于高质量的语音合成,能够生成自然且逼真的语音。 CosyVoice模型经过超过15万小时的数据训练,支持中文、英语、日语、粤语和韩语多种语言的合成,且在多语言语音生成、零样本语音...
-
百度AI绘画文心一格:科技与艺术的融合
科技与艺术的邂逅) 在这个日新月异的时代,科技与艺术似乎成了两条平行线,各自在各自的领域里熠熠生辉。 tou 但你有没有想过,当这两股力量交汇时,会碰撞出怎样绚烂的火花呢?今天,就让我带你走进一个神奇的世界——百度AI绘画文心一格,那里,科技...
-
现在的AI公司们,已经在把用户当“数据提款机”了。
最近,AI公司跟用户之间的冲突与矛盾,变的越来越多越来越大了。 因为一个大家可能从来不看的东西: 用户协议。 最近X(也就是以前的推特)和马斯克,就被这玩意,推上了风口浪尖。 原因是,X被发现“光明正大”的拿用户的帖子来训练Grok AI。 就是马斯克自己...
-
从炒菜到缝针!斯坦福炒虾团队打造自主「AI达芬奇」,苦练神指当外科医生
【新智元导读】斯坦福炒虾机器人作者,又出新作了!通过模仿学习,达芬奇机器人学会了自己做「手术」——提起组织、拾取针头、缝合打结。最重要的是,以上动作全部都是它自主完成的。 斯坦福炒虾机器人作者,又出新作了。 这次,机器人不是给我们炒饭了,而是给我们做外科手...
-
使用LLaMA-Factory对Llama3-8B-Chinese-Chat进行微调
文章目录 模型及数据: 模型下载 数据 LLaMA-Factory启动 拉取代码 启动webui 模型训练 数据导入 数据预览 设置模型路径 配置参数及参数的保存 开始训练 过程观察 加载模型、对话 模型导出、再次加载...
-
SD教程| 如何撰写一个优秀的 stable diffusion 提示词?
大家好我是极客菌!!!在本文中,我将详细介绍如何撰写一个优秀的提示词。 首先,需要明确的是,称一种方式为好,并不意味着你只能使用这种方式,就像我们都知道一些书籍是好书,但并不意味着每个人都只能阅读这些书一样。通过学习其中一种好的方式,可以建立起一些概念,...
-
AI训AI惨遭投毒9次大崩溃,牛津剑桥等惊天发现登Nature封面!
9次迭代后,模型开始出现诡异乱码,直接原地崩溃!就在今天,牛津、剑桥等机构的一篇论文登上了Nature封面,称合成数据就像近亲繁殖,效果无异于投毒。有无破解之法?那就是——更多使用人类数据! 用AI生成的数据训练AI,模型会崩溃? 牛津、剑桥、帝国理工、多...
-
【大模型能力分水岭数学考试,文心一言超gpt4o排名第一】
文末有福利! 2024年全国高考成绩陆续放榜,各位考生的成绩怎么样?在本次考试中还有几位特殊的考生——国内外知名的9个AI大模型也“参与”了本次高考,它们的成绩可谓也是“几家欢喜,几家愁”。 以河北省录取分数线(文科一本线:521分,理科一本线:...
-
Midjourney prompts 怎么写?怎么优化?
作者先说:这几天想系统整理下mj知识体系,从这篇开始都是对阅读官方文档后的个人解读,跳过了官方的quick start和Community guidelines,从prompt开始写起。才疏学浅,如有错误或更好的方法,拜托大家指正 什么是Prompt?...
-
AI自学超越人工标注训练,蚂蚁数科2篇自监督学习论文入选国际顶会
近日,蚂蚁数科2项研究成果分别入选“欧洲计算机视觉会议(ECCV)”和“国际机器学习大会(ICML ”,可实现无需人工打标数据的情况下,通过自监督学习、强化学习等方法训练模型输出可信结果。据悉,两项成果将被应用于视频版权保护和智能问答领域。作为人工智能领域...
-
文献研读|AIGC溯源场景及研究进展
前言:本文介绍关于AIGC生成阶段针对不同溯源场景的几篇相关工作。 相关文章:针对文生图模型的AIGC检测论文研读,参见此篇文章。 如下图所示,在AIGC生成阶段,有4种溯源场景: 1)生成模型溯源训练数据 2)微调模型溯源预训练模型 3)AI...
-
论文研读|针对文生图模型的AIGC检测
前言:人工智能生成内容的鉴别(AIGC检测)算是当前的研究热点之一,本篇文章介绍几篇针对文生图模型的 AIGC 检测相关工作。 相关文章:AIGC溯源相关研究详见此篇文章 目录 1. Towards Universal Fake...
-
Copilot with GPT-4与文心一言4.0:AI技术的未来
Copilot with GPT-4的深度分析 Copilot with GPT-4是基于OpenAI的GPT-4模型,它是一个多功能的AI助手,能够在多种语言中进行交流和创作。GPT-4模型的强大之处在于其庞大的数据训练基础,这使得它在理解语境、生成文...
-
华为云发布盘古具身智能大模型:“夸父”人形机器人亮相
快科技6月21日消息,在今天的华为开发者大会上,华为云还发布了盘古大模型5.0,以及盘古具身智能大模型。 盘古具身智能大模型是人形机器人的灵魂,会上还展示了乐聚公司搭载该模型的夸父”人形机器人。 据介绍,盘古大模型能够让机器人完成10步以上的复杂任务规划...
-
对比chatgpt和文心一言的优缺点
ChatGPT和文心一言都是当前人工智能领域的热门产品,它们都具有各自独特的优点和缺点。以下是对这两款产品的对比: ChatGPT的优点: 强大的自然语言处理能力:ChatGPT经过大量的数据训练,能够模拟人类对话,表达思想和感情,提供更加自然流畅的...
-
苹果与OpenAI合作惹怒马斯克!OpenAI高管回应
快科技6月12日消息,苹果在WWDC24开发者大会上宣布和OpenAI达成合作,未来将会在Siri中整合ChatGPT。 据悉,苹果将接入GPT-4o,用户无需关联账户即可免费使用。 这一操作惹怒了马斯克,他在社交平台连发多条帖子,指责苹果出卖用户数据。...
-
Stable Diffusion 之 IP模型训练小白篇——只需4步就可上手
在我们的日常设计工作中,设计师会经常接到3D的设计需求,根据以往的工作模式来看,我们需要在3D软件里面进行建模,渲染再进行输出。这样复杂的工作,会让工作时间变长,影响我们的工作效率。结合如今的AI工具,我们采用AIGC的能力,也许会有不同的解决方案,减少总...
-
快速学会一个算法,CNN
今天给大家分享一个超强的算法,CNN 卷积神经网络(Convolutional Neural Network,CNN)是一种深度学习模型,广泛应用于图像和视频分析、自然语言处理和其他相关领域。CNN 通过模拟生物视觉系统的处理方式,能够自动学习数据的层次...
-
文心一言指令详解及实例分析
一、引言 文心一言,作为人工智能领域的杰出代表,以其独特的自然语言处理能力和广泛的应用场景,受到了广泛的关注。 文心一言指令,作为其核心功能之一,允许用户通过自然语言与文心一言进行交互,实现信息的查询、生成、理解和推理。 本文将详细介绍文心一言指...
-
零基础也能搞懂卷积神经网络原理!超详细!
相信和笔者一样爱技术对AI兴趣浓厚的小伙伴们,一定对卷积神经网络并不陌生, 也一定曾经对如此“高级”的名字困惑良久。笔者今天将从零开始走进卷积神经网络的世界~与大家分享! 在深入了解卷积神经网络之前,我们先看看图像的原理。 图像原理 图像在计算机中是通...
-
一模一样!斯坦福AI团队被曝抄袭中国国产大模型:直接删库跑路
快科技6月3日消息,近日,斯坦福AI团队被曝出了抄袭事件,而且抄袭的还是中国国产的大模型成果,模型结构和代码,几乎一模一样。 斯坦福的Llama3-V项目在5月29日发布,宣称仅需500美元就能训练出一个性能超越GPT-4V、Gemini Ultra、Cl...
-
原来这才是生成式AI!
随着ChatGPT、文心一言等AI产品的火爆,生成式AI已经成为了大家茶余饭后热议的话题。 可是,为什么要在AI前面加上“生成式”这三个字呢? 难道还有别的AI吗? 且听文档君慢慢道来~ 1.生成式AI究竟是个啥? 如果将人工智能按照用途进行简单分类的话...
-
【史上最全之 ChatGPT 和文心一言对比】
ChatGPT 和文心一言哪个更好用? 在当今的AI助手领域中,ChatGPT与文心一言无疑是备受瞩目的两位选手。两者分别由美国OpenAI公司和中国百度研发,均致力于提供卓越的人工智能对话体验。接下来,我们将从智能回复、语言准确性以及知识库丰富度等核...
-
谷歌AI搜索惨败,竟教唆网友自杀!
【新智元导读】隔壁OpenAI都杀疯了,谷歌还在收集badcase?搜索引擎AI Overview上线之后,没想到谷歌AI的邪恶程度远超想象:教唆网友自杀/谋杀、吃毒蘑菇,甚至无法识别混淆信息,犯常识错误...... 这几天,谷歌AI搜索给出的奇葩结果,可...
-
谷歌AI搜索闯大祸!建议网友吃石头、毒蘑菇,把胶水加到披萨上,评论区炸了
谷歌AI又闯大祸! 没认出毒蘑菇、建议用户吃石头、把胶水加到披萨上,瞬间招来海量批评。 图片 事情是这样的: 有网友在谷歌搜索寻找“芝士和披萨粘不到一块”的解决办法。AI直接在顶部给出总结指导,看似有模有样,却暗藏陷阱。 你还可以把1/8杯的无毒胶水加到...
-
李彦宏出席VivaTech:中国AI与西方的最大区别在于应用
5月22日,在法国巴黎举办的“欧洲科技创新展览会”(Viva Technology)主论坛上,百度创始人、董事长兼首席执行官李彦宏与阳狮集团监事会主席莫里斯•列维(Maurice Levy)对谈时表示,中国AI与西方的最大区别在于应用,中国有数百个基础模型...
-
“问答爬虫”技术揭秘:智能信息检索的未来
在互联网时代,信息获取已经成为人们日常生活中不可或缺的一部分。随着互联网技术的不断发展和数据量的急剧增长,如何高效、准确地从海量信息中筛选出有价值的信息,成为了亟待解决的问题。在这样的背景下,“问答爬虫”技术应运而生,它凭借其智能化、精准化的特点,正在逐步...
-
AI 框架Ambient Diffusion:从图像中获取灵感,而非复制
强大的人工智能模型有时会出现错误,包括虚构错误信息或将他人作品作为自己的。为了解决后者的问题,德克萨斯大学奥斯汀分校的研究团队开发了一种名为 "Ambient Diffusion" 的框架。该框架通过对无法辨认的图像数据进行训练,绕过了 AI 模型复制他人...
-
Slack隐私政策引发争议,遭指责隐瞒AI培训政策
Slack 最近因其隐私政策引发争议,用户对该公司培训 AI 模型时使用个人数据的方式表示不满,称其缺乏透明度和规范。这一事件引起了用户对于个人隐私问题的质疑。 图源备注:图片由AI生成,图片授权服务商Midjourney 据了解,Slack 利用用户数...
-
AI日报:viva发布类Sora视频生成模型;Open AI 宫斗第二季详解;索尼禁止未授权使用其音乐“炼丹”:Coze上线Web SDK
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、viva发布类Sora视频生成...
-
索尼向700多家公司发出警告,禁止使用其音乐数据训练AI模型
索尼音乐集团发出警告,禁止未经许可的公司使用其音乐数据训练大型 AI 模型。 这一警告涉及到700多家公司,索尼明确表示未经许可不得使用其音乐数据进行文本挖掘、网络爬取以及其他形式的数据搜集,包括录音、音乐作品、封面艺术作品和元数据等。这是因为 AI 模型...
-
识别细胞也能用大模型了!清华系团队出品,已入选ICML 2024 | 开源
大模型带来的生命科学领域突破,刚刚再传新进展。 来自清华系,使用大模型实现了单细胞身份识别,同时模型LangCell也正式对外开源。 它不仅可以准确识别细胞身份,还具有很强的零样本分析能力,论文已被ICML 2024录⽤。 LangCell的数据集中包...
-
UIUC发布StarCoder2-15B-Instruct代码大模型 无需OpenAI数据登上性能榜单
UIUC与BigCode组织的研究者们最近发布了StarCoder2-15B-Instruct代码大模型,这一创新成果在代码生成任务方面取得了显著突破。这款模型成功超越了CodeLlama-70B-Instruct,登上了代码生成性能榜单之巅。 StarC...
-
巨人网络发布2023年报:称将持续研究GiantGPT应用场景
4月29日,巨人网络发布2023年年度报告及2024年一季度报告。 报告显示,2023年公司实现营业收入29.24亿元,同比增长43.50%,实现归属于上市公司股东的净利润10.86亿元,同比增长27.67%;实现归属于上市公司股东的扣除非经常性损益的净利...
-
AI刘强东007带货,背后大模型也就10亿参数,京东:我家数字人平均水平
京东创始人刘强东啊,他昨天又加班了。 准确来说,是他的AI数字人形象“采销东哥”,昨晚开启了自己生涯第四场直播。 这次东哥干的是图书采销工作。 与上两次直播不同,这一回直播间不仅有了数字人助理,还有多机位切换等展现方式。与此同时,和留言区及屏幕前观众的互...
-
EMNLP 2023|利用LLM合成数据训练模型有哪些坑?
大家好,我是HxShine 今天我们将介绍EMNLP2023的一篇大模型(LLMs)生成文本分类任务合成数据的文章,标题是《Synthetic Data Generation with Large Language Models for Text Cla...
-
如何通过机器学习算法设计软传感器?
通过理解机器学习算法的功能,工程师可以为他们的应用生成有效的软传感器。 软传感器(soft sensor),也称为虚拟传感器,是一种可以综合处理数百个测量数据的软件。想要添加软传感器的工厂管理者可能会对使软传感器工作的机器学习的范围感到不知所措。然而,...
-
给AI当“奶妈”,是天涯们的生路吗?
老牌中文社区天涯已经住进“ICU”整整一年,破产看来已经注定,但最近一家美国同行搭上AI 快车的消息,又给天涯带来了一丝希望。 去年4月,因拖缴数据机房费用,天涯社区遭“断网”。 症结在缺钱。天涯社区称,危机来自于近几年资金流动性困难加剧,电信IDC欠费,...
-
AI写作查重率怎么降低:七大策略助你轻松应对
大家好,小发猫降重今天来聊聊AI写作查重率怎么降低:七大策略助你轻松应对,希望能给大家提供一点参考。 以下是针对论文重复率高的情况,提供一些修改建议和技巧,可以借助此类工具: AI写作查重率怎么降低:七大策略助你轻松应对 随着AI技术的不断进步,...
-
AI辅写率高怎么办?七大策略助你驾驭智能写作工具
大家好,小发猫降重今天来聊聊AI辅写率高怎么办?七大策略助你驾驭智能写作工具,希望能给大家提供一点参考。 以下是针对论文重复率高的情况,提供一些修改建议和技巧,可以借助此类工具: AI辅写率高怎么办?七大策略助你驾驭智能写作工具 在数字化时代,A...
-
OpenAI计划建立「数据市场」,训出GPT-5短缺20万亿 token
全网高质量数据集告急!据报道,AI 公司如 OpenAI、Anthropic 等正在努力寻找足够的信息来训练下一代人工智能模型。数据短缺问题日益突出,对训练下一代强大模型至关重要。面对这一挑战,AI 初创、互联网大厂开始寻找新的方法来解决算力和数据的瓶颈问...