音视频 - AIGC资讯

可信数据空间如何应对深度伪造？

标题：可信数据空间：构建防线，应对深度伪造的挑战随着人工智能技术的飞速发展，深度伪造（Deepfake）技术已成为信息安全领域的一大隐患。这种技术能够生成高度逼真、难以辨别的虚假音视频内容，对个人隐私、政治稳定、社会信任乃至国家安全构成了严重威胁。在此背景...

AIGC 2025-06-12 大数据

548阅读

从头开始实现 LLaMA 模型，这包括设计模型架构、编写训练算法等，tl-rtc-file打破距离,局域网传输可达70MB，免费开源很火热的一些可以通过网页进行远程控制的开源项目，以及操作系统引导自动

从头开始实现 LLaMA 模型，这包括设计模型架构、编写训练算法等，tl-rtc-file打破距离,局域网传输可达70MB，免费开源很火热的一些可以通过网页进行远程控制的开源项目，以及操作系统引导自动。这个开源项目名为 “llama3-from-s...

生成式AI 2024-09-30 人工智能

1271阅读

一家AI声音克隆公司，借三只羊录音门玩起了“自杀式营销”？

只羊事件闹得沸沸扬扬，没想到受害者竟然是AI。昨晚，合肥警方就“三只羊集团创始人卢文庆录音事件”发布通报，称这条广为流传的音频为AI生成，犯罪嫌疑人已经被依法采取刑事强制措施。一锤定音，这条通报不仅给出了官方表态，也扇了前几天那位网传“国内AI第一人”...

AIGC 2024-09-28 人工智能

1297阅读

官方通报三只羊卢某某录音事件：音视频系AI伪造

快科技9月27日消息，日前，合肥市公安局高新分局公众号发布通报称，9月20日，该局接三只羊公司报警称，网上传播涉卢某某的音视频不实，严重侵害其合法权益。根据通报，经过侦查，9月22日晚，合肥市公安局高新分局将犯罪嫌疑人王某某（男，25岁）抓获，并在其电脑...

人工智能 2024-09-27 人工智能

1117阅读

具身智能机器人隐藏冠军上新：领狗进家门，多模态AI那种

具身智能领域的“癫”，已经进入next level了! 来看这段视频:人形机器人在前面跑，一群机器狗在后面追;然后人追着狗，接着狗追着人…… 最后那位机器人还有很重的「偷感」在身上。别怕，这不是进入了《恐怖游轮》or《开端》的神奇循环，而是一家国产具身...

AIGC 2024-09-26 人工智能

994阅读

AI写作助力自媒体，传统模式将被颠覆

AI在自媒体创作中的崛起人工智能的不断发展正在彻底改变自媒体行业的运作方式。创作不再依赖单一的个人力量，AI技术的引入使得内容生成变得高效、快速。自媒体工作者可以依靠机器学习算法，获取丰富的知识和灵感，即使在众多竞争者中也能迅速脱颖而出。这种变化让...

大数据 2024-09-25 人工智能

1108阅读

Whisper-CPP：CPU-AI语音识别的天才，CosyVoice - 阿里最新开源语音克隆、文本转语音项目一键整合包下载，GPT-4o实时语音方案Livekit开源voice agent音视频

Whisper-CPP：CPU-AI语音识别的天才，CosyVoice - 阿里最新开源语音克隆、文本转语音项目一键整合包下载，GPT-4o实时语音方案Livekit开源voice agent音视频。使用Streamlit和wheaster.CP...

生成式AI 2024-09-25 人工智能

1603阅读

OpenAI开启推理算力新Scaling Law，AI PC和CPU的机会来了

OpenAI的新模型o1，可谓是开启了Scaling Law的新篇章—— 随着更多的强化学习（训练时计算）和更多的思考时间(测试时计算，o1在逻辑推理能力上已经达到了目前天花板级别。尤其是在北大给出的一项评测中，o1-mini模型的跑分比o1-prev...

大数据 2024-09-24 人工智能

941阅读

零刻首发AMD Zen5迷你机：旗舰锐龙AI 9 HX 370核显媲美RTX 3050

快科技9月11日消息，大家望眼欲穿的Zen5架构迷你机终于来了！零刻披露，将在中秋节后少量上线新款SER9”，但定价暂未公开，只知道初期确实会比较高。配置方面，处理器是旗舰款锐龙AI 9 HX 370，12个Zen5 CPU核心最高频率5.1GHz，16...

人工智能 2024-09-11 人工智能

1369阅读

硬件没亮点、AI全缺席，iPhone 16 背刺中国用户？

2024年9月10日凌晨1点，Apple 如约举行“高光时刻”线上发布会，发布了 Apple Watch、AirPods、iPhone 三大产品线内的多款新品。在全场屏息凝神的注目下，iPhone16系列正式登场。先说说 iPhone16系列的升级点:...

大数据 2024-09-10 人工智能

976阅读

写作困境怎么破？试试这5款AI写作助手，创造力无限，灵感不竭

再不会用AI就out啦！这些国产超实用的免费AI工具你都用过吗？不知道大家有没有发现啊，这两年AI发展是真的猛，现在不管是工作还是学习，要是不会用点AI工具简直都out了。想想别人用AI几十秒干掉了你得做一个上午的工作，这效率差距可不是一星半点，还...

大数据 2024-09-07 人工智能

937阅读

comfyUI-MuseTalk用户交互体验的参数设计和设置

comfyUI-MuseTalk用户交互体验的参数设计和设置目录 comfyUI-MuseTalk的参数设置一、ComfyUI-VideoHelperSuite 二、comfyUI-MuseV合成的参考视频 2.1、什么时候会用到MuseV？...

生成式AI 2024-08-23 人工智能

3361阅读

【AIGC 】一篇文章，帮你了解什么是虚拟数字人？

1.数字人的三方面特征虚拟数字人是指具有数字化外形的虚拟人物。与具备实体的机器人不同，虚拟数字人依赖显示设备存在，我们所知的很多虚拟人都要通过手机、电脑或者智慧大屏等设备才能显示。虚拟数字人宜具备以下三方面特征: 一是拥有人的外观，具有特...

人工智能 2024-08-12 人工智能

1247阅读

stable diffusion插件推荐，（插件已打包）高清【图片换脸】，高清【视频换脸】一键完成

前言最近发现一个很不错的sdwebui的插件，不仅能完成图片换脸，还能进行视频换脸，而且效果比之前的 faceid和reactor要好很多，更像更高清，哈哈，废话不多说，直接上干货~ 插件是 easyPhoto，实测效果很不错，插件介绍...

人工智能 2024-08-09 人工智能

1079阅读

AI日报：OpenAI推搜索引擎SearchGPT；智谱推AI视频产品清影；字节发布豆包图生图模型；B站上线AIGC推荐广告标题功能

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/ 1、挑战谷歌!OpenAI推搜索引...

大数据 2024-07-26 人工智能

911阅读

python系列&deep_study系列：找不到字幕？Whisper 让不懂外语的你也能看懂日剧，支持99种语言

找不到字幕？Whisper 让不懂外语的你也能看懂日剧，支持99种语言找不到字幕？Whisper 让不懂外语的你也能看懂日剧，支持99种语言音视频转录字幕翻译 Whisper 进阶命令 task language model 幻听参数...

生成式AI 2024-07-23 人工智能

876阅读

视频大语言模型调研论文《Video-LLaMA: An Instruction-tuned Audio-Visual Language Model for Video Understanding》解读

本文是关于论文《Video-LLaMA: An Instruction-tuned Audio-Visual Language Model for Video Understanding》的简要介绍。Video-LLaMA是阿里达摩院的一个多模态大语言模型...

大数据 2024-07-22 人工智能

1068阅读

2024最新的AIGC的应用领域有哪些？

2023大型语言模型-aigc-LLM-engineering实例代码合集.zip 2023大模型与AIGC峰会（公开）PPT汇总（25份）.zip 内容创作： AI写作：AIGC技术可以用于生成文章、新闻、博客、广告文案、创意写作等，为内容创作...

人工智能 2024-07-14 人工智能

1065阅读

搭建本地whisper语音识别

目录代码仓库编辑选择模型环境配置语音识别测试 Whisper是一个通用的语音识别模型。它是在不同音频的大型数据集上训练的，也是一个多任务模型，可以执行多语言语音识别、语音翻译和语言识别。代码仓库 GitHub - ope...

AIGC 2024-07-13 人工智能

3083阅读

谷歌之后，OpenAI也要给新闻网站付费了？

近两年，大模型喷涌，它们在文字、图片、音视频等内容形态的生成上大放异彩。内容创作一直认为是人“独属”的技能，自OpenAI于2022年发布ChatGPT之后，众多大模型开始挑战一直被人类把持的这一独特技能。从初期惊艳心态“祛魅”后，大众逐步了解了这个新生事...

生成式AI 2024-07-10 人工智能

883阅读

创意生图搭配酷炫特效，AIGC直播礼物多元玩法助力平台互动再升级

在刚刚过去的苹果开发者大会WWDC 2024上，苹果向全球开发者展现了他们最新的创新成果。除了备受瞩目的新系统更新，最令人激动的无疑是AI大模型的加盟，其中，Image Playground功能（一款强大的AI图片生成器）尤其亮眼。基于Image Play...

大数据 2024-07-10 人工智能

1155阅读

AIGC时代程序员的跃迁——编程高手的密码武器

大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机...

生成式AI 2024-07-09 人工智能

879阅读

外滩大会举办全球deepfake攻防挑战赛，百万奖金悬赏“AI打假”专家

近日，外滩大会·全球Deepfake攻防挑战赛正式启动报名。该赛事提供百万级的数据集，针对“AI换脸”的欺诈风险进行攻防实战演练，并设立100万元人民币的奖金池，鼓励推动AI向善的技术人才。大赛由蚂蚁集团主办、蚂蚁数科承办，ATEC前沿科技探索社区、蚂...

大数据 2024-07-01 人工智能

837阅读

AIGC技术：现状、伦理与风险及未来展望

一、技术应用 AIGC技术，即人工智能内容生成技术，正在迅速改变我们生活的方方面面。从文本生成到图像创作，从音视频制作到电影游戏开发，AIGC技术都展现出了巨大的潜力和应用价值。在文本生成领域，AIGC技术不仅可以帮助我们快速生成高质量的文本内容...

大数据 2024-06-28 人工智能

1445阅读

百度文心一言插件商城正式上线！一键安装搞定PPT生成、音视频提取

快科技12月14日消息，日前，百度官方宣布，百度文心一言插件商城正式上线，插件覆盖办公提效、多模态内容理解生成、专业信息查询等实用场景。用户一键安装插件后，只需通过简单指令，即可实现PPT生成、音视频提取、思维导图制作等多场景多模态下的需求。...

人工智能 2024-06-26 人工智能

874阅读

AIGC从入门到实战：焦虑：AIGC 时代下的职业该如何规划

AIGC从入门到实战：焦虑：AIGC 时代下的职业该如何规划 1.背景介绍 1.1 AIGC的兴起近年来,人工智能生成内容(AIGC 技术取得了突破性进展。从OpenAI的GPT-3到Stable Diffusion,AIGC模型展现出了惊人的内容...

大数据 2024-06-26 人工智能

959阅读

用AI制作历史解说视频：GPT + MidJourney + PiKa + FunSound + 剪映

1. 项目介绍最近某站看到一个看到利用AI创作视频解说，成品画面很酷炫。对此以初学者视角进行复现，创意来源：用AI制作历史解说视频 2. 开始创作我们参照原作者展示的内容，对古代人物屈原来生成解说视频。 2.1 故事脚本+分镜【由GP...

生成式AI 2024-06-25 人工智能

1778阅读

霉霉开口唱碧昂丝的歌，又是AI！口型不出戏，五官姿态也自然，复旦百度等出品｜GitHub揽星1k+

一张人像、一段音频参考，就能让霉霉在你面前唱碧昂丝的《Halo》。一种名为Hallo的研究火了，GitHub已揽星1k+。话不多说，来看更多效果: 不论是说话还是唱歌，都能和各种风格的人像相匹配。从口型到眉毛眼睛动作，各种五官细节都很自然。单独...

大数据 2024-06-18 人工智能

921阅读

活久见！谁想的这种办法让大模型PK

“每个大模型看起来都差不多，只能谁便宜先用谁的。但用下来之后，不合适再换，又费钱又费力”，一位AI 招聘公司的创始人对光锥智能抱怨道。 2024年，大模型正在加速走向行业应用。但每一种大模型所擅长的领域都不一样，如何找到最适合自身业务场景的大模型，成为摆在...

AIGC 2024-06-14 人工智能

849阅读

年末阿里百度等大厂技术面试题汇总AI 绘画Stable Diffusion 研究（一，2024Python春招面试真题详解

sd-webui-aki-v4.zip: 整合包如图：二、安装步骤 1、解压sd-webui-aki-v4.zip，这就不用多说了。 2、如果之前没用过启动器，首先需要安装启动器的依赖：启动器运行依赖-donet-6.0.11.exe ，...

人工智能 2024-06-13 人工智能

988阅读

卷爆短剧出海：五大关键，由AIGC重构

短剧高温下，谈谈AIGC的助攻路线。短剧，一个席卷全球的高温赛道。以往只是踏着霸总题材，如今，内容循着精品化、IP化的自然发展风向，给内容、制作、平台等产业全链都带来新机，也让短剧消费走向文化深处，触发更大的社会渲染力。从国内到全球，短剧行...

人工智能 2024-05-30 人工智能

837阅读

AI PPT一键生成：让演示更简单，更智能

大家好，我是头条号的作者，今天给大家带来一个超级实用的分享——AI PPT一键生成工具。在这个快节奏的时代，我们每个人都可能需要快速制作演示文稿，无论是为了工作汇报，还是学术演讲。但传统PPT制作既耗时又需要一定的设计技巧，这对于很多人来说是一个不小的挑战...

AIGC 2024-05-27 人工智能

871阅读

计算机网络面试知识点总结宝妈在家就能做的副业，AI绘画项目，Python开发面试技巧

4. 定时发布与矩阵运营为了最大化效果，你可以选择在用户活跃度较高的时间段（如中午、傍晚、晚上）发布作品。此外，可以通过多账号矩阵运营，进一步扩大影响力。以上就是全部的制作流程，我还录制了一份全流程视频，需要的可以私信我免费领取：三、AI绘...

大数据 2024-05-27 人工智能

887阅读

基于Whisper语音识别的实时视频字幕生成 (一): 流式播放视频帧和音频帧

Whishow 一款基于python的音视频在线播放器 1. 安装 pip install whishow 2. 用法示例 1: 简单上手 cmd: python -m whishow <video_path_...

人工智能 2024-05-26 人工智能

860阅读

前沿科技应用：AIGC技术的广泛渗透

✨✨ 欢迎大家来访Srlua的博文（づ￣3￣）づ╭❤～✨✨ ?? 欢迎各位亲爱的读者，感谢你们抽出宝贵的时间来阅读我的文章。我是Srlua小谢，在这里我会分享我的知识和经验。? 希望在这里，我们能一起探索IT世界的奥妙，提升我们的...

大数据 2024-05-24 人工智能

841阅读

闭源赶超GPT-4 Turbo、开源击败Llama-3-70B，歪果仁：这中国大模型真香

国内的开发者们或许没有想到，有朝一日，他们开发的 AI 大模型会像出海的网文、短剧一样，让世界各地的网友坐等更新。甚至，来自韩国的网友已经开始反思:为什么我们就没有这样的模型? 这个「别人家的孩子」就是阿里云的通义千问（英文名为 Qwen）。在过去的一...

大数据 2024-05-10 人工智能

859阅读

通义千问APP更名为通义APP，免费开放通义全栈能力

5月9日，通义大模型品牌升级，“通义千问APP”更名为“通义APP”，集成通义大模型全栈能力，免费为所有用户提供服务。通义APP以性能媲美GPT-4 Turbo的基模为底座，并把通义实验室前沿的文生图、智能编码、文档解析、音视频理解、视觉生成等能力“Al...

生成式AI 2024-05-09 人工智能

763阅读

UP主用AI声音克隆工具重新配音《甄嬛传》播放量超过52万

近日，B站UP主“红桃没有6”通过AI技术，为经典剧集《甄嬛传》带来了一次别开生面的效果。该UP主利用AI重新配音，将台词内容经过谷歌机器翻译20次，创造出了全新的对话，其中“甄嬛”被翻译成“女仆陈宇”，而“皇太后”则化身为“寡妇皇后”。这一创意配音视频...

生成式AI 2024-05-07 人工智能

1867阅读

百万网友围观博主和AI“谈恋爱”，ChatGPT“DAN”模式有多上头？

前方高能!AI会“谈恋爱”了! 近日，博主“午夜狂暴哈士奇狗”在视频中晒出和ChatGPT“DAN”的语音聊天，近百万网友见证了他们从互怼暧昧到间接表白，再到“见家长”的全过程。 DAN是“Do Anything Now”的缩写，在ChatGPT对话中输入...

大数据 2024-04-29 人工智能

1164阅读

为什么要做长文本、长图文、长语音的大模型？深度解读讯飞星火V3.5春季上新

4月26日，科大讯飞发布讯飞星火大模型 V3.5的功能上新，其中一个重点就是面向用户各种场景中高效获取信息需求，发布首个长文本、长图文、长语音的大模型，能够支持文档、图文资料、会议录音等各种信息来源的快速理解和学习，还能够结合各种行业场景知识给出专业、准确...

生成式AI 2024-04-26 人工智能

866阅读

AI刘强东007带货，背后大模型也就10亿参数，京东：我家数字人平均水平

京东创始人刘强东啊，他昨天又加班了。准确来说，是他的AI数字人形象“采销东哥”，昨晚开启了自己生涯第四场直播。这次东哥干的是图书采销工作。与上两次直播不同，这一回直播间不仅有了数字人助理，还有多机位切换等展现方式。与此同时，和留言区及屏幕前观众的互...

AIGC 2024-04-25 人工智能

811阅读

被AI改变的00后娱乐习惯

初见文生图、文生视频的震撼还清晰如同昨日，硬糖君的记忆更停留在AI绘画导致LOFTER用户销号事件——可能是这个冷门社区近年来站得最高的一次。但不到两年时间，AIGC已经随风潜入夜。如果说AI翻唱、AI换脸、AI绘画还是在借助新工具进行自我表达，那么在互...

人工智能 2024-04-23 人工智能

918阅读

钉钉 AI Agent Store 上线了！软件竞争格局重构：Agent 掀起新风暴，App 何去何从？

4月18日，钉钉正式上线 AI 助理市场（AI Agent Store）。首批上架了200多个 AI 助理。Agent Store 的这种创新模式可以显著降低创作门槛并吸引更多用户，各行各业的人都可以拥有自己专属的助理。据钉钉官方数据显示，截至2024年...

AIGC 2024-04-22 人工智能

940阅读

AMD发布第二代Versal自适应SoC：10倍标量性能、全程AI加速

快科技4月9日消息，AMD今天宣布，旗下的Versal自适应片上系统(SoC 产品升级全新第二代，包括面向AI驱动型嵌入式系统的AI Edge 2VE3000系列、面向经典嵌入式系统的Prime系列。新一代产品很好地平衡了性能、功耗、面积，以及先进的功...

大数据 2024-04-09 人工智能

949阅读

阿里p8面经，Midjourney从入门到实战，2024BAT大厂Android社招面试题

参考图片+文本提示词+参数其中参考图片：点聊天窗口左边的+按钮上传后回车即可，然后把图片拖入prompt输入框，也可以点击图片-在浏览器中打开-复制图片网址。生成图片时会参考图片的构图、内容、颜色等文本提示词：由主体描述：...

AIGC 2024-04-09 人工智能

905阅读

谷歌发布超强AI视频编辑工具！施展魔法的VLOGGER，音频加图片就搞定唇形和手势，还把表情编辑玩出花了！

出品 | 51CTO技术栈（微信号：blog51cto）编译丨伊风视频生成模型的脚步永不停歇！图片 4月2日，谷歌刚刚发布了强到可怕的AI视频编辑工具VLOGGER。VLOGGER就像收集了很多视频生成领域的前沿AI技能，而打造出的一款百宝箱...

人工智能 2024-04-07 人工智能

900阅读

AIGC时代下阿里云视频云媒体内容生产技术实践

编者按 AIGC时代下，媒体内容生产领域随着AI的出现也涌现出更多的变化与挑战。面对AI的巨大冲击，如何优化或重构媒体内容生产技术架构？在多样的应用场景中媒体内容生产技术又有着怎样的实践效果？LiveVideoStackCon2023...

AIGC 2024-03-24 人工智能

869阅读

第二证券|AIGC行业新突破不断文化传媒板块活跃

本周以来，以短剧、游戏为代表的文明传媒板块实现三连涨。3月13日，游戏股逆势大涨，游戏出海、网络游戏、短剧游戏方向领涨。到收盘，因赛集团以20%幅度涨停，掌趣科技涨超10%，凯撒文明、中广天择、时代出书、大晟文明、龙版传媒、掌阅科技等多股涨停。消息面上...

大数据 2024-03-23 人工智能

869阅读

阿里通义听悟升级推出六大 AI 助手：多语言音视频问答和思维管理

今日，阿里巴巴集团旗下通义科技发布了产品“通义听悟”的最新升级版本，新增了6项重要功能。其中最重要的更新是推出了音视频问答助手“小悟”，它可以进行单条音视频内的自由问答，也支持跨多个音视频记录进行问题回答。此外，通义听悟还上线了一键AI改写和思维导图自动...

生成式AI 2024-03-19 人工智能

971阅读