时间戳 - AIGC资讯

深度伪造技术：威胁与防御的双重博弈

标题：深度伪造技术：威胁与防御的双重博弈在数字时代，技术的飞速发展既为人类带来了前所未有的便利，也悄然孕育了一系列新的挑战。其中，深度伪造技术（DeepFakes）作为人工智能领域的一个分支，正逐渐成为信息安全领域的一大威胁。这项技术通过先进的机器学习算法...

人工智能 2025-08-06 人工智能

1948阅读

区块链如何赋能可信数据空间的去中心化信任

标题：区块链技术：赋能可信数据空间去中心化信任的新篇章在数字化时代，数据的价值日益凸显，成为驱动经济社会发展的关键要素。然而，数据的真实性、安全性与隐私保护问题也随之而来，成为制约数据流通与共享的重大挑战。区块链技术，作为一种分布式账本技术，以其独特的去中...

AIGC 2025-06-22 大数据

831阅读

爬虫中的数据爬取结果验证

在数据科学和互联网信息提取领域，爬虫技术扮演着至关重要的角色。它允许开发者自动化地从网站上抓取数据，为分析、研究和业务决策提供宝贵的资源。然而，爬虫所得数据的准确性和完整性直接关系到后续分析的有效性和可靠性。因此，对爬虫数据进行验证是一个不可或缺的步骤。本...

人工智能 2025-06-17 大数据

975阅读

爬虫中的异常处理与日志记录

在数据采集领域，爬虫技术扮演着至关重要的角色。它允许我们自动化地从网站上抓取信息，以满足数据分析、市场研究等多种需求。然而，爬虫在运作过程中经常会遇到各种异常，如网络连接问题、网页结构变化、反爬虫机制等。因此，异常处理与日志记录成为爬虫开发中不可或缺的部分...

生成式AI 2025-06-10 大数据

622阅读

数据质量提升工具应用案例：提升数据质量

标题：数据质量提升工具应用案例：重塑数据基石，驱动业务价值在当今数据驱动的时代，高质量的数据是企业决策、运营优化及创新发展的核心驱动力。然而，数据从采集、存储、处理到分析的全过程中，难免会受到各种因素的影响，导致数据质量问题频发，如缺失值、重复数据、错误数...

人工智能 2025-06-10 大数据

539阅读

基于区块链的可信空间构建方案

标题：基于区块链的可信空间构建方案探索随着信息技术的飞速发展，数据安全和信任问题日益成为制约数字化转型的关键因素。区块链技术，以其去中心化、不可篡改和透明性的特性，为解决这些问题提供了创新思路。构建一个基于区块链的可信空间，不仅能够提升数据的安全性与可信度...

AIGC 2025-06-08 大数据

585阅读

数据清洗工具创新应用案例：提升处理效率

标题：数据清洗工具的创新应用：显著提升数据处理效率的实践案例在大数据时代，数据的质量直接关系到数据分析的准确性和决策的有效性。然而，原始数据中往往充斥着缺失值、异常值、重复记录等“杂质”，这些“杂质”若不经过有效清洗，将严重影响后续数据分析的准确性和效率。...

大数据 2025-06-07 大数据

537阅读

使用 CTranslate2 实现 Faster Whisper 的加速转录

使用 CTranslate2 实现 Faster Whisper 的加速转录近年来，语音识别技术得到了快速发展。OpenAI 的 Whisper 模型作为其中的佼佼者，以其高精度和强大的性能广受欢迎。然而，其较长的推理时间和高内存消耗也成为了限制其应...

生成式AI 2024-10-04 人工智能

2704阅读

Whisper JAX：闪电般快速的语音识别框架

Whisper JAX：闪电般快速的语音识别框架 whisper-jaxJAX implementation of OpenAI's Whisper model for up to 70x speed-up on TPU.项目地址:https://gi...

大数据 2024-10-03 人工智能

1669阅读

Insanely Fast Whisper CLI 项目教程

Insanely Fast Whisper CLI 项目教程 insanely-fast-whisper-cli The fastest Whisper optimization for automatic speech recognition a...

AIGC 2024-10-01 人工智能

1479阅读

当剪映识别字幕开始收费，我们用免费开源软件FFmpeg、Whisper、ChatGPT来快速制作中文或双语字幕

最近剪映中的视频“智能提取字幕”的功能收费了，收费是按照会员功能年收费，收费还不低。由于我只需要剪映的字幕功能，其他会员功能并不需要，于是想了其他的办法来解决给视频增加字幕的功能，并且还能添加双语字幕，给中文字翻译成其他任何一门语言再加在中文幕...

AIGC 2024-09-30 人工智能

6886阅读

Insanely Fast Whisper CLI 使用教程

Insanely Fast Whisper CLI 使用教程 insanely-fast-whisper-cli The fastest Whisper optimization for automatic speech recognition a...

人工智能 2024-09-27 人工智能

1932阅读

每日AIGC最新进展(56)：当下最强开源图片/视频理解模型CogVLM2发布

Diffusion Models专栏文章汇总：入门与实战随着大型语言模型和多模态对齐技术的发展，视频理解模型在一般开放领域也取得了重大进展。然而，目前大多数视频理解模型使用帧平均和视频令牌压缩方法，导致时间信息的丢失和无法准确回答与时间相关的问题。...

大数据 2024-09-26 人工智能

1097阅读

WhisperX: 带时间戳的自动语音识别及说话人分离

WhisperX: 带时间戳的自动语音识别及说话人分离 whisperXm-bain/whisperX: 是一个用于实现语音识别和语音合成的 JavaScript 库。适合在需要进行语音识别和语音合成的网页中使用。特点是提供了一种简单、易用的 API，...

大数据 2024-09-05 人工智能

2029阅读

使用OpenAI Whisper的说话人识别管道

使用OpenAI Whisper的说话人识别管道 whisper-diarizationAutomatic Speech Recognition with Speaker Diarization based on OpenAI Whisper项目地址:...

AIGC 2024-09-05 人工智能

1361阅读

WhisperX：革命性的自动语音识别工具

WhisperX：革命性的自动语音识别工具 whisperXm-bain/whisperX: 是一个用于实现语音识别和语音合成的 JavaScript 库。适合在需要进行语音识别和语音合成的网页中使用。特点是提供了一种简单、易用的 API，支持多种语音...

人工智能 2024-09-03 人工智能

1762阅读

WhisperX

文章目录一、关于 WhisperX 新闻 ? 二、设置⚙️ 1、创建Python3.10环境 2、安装PyTorch，例如Linux和Windows CUDA11.8： 3、安装此repo 4、Speaker Diarization 三、...

生成式AI 2024-08-31 人工智能

2083阅读

标题：微调Whisper模型，打造超高效语音识别利器！

标题：微调Whisper模型，打造超高效语音识别利器！ Whisper-FinetuneFine-tune the Whisper speech recognition model to support training without timesta...

AIGC 2024-08-25 人工智能

1146阅读

【愚公系列】《微信小程序开发解析》005-事件

? 作者简介，愚公搬代码 ?《头衔》：华为云特约编辑，华为云云享专家，华为开发者专家，华为产品云测专家，CSDN博客专家，CSDN商业化专家，阿里云专家博主，阿里云签约作者，腾讯云优秀博主，腾讯云内容共创官，掘金优秀博主，亚马逊技领云博主，51CTO博客专...

人工智能 2024-08-14 人工智能

1025阅读

文心一言 VS 讯飞星火 VS chatgpt （317）-- 算法导论22.3 9题

九、请给出如下猜想的一个反例：如果有向图G包含一条从结点u到结点v的路径，则任何对图G的深度优先搜索都将导致v.d⩽u.f。如果要写代码，请用go语言。文心一言：首先，我们需要澄清问题中的几个关键点。在图的深度优先搜索（DFS）中，u.d 通常...

人工智能 2024-08-08 人工智能

911阅读

手把手教你用聆思CSK6大模型开发板接入文心一言/千帆大模型

前言多模态交互离不开硬件载体，近期有不少开发者在研究大模型开发板除了使用出厂示例自带的星火大模型，能不能接入文心一言、通义千问、豆包、智谱glm、kimi等国内的大模型，这个是必须支持的。但由于各家接口和数据格式不一样，有些朋友直接参考...

人工智能 2024-07-29 人工智能

1161阅读

天才程序员周弈帆 | Stable Diffusion 解读（三）：原版实现源码解读(篇幅略长，建议收藏！)

本文来源公众号“天才程序员周弈帆”，仅用于学术分享，侵权删，干货满满。原文链接：Stable Diffusion 解读（三）：原版实现源码解读天才程序员周弈帆 | Stable Diffusion 解读（一）：回顾早期工作-CSDN博客天才程序...

生成式AI 2024-07-27 人工智能

1910阅读

揭秘！FFmpeg+Whisper双剑合璧：解锁视频到文本的二阶段奇迹

解锁视频到文本的二阶段奇迹一、引言二、视频音频提取与处理视频音频提取与处理 2.1 环境搭建 2.2 视频音频提取 2.3 音频预处理示例代码：三、语音识别与翻译 3.1 加载Whisper模型 3.2 语音识别 3.3 语言检...

人工智能 2024-07-15 人工智能

1136阅读

Faster-whisper+silero-vad 实时语音转录

环境搭建需要使用cuda 在 cmd 控制台里输入 nvidia-smi.exe 以查看显卡驱动版本和对应的 cuda 版本前往 NVIDIA-CUDA 官网下载与系统对应的 Cuda 版本以 Cuda-11.7 版本为例，根据自己的...

人工智能 2024-07-06 人工智能

1986阅读

【小沐学AI】Python实现语音识别（whisperX）

文章目录 1、简介 1.1 whisper 1.2 whisperX 2、安装 2.1 安装cuda 2.2 安装whisperX 结语 1、简介 1.1 whisper https://arxiv.org/pdf/2...

AIGC 2024-07-05 人工智能

1353阅读

【大模型部署】在C# Winform中使用文心一言ERNIE-3.5 4K 聊天模型

【大模型部署】在C# Winform中使用文心一言ERNIE-3.5 4K 聊天模型前言今天来写一个简单的ernie-c#的例子，主要参考了百度智能云的例子，然后自己改了改，学习了ERNIE模型的鉴权方式，数据流的格式和简单的数据解析，实现了在...

AIGC 2024-06-22 人工智能

1349阅读

[AIGC] 事务的四大特性是怎么实现的

文章目录原子性是通过 `undo log`实现的。一致性是通过 `redo log`实现的。隔离性的实现（分事务的隔离级别讨论）持久性是利用 redo log 实现的写入过程原子性是通过 undo log实现的。...

大数据 2024-06-20 人工智能

813阅读

whisper使用

whisper使用 1. 直接调用语音识别 2. 语种识别 whisper.detect_language( 和whisper.decode( 3. 指定要识别的语种做语音识别 **whisper 源码的transcribe函数** 函数解...

生成式AI 2024-06-17 人工智能

1378阅读

chatgpt4和文心一言的简单对比

功能1. 写一个ebpf程序监控udp延迟文心一言答案编写一个完整的eBPF程序来监控UDP延迟涉及多个步骤，包括编写eBPF C代码、编译、加载到内核，以及用户空间程序来读取eBPF map中的数据。以下是一个简化的示例框架，展示如何使...

AIGC 2024-06-10 人工智能

927阅读

深入探索令牌桶限流的原理与实践

在当今的互联网时代，随着用户数量和请求量的不断增加，系统的性能和稳定性面临着巨大的挑战。限流算法作为保障系统稳定性的重要手段之一，被广泛应用于各种服务和应用中。限流的核心目的是对某一时间窗口内的请求数进行限制，保持系统的可用性和稳定性，防止因流量暴增而导致...

大数据 2024-05-30 人工智能

900阅读

[AIGC] 用幂等性解决重复消息问题

在构建分布式系统时，开发人员经常会遇到重复消息问题。这可能是由于网络延迟、系统故障或其他原因导致的。无论如何，重复消息会导致系统出现错误和不一致状态。为了解决这个问题，我们可以使用幂等性来确保系统的可靠性和一致性。文章目录什...

人工智能 2024-04-09 人工智能

758阅读

AI语音识别工具Universal-1：38秒可以处理60分钟音频比fast Whisper更快

AssemblyAI 最新研究成果展示了他们的 Universal-1模型在多语言环境中的表现，该模型在准确性和鲁棒性方面均取得了行业领先地位。先说结果，Universal-1比Whisper Large-v3更准确，比fast Whisper更快，38秒...

生成式AI 2024-04-07 人工智能

1085阅读

阿里通义听悟升级推出六大 AI 助手：多语言音视频问答和思维管理

今日，阿里巴巴集团旗下通义科技发布了产品“通义听悟”的最新升级版本，新增了6项重要功能。其中最重要的更新是推出了音视频问答助手“小悟”，它可以进行单条音视频内的自由问答，也支持跨多个音视频记录进行问题回答。此外，通义听悟还上线了一键AI改写和思维导图自动...

生成式AI 2024-03-19 人工智能

989阅读

阿里大模型产品 “通义听悟”升级上线音视频问答助手“小悟”

阿里大模型产品 “通义听悟” 在今日发布了多项新功能。其中，音视频问答助手 “小悟” 是重点新功能之一。用户可以通过 “小悟” 进行自由问答，支持对单个最长6小时、一次性上百条音视频的内容理解问答。除了音视频问答功能外，通义听悟还提供了一键 AI 改写和...

大数据 2024-03-19 人工智能

845阅读

基于“Discuz采集发布时间”的功能分析与应用探讨

在当今互联网信息时代，论坛作为信息交流的重要平台，承载着大量用户生成的内容。Discuz作为一款广受欢迎的论坛软件系统，为用户提供了丰富的功能和灵活的定制性。其中，“Discuz采集发布时间”作为Discuz系统中的一个重要功能，对于内容管理和用户交互起到...

生成式AI 2024-03-17 大数据

946阅读

[AIGC] 深入理解Flink中的窗口、水位线和定时器

Apache Flink是一种流处理和批处理的混合引擎，它提供了一套丰富的APIs，以满足不同的数据处理需求。在本文中，我们主要讨论Flink中的三个核心机制：窗口（Windows）、水位线（Watermarks）和定时器（Timers）。 1. 窗口...

人工智能 2024-03-17 人工智能

906阅读

开环端到端自动驾驶中自车状态是你所需要的一切吗？

本文经自动驾驶之心公众号授权转载，转载请联系出处。原标题：Is Ego Status All You Need for Open-Loop End-to-End Autonomous Driving? 论文链接：https://arxiv.org/a...

AIGC 2024-03-07 人工智能

1056阅读

PowerBI Copilot淘宝用户行为数据分析实战

一、背景介绍 Copilot作为Microsoft大杀器，已经推出了有一段时间，本公众号也专门多次撰文介绍： Copilot in Power BI等了好久终于等到今天 Copilot in Power BI详细使用说明 PowerBI Copil...

生成式AI 2024-02-28 人工智能

1179阅读

whisper.cpp安装配置

下载代码，代码地址：https://github.com/ggerganov/whisper.cpp 下载模型，现有模型如下，small 模型基本能达到日常的用途，建议下载 small 以上的。下载模型的指令： ./download-ggml-mode...

人工智能 2024-02-25 人工智能

1848阅读

全网最全Stable Diffusion原理快速上手，模型结构、关键组件、训练预测方式！！！！

手把手教你入门绘图超强的AI绘画程序，用户只需要输入一段图片的文字描述，即可生成精美的绘画。给大家带来了全新保姆级教程资料包（文末可获取）【AIGC】Stable Diffusion的建模思想、训练预测方式快速在这篇博客中，将会用机器学习入门级描...

大数据 2024-02-21 人工智能

1118阅读

有道ai写作，突破免费限制，无限制使用

预览效果文末提供源码包及apk下载地址有道ai写作python版 import hashlib import time import json import ssl import base64 import uuid from urlli...

生成式AI 2024-02-19 人工智能

1244阅读

如何使用MyScale将知识库引入OpenAI的GPT

译者 | 李睿审校 | 重楼 2023年11月6日，OpenAI公司对外发布了ChatGPT。在这个无代码平台上，专业(或业余开发人员可以使用工具和提示构建定制的GPT或聊天机器人，有效地改变他们与OpenAI GPT的交互。以前的交互（LangCh...

大数据 2024-02-19 人工智能

1003阅读

Lag-Llama:第一个时间序列预测的开源基础模型介绍和性能测试

2023年10月，我们发表了一篇关于TimeGPT的文章，TimeGPT是时间序列预测的第一个基础模型之一，具有零样本推理、异常检测和共形预测能力。虽然TimeGPT是一个专有模型，只能通过API访问。但是它还是引发了对时间序列基础模型的更多研究。到了...

人工智能 2024-02-16 人工智能

1057阅读

Whisper

文章目录使后感 Paper Review 个人觉得有趣的 Log Mel spectrogram & STFT Training cross-atte...

AIGC 2024-02-13 人工智能

936阅读

实战whisper：本地化部署通用语音识别模型

前言 Whisper 是一种通用语音识别模型。它是在大量不同音频数据集上进行训练的，也是一个多任务模型，可以执行多语言语音识别、语音翻译和语言识别。这里呢，我将给出我的一些代码，来帮助你尽快实现【语音转文字】的服务部署...

生成式AI 2024-02-09 人工智能

2632阅读

零基础看懂免费开源的Stable Diffusion

文章目录前言 Diffusion模型推理过程训练过程 Stable Diffusion模型参考前言前面一篇文章主要讲了扩散模型的理论基础，还没看过上篇的小伙伴可以点击查看：DDPM理论基础。这篇我们主要讲一下一经推...

人工智能 2024-02-09 人工智能

1220阅读

stable diffusion实践操作-SD原理

系列文章目录本文专门开一节写SD原理相关的内容，在看之前，可以同步关注：stable diffusion实践操作文章目录系列文章目录前言一、原理说明 1.1、出图原理 1.1.1 AI画画不是和人一样，从0开始，而是一...

AIGC 2024-02-08 人工智能

940阅读

LLaMA模型指令微调字节跳动多模态视频大模型 Valley 论文详解

Valley: Video Assistant with Large Language model Enhanced abilitY 大家好，我是卷了又没卷，薛定谔的卷的AI算法工程师「陈城南」~ 担任某大厂的算法工程师，带来最新的前沿AI知识和工具...

大数据 2024-02-03 人工智能

1080阅读

史上最全知识图谱建模实践（下）：多元关系架构

在“知识图谱之本体结构与语义解耦——基于OpenSPG的建模实践（上）”一文中，我们从实体关系设计和概念语义建模2种场景，讲解了基于SPG的知识建模的方法和案例。本文中，我们将继续讲解多元关系架构场景中的知识建模实践。如果你的图谱，涉及对带有时空信息的...

生成式AI 2024-02-02 人工智能

1058阅读