-
OpenAI o1-preview和o1-mini现已在 GitHub Copilot和GitHub Models中提供
微软 GitHub 今天宣布在 GitHub Copilot和 Models 中提供两个新的 Open AI 模型:o1-preview 和 o1-mini。OpenAI 推出了新的 o1 系列 人工智能模型,旨在花更多时间思考后再做出反应。与以前的 Op...
-
KREA集结了AI视频的四大金刚,誓要做AI创作者的“POE”。
前天,Runway宣布把自己的API全量开放了,现在,人人都可以像接一个OpenAI的API一样,把AI视频接入到自己的产品中。 在20个小时之后,Krea.ai宣布正式上线一个集合站,能在这个产品里,一键使用Runway、Luma、可灵、海螺。 在K...
-
AI日报:百度发布一见视觉大模型v4.5;Adobe支持用AI做动画设计;Familia.AI推“复活亲人”软件
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、百度智能云一见视觉大模型v4....
-
Meta推出Llama 3.2 AI模型,支持多模态和边缘计算;OpenAI首席技术官穆拉蒂宣布离职
? AI新闻 ? Meta推出Llama 3.2 AI模型,支持多模态和边缘计算 摘要:Meta于9月25日发布Llama 3.2 AI模型,具备开放性和可定制性,支持开发者实现边缘人工智能和视觉应用。该系列包含多模态视觉模型(11B和90B)及轻...
-
Meta又给OpenAI一记重击,视频生成Movie Gen震撼登场,甚至可以配音、编辑
在 OpenAI Sora 难产的时候,Meta 首次公开展示了自家的「用于媒体的突破性生成式 AI 研究」:Meta Movie Gen。 Meta 在相应博客中使用了「premiere」一词,也就是初次展示,因此手痒的用户可能还得再等上一段时间。 M...
-
【AIGC】AI时代的数据安全:使用ChatGPT时的自查要点
博客主页: [小ᶻZ࿆] 本文专栏: AIGC | ChatGPT 文章目录 ?前言 ?法律法规背景 中华人民共和国保守秘密法 中华人民共和国网络安全法 中华人民共和国个人信息保护法 遵守法律法规的重要性...
-
Llama Farm 项目教程
Llama Farm 项目教程 llama_farm Use local llama LLM or openai to chat, discuss/summarize your documents, youtube videos, and so o...
-
史上最大规模!OpenAI完成66亿美元融资:成万亿AI独角兽
快科技10月4日消息,OpenAI宣布完成了新一轮66亿美元(约合464亿元人民币)融资,公司估值飙升至1570亿美元(约合1.1万亿人民币)。 这是硅谷史上最大的一次融资,超过了今年马斯克xAI的60亿美元规模,也让OpenAI继续成为AI独角兽中的领头...
-
使用 CTranslate2 实现 Faster Whisper 的加速转录
使用 CTranslate2 实现 Faster Whisper 的加速转录 近年来,语音识别技术得到了快速发展。OpenAI 的 Whisper 模型作为其中的佼佼者,以其高精度和强大的性能广受欢迎。然而,其较长的推理时间和高内存消耗也成为了限制其应...
-
推荐:Whisper Auto Captions - 创新的Final Cut Pro自动字幕工具
推荐:Whisper Auto Captions - 创新的Final Cut Pro自动字幕工具 项目介绍 Whisper Auto Captions 是一款基于OpenAI的Whisper模型打造的智能字幕插件,专为Final Cut Pro用...
-
OpenAI发布实时API公测版 3家语音API合作者揭晓
10月2日消息,今天,OpenAI发布了实时 API 公开测试版,用于构建基于GPT-4o语音到语音的AI应用和智能体,所有付费的开发者都能在应用程序中构建低延迟、多模态的实时互动体验。 同时,OpenAI 还公布了3家语音API合作者:LiveKit、A...
-
乏善可陈的第二届OpenAI开发者大会,果然没有掀起太大波澜
OpenAI 的宫斗大戏刚落下帷幕,今日凌晨就在旧金山召开了第二届 DevDay 开发者大会。 不过,与去年盛大的活动相比,今年略显低调,他们没有推出重大产品,而是选择对其现有的 AI 工具和 API 进行增量改进。 在这次活动中,OpenAI 发布了四大...
-
OpenAI 宣布 66 亿美元新融资 公司估值达到 1570 亿美元
根据 OpenAI 公司发布的博客文章,OpenAI 刚刚完成了一轮历史性融资,筹集了 66 亿美元,估值达到 1570 亿美元,将继续追求其构建通用人工智能的使命。 据《金融时报》报道,本轮融资由 Thrive Capital 领投,承诺投资 10 亿...
-
奥特曼:自认比o1聪明请举手🤚到o2还这么想么🤨?|OpenAI开发者日
这一幕,刚刚在OpenAI开发者日最后一个环节——奥特曼炉边谈话中上演。 对话由奥特曼和OpenAI首席产品官Kevin Weil进行,奥特曼还对未来作出如下判断: 无限上下文长度将在十年内发生 o1正在推动智能体应用,人们将要求AI在一小时内完成以前人...
-
OpenAI官宣464亿新融资,成为万亿独角兽!还针对马斯克xAI搞二选一
464亿元资金,11051亿元投后估值! OpenAI新一轮融资,现已尘埃落定——刷新硅谷历史最高融资纪录。 尽管刚经历高管动荡,苹果也未按早期传闻参与其中,OpenAI官方公告仍显示: 本轮融资由OpenAI老股东Thrive Captial领投,微...
-
llama-factory实战: 基于qwen2.5-7b 手把手实战 自定义数据集清洗 微调
基于qwen2.5 手把手实战 自定义数据集 微调(llama-factory) 准备工作 1.数据集准备(例:民法典.txt) 2.服务器准备(阿里云 DSW 白嫖) 3.环境配置 pip 升级 模型下载 微调助手 4.数据集处理 脚...
-
Whisper JAX:闪电般快速的语音识别框架
Whisper JAX:闪电般快速的语音识别框架 whisper-jaxJAX implementation of OpenAI's Whisper model for up to 70x speed-up on TPU.项目地址:https://gi...
-
国内外大模型汇总:Open AI大模型、Google大模型、Microsoft大模型、文心一言大模型、通义千问大模型、字节豆包大模型、智普清言大模型
Open AI大模型 特点: 多模态能力:如GPT-4o,能接受文本、音频、图像作为组合输入,并生成任意形式的输出。 情感识别与回应:具备情感识别能力,能根据对话者的情绪做出有感情的回应。 几乎无延迟:对音频输入的响应时间极短,与人类对话相似。...
-
Python Poetry fails to add openai-whisper due to triton installation error
题意:Python Poetry 因 Triton 安装错误而无法添加 openai-whisper。 问题背景: so im trying to use openai-whisper. i'm using poetry as my env a...
-
本地搭建 Whisper 语音识别模型
Whisper 是由 OpenAI 开发的一款强大的语音识别模型,具有出色的多语言处理能力。搭建和使用 Whisper 模型可以帮助您将音频内容转换为文本,这在语音转写、语音助手、字幕生成等应用中都具有广泛的用途。本指南将对如何在本地环境中搭建 Whisp...
-
OpenAI开发者大会推出四大创新:提示词缓存可减少50%输入token成本
10月2日消息,美东时间10月1日OpenAI举行了年度开发者大会DevDay,推出系列新工具,包括四大创新:实时API(Realtime API)、视觉微调(Vision Fine-Tuning)、提示词缓存(Prompt Caching)、模型蒸馏(M...
-
告别迷茫!AI绘画工具初学者指南(小白解惑篇)
在近一月的时间,发现有很多刚刚了解AI 的朋友们,对于AI绘图工具很是模糊和迷茫,不知道是怎么回事,该选哪款AI绘图工具去学习。所以,今天我就来给初识AI的朋友们写一篇AI绘画工具介绍,这是专为小白解惑的。如果你已经有AI绘图经验的就可以滤过了。 一、...
-
自由创作无拘束!无需审核的AI绘画APP大放送!
自由创作无拘束!无需审核的AI绘画APP大放送! 艺术创作一直以来都是一种个人表达的方式,无论是通过画笔、音乐还是文字,我们都在用自己的方式诠释世界。然而,现代科技带来了新的突破,特别是在AI绘画领域。以前,我们的创作可能会受限于工具的限制或审美的束缚,...
-
马斯克万亿追击OpenAI,钢铁侠大战奥特曼
钢铁侠大战奥特曼,已经在大洋彼岸的美国上演了,而且比电影里精彩多了,这是一场靠燃烧美元持续的朴实无华的商战。 这个奥特曼就是OpenAI的CEO山姆奥特曼了,钢铁侠就是埃隆马斯克了。 在9月11日这个对美国来说有特殊意义的日子,彭博社发消息说OpenAI又...
-
探索LLaMA模型的无限可能:LLaMA API服务器项目推荐
探索LLaMA模型的无限可能:LLaMA API服务器项目推荐 llama-api An OpenAI-like LLaMA inference API 项目地址: https://gitcode.com/gh_mirrors/ll/llama...
-
Insanely Fast Whisper CLI 项目教程
Insanely Fast Whisper CLI 项目教程 insanely-fast-whisper-cli The fastest Whisper optimization for automatic speech recognition a...
-
大神卡帕西安利爆火AI应用,称「或是下一个ChatGPT」
大神卡帕西墙裂推荐! 甚至预言这个AI应用,有可能开启「和ChatGPT一样大的机会」。 它就是来自谷歌的实验性AI产品,Notebook LM,背后由谷歌现在最强大的模型Gemini1.5Pro提供支持。 最近这应用要多火就有多火,全因上线了一项新功能...
-
奥特曼称AI将创造更多新工作:就业市场依旧会充满机遇
在最近由美国知名招聘平台Indeed的首席执行官克里斯·海姆斯主持的访谈中,OpenAI的掌门人萨姆·奥特曼对人工智能导致大规模失业的担忧进行了反驳,并建议学生们积极适应并掌握AI技术。在这次深入的对话中,奥特曼明确表示,他坚信未来的就业市场依旧会充满机遇...
-
给AI公司“打杂”,95后华人把估值做到138亿美元
在旧金山的 Showplace 广场,一栋曾经属于Airbnb的商业大楼最近迎来了新主人。在大部分科技公司都在业务收缩的当下,Scale AI,这家由95后华人创立的人工智能数据标注公司,大手一挥租下了旧金山市中心约18万平英尺的办公室。 就在不久前,Sc...
-
重磅!美国取消SB-1047法案,OpenAI、谷歌、Meta大难不死!
美国加州州长Gavin Newsom在今天凌晨正式否决——SB-1047法案! 值得一提的是,过去30天Gavin一共签署了17个关于监管大模型、生成式AI安全使用的法案,唯独否决了1047,看来他也不是一个糊涂人。 在这个积极否决的过程中,AI界泰斗-吴...
-
AIGC时代!AI的“iPhone时刻”与投资机遇
AIGC时代!AI的“iPhone时刻”与投资机遇 前言 AI的“iPhone时刻”与投资机遇 前言 AIGC,也就是人工智能生成内容,它就像是一股汹涌的浪潮,席卷了整个科技世界。它的出现,让我们看到了人工智能的无限潜力,也让我们...
-
Whisper ASR Webservice 使用教程
Whisper ASR Webservice 使用教程 whisper-asr-webserviceOpenAI Whisper ASR Webservice API项目地址:https://gitcode.com/gh_mirrors/wh/whis...
-
OpenAI Whisper API (InvalidRequestError)
题意: OpenAI Whisper API(无效请求错误) 问题背景: I'm trying to use OpenAI Whisper API to transcribe my audio files. When I run it by o...
-
AI日报:文生图新顶流?神秘蓝莓模型横空出世;阿里妈妈开源AI图像修复模型;谷歌斥资27亿美元重聘AI专家
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、神秘蓝莓模型横空出世:AI文生...
-
提示词工程学的前世今生:Generative Pre-trained Transformer 到AIGC,再到Prompt Engineering
人工智能(Artificial intelligence,AI)的演进已然变革了我们对于技术的理解以及应用方式。自最初的规则系统直至当下的深度学习,AI 在众多领域均彰显出了极为巨大的潜力。当中,生成式预训练模型(Generative Pre-traine...
-
别被报道迷惑!OpenAI的内部动荡背后还有这些真相!
最近,OpenAI 频繁登上各大媒体头条,《华尔街日报》、《纽约时报》和《The Information》等知名媒体都在关注这家 AI 巨头的内部矛盾和高管离职。 首席执行官 Sam Altman 的领导风格、公司战略调整以及财务状况成了焦点。 然而,作为...
-
OpenAI融资70亿,只剩孤家寡人?众人怒揭奥特曼真面目!
【新智元导读】眼看OpenAI要融资70亿,2025年收入预计高达116亿美元,奥特曼却忽然墙倒众人推。高管离职潮后,外界对他的嘲讽和质疑翻了天:爱权斗、爱push员工、给钱小气,甚至图谋颠覆非营利组织结构,公开抢夺数十亿美元资金!奥特曼这一波,还能坐稳吗...
-
OpenAI 融资谈判:苹果退出,微软和英伟达或将参与
据国外媒体报道,OpenAI 正在进行一轮投资谈判,预计将带来近70亿美元的投资。据知情人士透露,苹果最近退出了加入这一轮谈判,谈判定于下周结束。 另外两家科技巨头微软和英伟达也在就参与这一轮谈判。据知情人士透露,微软预计将在此前已向该公司投资130亿美元...
-
OpenAI高管震荡内幕:CEO无视安全仓促上马4o,员工每天干20小时赶进度,追名逐利不再理想主义
动荡内幕终于曝光—— OpenAI CTO Mira Murati的离开,与GPT-4o、Her息息相关! 简单来说,就是今年春天OpenAI为了大抢谷歌开发者大会的风头,紧急推出GPT-4o。 时间真的是非、常、紧、张,以至于安全团队只能在极短的时间内(...
-
在 windows 上部署使用 Whisper 教程
在 Windows 上部署 OpenAI Whisper:详细教程 OpenAI Whisper 是一个功能强大的多语言语音识别模型,能够处理多种音频格式并生成高质量的字幕文件。本文将详细介绍如何在 Windows 系统上部署 Whisper,利用 G...
-
使用 Whisper 项目的教程
使用 Whisper 项目的教程 use-whisperReact hook for OpenAI Whisper with speech recorder, real-time transcription, and silence removal b...
-
stable-diffusion-3-medium (SD3)模型下载
由于huggingface.co下载速度不佳,放在夸克网盘上了: 夸克网盘分享 有条件的可以从huggingface下载: https://huggingface.co/stabilityai/stable-diffusion-3-medi...
-
128 深入解析Llama Index的响应合成生成 llamaindex.core.response_synthesizers.generation.py
深入解析Llama Index的响应合成生成 在自然语言处理(NLP)领域,Llama Index 是一个强大的工具,用于构建和处理复杂的语言模型。本文将深入探讨 Llama Index 中的生成器模块(Generation),并通过详细的代码示例和技...
-
Insanely Fast Whisper CLI 使用教程
Insanely Fast Whisper CLI 使用教程 insanely-fast-whisper-cli The fastest Whisper optimization for automatic speech recognition a...
-
与其造神,不如依靠群体的力量:这家公司走出了一条不同于OpenAI的AGI路线
看过剧版《三体》的读者或许都记得一个名场面:来自三体的智子封锁了人类科技,还向地球人发出了「你们是虫子」的宣告。但没有超能力的普通人史强却在蝗群漫天飞舞的麦田中喊出:「把我们人类看成是虫子的三体人,他们似乎忘了一个事实,那就是虫子从来就没有被真正地战胜过」...
-
Stable-Diffusion-web UI运行环境搭建和界面配置
Stable-Diffusion-web UI运行环境搭建和界面配置 前言 一、论文 二、源码下载 三、权重模型和文件下载 (1)下载sd-v1-4.ckpt模型 (2)下载openai/clip-vit-large-patch14模型...
-
AI日报:确认!三只羊录音门音频是AI克隆;美图MOKI全面开放;谷歌NotebookLM重磅上线新功能
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、AI音频公司确认“三只羊录音门...
-
字节示“AI”苹果
大模型给了互联网公司一次加入果链的机会。 近期,据晚点LatePost爆料,字节正在探索将大模型与硬件结合,既自己开发AI硬件,也会与外部硬件公司合作,其中相关部门负责人正在推动豆包大模型与其他手机厂商的智能助手合作,类似OpenAI与苹果的结合。 早在今...
-
三只羊卢总的录音AI到底能不能做出来?我的答案是:当然能。
今天凌晨,N多人给我发了一张图,说警方通报了,问我到底怎么看三只羊录音是不是AI这事。 还有朋友跟我说,有个号称国内AI第一人的,之前信誓旦旦的说这录音必不可能是AI,AI做不出来。所以这个通报背后,会不会背后是有些阴谋论? 我差点都喷了,国内AI第一人...
-
<Project-3 Video2SubTitle> Python coding Flask应用:从视频中,提取对白,生成独立的字幕文件 浏览器页面交互 调用cuda, Whisper模型
原因: 在网上看到一个视频没有字幕。 记者问小泉纯一郎 (前日本首相 ,我只是好奇,想知道Y说的是什么。 上面这个帖子里的视频:https://x.com/i/status/1834489208398115295 视频没有字幕,那就自己做...