-
探索未来办公新方式:Whispering——基于OpenAI的无缝语音转文本神器
探索未来办公新方式:Whispering——基于OpenAI的无缝语音转文本神器 whispering 项目地址: https://gitcode.com/gh_mirrors/whis/whispering 在数字时代,效率和便捷...
-
AI日报:更稳更高清!可灵AI发布1.5版本;字节推音乐生成神器;阿里通义万相视频生成模型正式上线
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、可灵AI发布1.5版本 视频更...
-
真我GT5 Pro手机开始推送新版realme UI 5.0:加入AI传送门、AI大神辅助功能
真我realme副总裁、全球营销总裁、中国区总裁徐起表示,真我GT5 Pro系统新版固件RX3888_14.1.0.803开始陆续推送。 此次更新中,加入了AI传送门、AI大神辅助功能,以及音频播放器接入流体云、语音转文字中新增字幕功能等这些较为实用的功能...
-
使用Python和Pillow创建照片马赛克应用
在这篇博客中,我们将探讨如何使用Python创建一个简单而有趣的桌面应用程序。我们的目标是构建一个应用,允许用户选择一张照片,然后在照片的右下角添加马赛克效果。这个项目将展示如何结合使用wxPython来创建图形用户界面(GUI 和Pillow库来处理图像...
-
AIGC时代桌面软件开发技术展望
AIGC技术催生新一代桌面软件 现代大模型技术本质上是一种“NLP”技术,基于这个观点,文本描述驱动引擎就是AI技术落地无法规避的一道墙,每一个AI技术都必须实际的面对这个事实。就文本驱动技术而言,在一个token的两侧,分别插入一个...
-
ChatGPT近8小时大规模宕机 平替谷歌Gemini 搜索量飙升60%
近日,全球数百万用户陷入困境,因为 OpenAI 的旗舰聊天机器人 ChatGPT 在美东时间4日下午出现系统故障,持续时间长达近8个小时。这一事件影响到了 ChatGPT 的所有用户,包括网站、APP 和桌面应用,让用户无法正常使用这一关键工具。 Cha...
-
本地部署GPT MJ: chatgpt-web-midjourney-proxy本地部署指南
1.准备工作 本文通过docker或桌面应用程序部署,包括chatgpt和MJ绘图webui。可以部署在本地电脑,也可以部署在云服务器,方便随时远程访问。 准备调用API所需的KEY。 1.1 点击链接进入官网,直接点击右上角...
-
详解苹果和微软的AI集成策略
当OpenAI在其春季更新会议上宣布推出macOS的ChatGPT桌面应用时,人们不禁疑惑为什么它没有先从Windows开始,毕竟,微软是OpenAI的主要投资者,理应最早获得新ChatGPT功能的访问权限。 现在我们知道原因了,在Build会议上宣布...
-
Adobe Lightroom新增AI魔术橡皮擦功能 支持消除内容和虚化效果
Adobe 最近为 Lightroom 添加了一些新的生成式 AI 工具,包括对象移除和 AI 镜头模糊效果。 其中,“Generative Remove” 功能是一项在移动端、网页和桌面应用中体验的测试版功能,由 Firefly AI 模型提供支持。用户...
-
发布会对比惨烈,奥特曼发文暗讽谷歌!谷歌被曝疯狂重组迎击OpenAI
现在,OpenAI和谷歌的互怼,已经是摆在明面上了。 两天硝烟弥漫的发布会后,Sam Altman显然对OpenAI压过谷歌一头的表现非常满意。 就在刚刚,他在x上发文表示:「我努力不去过多思考我们的竞争对手,但我无法不去思考OpenAI和谷歌之间的美学...
-
云开发工具初创公司Replit在推动生成式AI的同时裁员20%
云开发工具初创公司 Replit Inc.,作为推动生成式人工能编码的先锋,宣布裁减30名员工,约占其总员工数的20%。 Replit 首席执行 Amjad Masad 在公司员工间发送的一封电子邮件中宣布了这一消息,该邮件今日发布在 X(原 Twitte...
-
GPT-4o手写板书以假乱真惊呆网友!杀死谷歌翻译,代码建模无所不能
GPT-4o到底有多强?只有用过才能知道。这两天,网友们不仅探索出了很多全新ChatGPT的炫酷用法,也逐渐开始意识到,这标志这OpenAI将逐渐替代谷歌曾经的地位,全面接管AGI时代。 随着越来越多人开始试用GPT-4o,大家发现发布会上的demo真的...
-
基本就是AGI?GPT-4o“它”来了
OpenAI昨晚发布的GPT-4o给许多智能助理丢下一颗震撼弹。它不仅是一款强大的多模态AI助理,同时,为了应对Google Gemini的免费策略,OpenAI也让它免费了。 GPT-4o其中的“o”代表“Omni”,也就是“全能”的意思,可见Open...
-
OpenAI 推出 Mac 版 ChatGPT 应用,今年晚些时候推出 Windows 版
IT之家 5 月 14 日消息,OpenAI 终于推出了 ChatGPT 桌面版应用程序,该公司在官方公告中表示:“从今天开始,我们将首先向 Plus 用户推出 macOS 应用,并在未来几周内向更广泛的用户开放。我们还计划在今年晚些时候推出 Wind...
-
AI 音乐应用 Udio 推出音频修复扩展新功能和付费订阅计划
AI 音乐初创公司 Udio 推出了几项新功能,包括音频修复和更长的上下文口,以改善音乐创作体验。Udio 还宣布了新的订阅计划细节。 新的 “音频修复工具让用户可以无缝地编辑和优化音轨的部分,Udio 表示。使用音频修复功能时,您选择轨的一部分,然后根据...
-
搭建StableStudio,体验Midjourney功能
最近火热的ChatGPT引爆了AIGC的讨论、AIGC目前可以创作包括文字、图像、音频、视频等内容、作为程序猿的我们怎么能不了解使用一下呢、随着AI绘画功能的兴起、最先到我们视野的就是Midjourney、今天给大家分享一个类似Midjourney的Sta...
-
AI制图工具丨Midjourney产品功能介绍
了解如何使用Discord上的Midjourney Bot通过简单的文本提示创建自定义图像 Midjourney是一款AI制图工具,只要关键字,就能透过AI算法生成相对应的图片,只需要不到一分钟。 可以选择不同画家的艺术风格,例如安迪华荷、达芬奇、达利...
-
Duck AI推多模式计算机交互数据收集器 DuckTrack:可收集鼠标、键盘、屏幕等数据
近日,Duck AI发布了一项引人注目的创新——DuckTrack,一款多模式计算机交互数据收集器。该工具的研发旨在为计算机代理的进步提供精准而准确的用户交互跟踪,成为训练智能系统的关键工具。 DuckTrack能够通过用户友好的桌面应用程序在主要操作系统...
-
微调Whisper语音识别模型和加速推理
前言 OpenAI在开源了号称其英文语音辨识能力已达到人类水准的Whisper项目,且它亦支持其它98种语言的自动语音辨识。Whisper所提供的自动语音识与翻译任务,它们能将各种语言的语音变成文本,也能将这些文本翻译成英文。本项目主要的目的是为了对W...