视觉内容第2页 - AIGC资讯

使用 Stable Diffusion Img2Img 生成、放大、模糊和增强

在线工具推荐： Three.js AI纹理开发包 - YOLO合成数据生成器 - GLTF/GLB在线编辑 - 3D模型格式在线转换 - 3D数字孪生场景编辑器 Stable Diffusion...

大数据 2024-01-03 人工智能

908阅读

大模型的出色能力有目共睹，而如果将它们整合进机器人，则有望让机器人拥有一个更加智能的大脑，为机器人领域带来新的可能性，比如自动驾驶、家用机器人、工业机器人、辅助机器人、医疗机器人、现场机器人和多机器人系统。预训练的大型语言模型（LLM）、大型视觉 -...

AIGC 2023-12-27 人工智能

896阅读

本文作者系360奇舞团前端开发工程师摘要：本文介绍了如何结合 OpenAI Whisper、FFmpeg 和 TTS（Text-to-Speech）技术，以实现将视频翻译为其他语言并更换声音的过程。我们将探讨如何使用 Ope...

生成式AI 2023-12-24 人工智能

1157阅读

GPT-4被吹的神乎其神，作为具备视觉能力的GPT-4版本——GPT-4V，也被大众寄于了厚望。但如果告诉你，初中生都知道的勾股定理，只适用于直角三角形。然而GPT-4V却自信将其用于钝角三角形中计算斜边长度。还有更离谱的，GPT-4V直接犯了致命的...

人工智能 2023-10-31 人工智能

952阅读

研究人员推出了一种新的视觉提示方法 Set-of-Mark（SoM），它可以让 OpenAI 多模态大模型 GPT-4V 在视觉内容理解方面有了质的提升。GPT-4V 是一种基于 GPT-4的多模态模型，可以同时处理文本和图像，并生成多种类型的输出。然而...

AIGC 2023-10-23 人工智能

1077阅读

10月20日消息，据外媒报道，微软宣布正式推出Azure AI Content Safety，这是一项新服务，可以帮助用户在应用程序和服务中检测和过滤有害的人工智能和用户生成的内容。该服务包括文本和图像检测，并识别微软所说的“冒犯、危险或不受欢迎”的...

AIGC 2023-10-23 人工智能

893阅读