ide 第13页 - AIGC资讯

2023 re:Invent | Amazon Q 与 Amazon CodeWhisperer 面向企业开发者提效利器

2023 年，以 GPT 为代表的生成式 AI 引爆了新一轮技术热潮，短短一年的时间内，生成式 AI 已经成为科技世界发展的核心。作为云计算的行业风向标盛会 re ，本届: Invent 全球大会紧跟生成式 AI 浪潮，推出名为“ Amazon Q ”的生...

人工智能 2024-05-26 人工智能

843阅读

浅谈AIGC：人工智能的iPhone时刻，还是普通人至暗时刻？

2022年，当AI开始绘画的时候，很多设计师们觉得没什么。当AI开始生成代码的时候，很多程序员也觉得没什么。当ChatGPT出现的时候，才将AIGC这一领域彻底引爆。被称为AI届的『iPhone时刻』。 ChatGPT对搜索引擎领域冲击巨大，百度仓皇...

大数据 2024-05-26 人工智能

911阅读

微软重磅出击！新一代Copilot+ PC正式发布，直面苹果与OpenAI

微软重磅出击！新一代Copilot+ PC正式发布，直面苹果与OpenAI 博主猫头虎的技术世界 ? 欢迎来到猫头虎的博客 — 探索技术的无限可能！专栏链接： ? 精选专栏：《面试题大全》 — 面试准备的宝典！《I...

生成式AI 2024-05-26 人工智能

865阅读

基于Whisper语音识别的实时视频字幕生成 (一): 流式播放视频帧和音频帧

Whishow 一款基于python的音视频在线播放器 1. 安装 pip install whishow 2. 用法示例 1: 简单上手 cmd: python -m whishow <video_path_...

人工智能 2024-05-26 人工智能

866阅读

[Win11·Copilot] Win11 系统更新重启后任务栏 Copilot 图标突然消失 | 解决方案

文章目录前言 Copilot介绍产生异常的原因解决方案总结前言在 Windows 11 的最新系统更新之后，一些用户报告了任务栏中 Copilot 图标消失的问题。这篇技术博文将为您提供详细的解决方案，帮助您恢复 C...

人工智能 2024-05-26 人工智能

1904阅读

Llama 3大模型发布！快速体验推理及微调

Meta，一家全球知名的科技和社交媒体巨头，在其官方网站上正式宣布了一款开源的大型预训练语言模型——Llama-3。据了解，Llama-3模型提供了两种不同参数规模的版本，分别是80亿参数和700亿参数。这两种版本分别针...

大数据 2024-05-26 人工智能

1127阅读

CVPR 2024 | 图像超分、图像恢复汇总！用AIGC扩散模型diffusion来解决图像low-level任务的思路...

1、Arbitrary-Scale Image Generation and Upsampling using Latent Diffusion Model and Implicit Neural Decoder 超分辨率（SR）和图像生成是计算...

生成式AI 2024-05-26 人工智能

1646阅读

Stable Diffusion的安装和问题解决（附安装包和大模型）

小时候比较喜欢画画，如今AI盛行，各种绘画工具层出不穷，网上也看了很多，stable diffusion（sd）和midjunery（mj）算是主流，国内的文心、天工、甚至抖音什么的，我也尝试过，但是总的来说，跟sd和mj相比真的不好用。后来我找了网上一些...

人工智能 2024-05-26 人工智能

1404阅读

CVPR 2024 | 图像检测类（目标、deepfake、异常）！AIGC扩散模型diffusion解决detection任务...

目标跟踪 1、Delving into the Trajectory Long-tail Distribution for Muti-object Tracking 多目标跟踪（Multiple Object Tracking，MOT）是计算...

AIGC 2024-05-26 人工智能

1364阅读

Midjourney画图关键词-日本漫画类型关键词

Midjourney的画图关键词中，日本漫画类型关键词可以包括以下几种： 1. **Shonen**：少年漫画，通常以年轻男性为主要读者群，内容包含冒险、动作、科幻等元素。 2. **Shojo**：少女漫画，以年轻女性为主要读者群，内容通常包含浪漫、友...

人工智能 2024-05-26 人工智能

1130阅读

Llama 3开源！手把手带你推理，部署，微调

节前，我们星球组织了一场算法岗技术&面试讨论会，邀请了一些互联网大厂朋友、参加社招和校招面试的同学，针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。汇总合集《大模型面试...

大数据 2024-05-25 人工智能

984阅读

GitHub Copilot 登录失败问题

本人最近常用的开发软件是PyCharm和Visual Studio，最近临近期末，代码最强辅助GitHub Copilot却出现了登录失败的问题，让人非常头疼 1. 我遇到的登录失败长什么样据说GitHub Copilot的登录失败千奇百怪，这次我...

AIGC 2024-05-25 人工智能

1721阅读

Stable Diffusion介绍

Stable Diffusion是一种前沿的开源深度学习模型框架，专门设计用于从文本描述生成高质量的图像。这种称为文本到图像生成的技术，利用了大规模变换器（transformers）和生成对抗网络（GANs）的力量，以创建与给定文本提示相一致的图像。...

大数据 2024-05-25 人工智能

1064阅读

CVPR 2024 | 风格迁移和人像生成汇总！扩散模型diffusion用于经典AIGC方向

风格迁移 1、DEADiff: An Efficient Stylization Diffusion Model with Disentangled Representations 基于文本到图像扩散模型在迁移参考风格方面具有巨大潜力。然而，...

生成式AI 2024-05-25 人工智能

1282阅读

Llama 3 开源！手把手带你进行大模型推理，部署，微调和评估

节前，我们组织了一场算法岗技术&面试讨论会，邀请了一些互联网大厂朋友、参加社招和校招面试的同学，针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。基于大模型实践和技术交流，我...

AIGC 2024-05-25 人工智能

1219阅读

全网最全stable diffusion webui API调用示例，包含controlneth和segment anything的API（附json示例）

全网最全stable diffusion webui API调用示例，包含controlneth和segment anything的API（附json示例）交流群 100419879 欢迎合作?? V ： 864399407 GitHub：https...

人工智能 2024-05-24 人工智能

812阅读

首测！GPT-4o做Code Review可行吗？

编辑 | 言征出品 | 51CTO技术栈（微信号：blog51cto）近日，OpenAI一记重拳，推出了GPT-4o（“o”表示“omni”），将语音识别和对话方面的优势展示的淋漓尽致。几乎可以肯定，它也是一个更强的LLM。但它能进行代码审查吗？本文...

人工智能 2024-05-24 人工智能

915阅读

定制自己的 AI 角色CustomChar；AI知识点和面试题；提高llama 3 的微调速度Unsloth

✨ 1: CustomChar 允许你创建和定制自己的 AI 角色 CustomChar 是一个开源项目，它允许你创建和定制自己的 AI 角色。无论是游戏中的角色，还是个人的虚拟助手（比如电脑上的 JARVIS），甚至是在线教育体验中的虚拟...

AIGC 2024-05-24 人工智能

984阅读

AIGC实战——多模态模型DALL.E 2

AIGC实战——多模态模型DALL.E 2 0. 前言 1. 模型架构 2. 文本编码器 3. CLIP 4. 先验模型 4.1 自回归先验模型 4.2 扩散先验模型...

人工智能 2024-05-24 人工智能

788阅读

桌面版ChatGPT登台演讲，能视频通话还会实时读屏，GPT-4o demo再次惊艳：“能力还是被低估了”

GPT-4o桌面端最新Demo，与Sora的新作品一同亮相“欧洲AI春晚”VivaTech。现场，OpenAI工作人员不仅展示了观众期待已久的“视频通话”，还试着让ChatGPT发表了演讲。在视频聊天当中，即使给它的只有一幅抽象的简笔画，它也能立马...

生成式AI 2024-05-24 人工智能

986阅读

AI日报：效果炸裂！Krea Video向所有人开放；阿里花8亿入股Kimi；Arc Search可以打电话了；腾讯智影声音大模型升级

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、Krea AI视频生成工具向所...

大数据 2024-05-24 人工智能

966阅读

AI视频编辑方法ReVideo:可局部修改视频内容和运动轨迹

研究人员提出了一种名为 ReVideo 的视频编辑方法，该方法通过指定内容和运动来实现精确的视频编辑。与现有方法不同的是，ReVideo 可以在特定区域进行精确的视频编辑，既可以修改视频内容，也可以修改运动轨迹。 ReVideo产品入口:https://...

人工智能 2024-05-24 人工智能

913阅读

AI图案生成器Ideogram Tile:文本生成无缝重复的图案

人工智能初创公司 Ideogram 以其先进的文本转图像生成功能而闻名，如今宣布其平台迎来重大升级:Ideogram Tile。这一新功能允许用户从单个文本提示中创建无缝重复的图案，为设计师、艺术家和企业开辟了无限可能。使用 Ideogram Til...

大数据 2024-05-24 人工智能

1156阅读

一篇文章详细介绍Stable Diffusion模型原理及实现过程(附常用模型网站、下载方式)

目录前言何为Stable Diffusion模型？ Stable Diffusion工作原理： Stable Diffusion模型的应用场景 Stable Diffusion免费使用网站 stability.ai: 本地部...

人工智能 2024-05-24 人工智能

933阅读

马斯克谈AI未来：不工作也有高收入但活着无聊

5月24日消息，当地时间周四，特斯拉首席执行官埃隆·马斯克（Elon Musk）通过视频连线参加在法国巴黎举行的VivaTech技术大会，分享了他对未来的一种反乌托邦观点。当一位观众询问人工智能是否终将取代马斯克，并表达对人工智能夺走工作岗位的担...

人工智能 2024-05-24 人工智能

811阅读

Krea AI视频生成工具向所有人开放 Krea Video正式进入公测

视频来自Krea AI官方 Krea AI 最近宣布其视频生成工具Krea Video已经向所有人开放，正式进入公测阶段。这个新工具结合了关键帧和文本提示，让用户能够更灵活地创建视频。使用Krea Video，用户可以在时间线中添加关键帧和文本提示，这两...

AIGC 2024-05-24 人工智能

787阅读

AIGC实战——MuseGAN详解与实现

AIGC实战——MuseGAN详解与实现 0. 前言 1. MuseGAN 1.1 Bach Chorale 数据集 1.2 MuseGAN 生成器 1.3 MuseGAN 判别器 2. MuseGAN 分析小结系列链接 0...

大数据 2024-05-24 人工智能

1126阅读

AIGC-controlnet代码详细解读

hugging face 社区diffusers官方代码：stable_diffusion/controlnetcontrolnet.ipynb 原始代码的解读可以看看这个博主的：万字长文解读Stable Diffusion的核心插件—ControlNet...

大数据 2024-05-24 人工智能

1723阅读

Python爬虫入门(一)（适合初学者）

Python爬虫入门(一（适合初学者）关于爬虫是什么，怎样保证爬虫的合法性小编在这就不再过多的阐述，从本章起，小编将和大家一起分享在学习python爬虫中的所学，希望可以和大家一起进步，也希望各位可以关注一下我！首先我们来初步了解下如何使用开发...

AIGC 2024-05-24 大数据

962阅读

Truecaller与微软合作，允许用户克隆自己的声音，让AI帮你接听电话

Truecaller 与微软合作，允许用户克隆自己的声音，让 AI 帮你接听电话据报道，Truecaller与微软的Azure AI Speech合作，推出了一项新功能，允许用户录制自己的声音并生成一个AI版本的用户语音。这项创新技术使得Truecalle...

AIGC 2024-05-23 人工智能

827阅读

使用自己的数据集训练DETR模型

众所周知，Transformer已经席卷深度学习领域。Transformer架构最初在NLP领域取得了突破性成果，尤其是在机器翻译和语言模型中，其自注意力机制允许模型处理序列数据的全局依赖性。随之，研究者开始探索如何将这种架构应用于计算机视觉任务，特别是...

人工智能 2024-05-23 人工智能

1814阅读

视频：过去12个月基础AI大模型“战争”情况

推特用户chiefaioffice分享了过去12个月的基础模型战争情况，其中包括OpenAI、Google、Anthropic、01AI、Meta、Cohere、Alibaba、Mistral、Databricks、Nous Research等10000多...

大数据 2024-05-23 人工智能

744阅读

Gabby World V2:融合AI和区块链技术的全新龙与地下城风格游戏问世

站长之家（ChinaZ.com）5月22日消息:在全新的Gabby World V2游戏中，玩家将迎来一个融合了人工智能和区块链技术的独特体验。这款创新游戏以Dungeons & Dragons为灵感，为玩家提供了创建和探索故事的机会，打造了完全...

大数据 2024-05-22 人工智能

869阅读

深入解析“feifei爬虫”：原理、应用与风险

在信息爆炸的时代，数据已经成为了一种新的资源，甚至有“数据是新时代的石油”这样的说法。而在这场数据盛宴中，爬虫技术扮演着必不可少的角色。今天，我们就来深入解析一下“feifei爬虫”，探讨它的工作原理、应用场景以及潜在的风险。一、什么是“feifei爬虫”...

AIGC 2024-05-22 大数据

858阅读

Spring Boot爬虫：探索数据的新世界

在当今数据驱动的社会中，爬虫技术已成为获取和分析网络数据的重要手段。而Spring Boot，作为一个流行的Java开发框架，为我们开发高效稳定的爬虫应用提供了强大的支持。本文将深入探讨Spring Boot爬虫的原理、构建过程以及实际应用，带您领略爬虫技...

AIGC 2024-05-21 大数据

913阅读

蚂蚁多模态团队在视频多模态方向的技术探索

一、概述视频多模态检索在蚂蚁内部有着广泛的应用。视频多模态检索具体包括两个方向，一个是视频-文本的语义检索，另外一个是视频-视频的同源检索。视频-文本的语义检索方向旨在通过文本检索与其语义相近的视频，其检索文本未必在检索到的视频描述中直接出现，但检...

大数据 2024-05-21 人工智能

901阅读

谷歌数学版Gemini解开奥赛难题，堪比人类数学家！

四个月的迭代，让Gemini 1.5 Pro成为了全球最强的LLM（几乎）。谷歌I/O发布会上，劈柴宣布了Gemini 1.5 Pro一系列升级，包括支持更长上下文200k，超过35种语言。与此同时，新成员Gemini 1.5 Flash推出，设计...

AIGC 2024-05-20 人工智能

904阅读

AI在软件开发中的角色：辅助而非替代

事实表明，AI无法替代开发者，但更适用于优秀的开发者。而识别大型语言模型（LLM）生成的代码什么时候会出错，需要开发人员具有丰富的知识和经验。软件工程师David Showalter在谈到AI编程时表示：“目前，AI模型在帮助编程人员提高工作效率方面...

生成式AI 2024-05-20 人工智能

876阅读

Viva完全指南：AI生成工具与社区 - 使用方法教程与免费体验入口

探索Viva能为你带来哪些改变为什么选择Viva？ Viva不仅仅是一款产品——它是一个革命性的AI生成工具和社区，致力于提供Text-to-Image、Image-to-Image、Text-to-Video、Image-to-Video等功能，以及...

大数据 2024-05-20 人工智能

1797阅读

HuggingFace教你怎样做出SOTA视觉模型

前有OpenAI的GPT-4o，后有谷歌的系列王炸，先进的多模态大模型接连炸场。其他从业者在震撼之余，也再次开始思考怎么追赶这些超级模型了。刚好在这时，HuggingFace和法国索邦大学的一篇论文，总结出了构建视觉大模型的关键经验，给开发者指明了一...

生成式AI 2024-05-17 人工智能

922阅读

云开发工具初创公司Replit在推动生成式AI的同时裁员20%

云开发工具初创公司 Replit Inc.，作为推动生成式人工能编码的先锋，宣布裁减30名员工，约占其总员工数的20%。 Replit 首席执行 Amjad Masad 在公司员工间发送的一封电子邮件中宣布了这一消息，该邮件今日发布在 X（原 Twitte...

大数据 2024-05-17 人工智能

844阅读

基于深度学习的实时视频处理 | 入门指南

近来，整个机器学习领域似乎被大型语言模型（LLM）和检索增强生成（RAG）所掩盖。虽然许多用例可以从这些新的基础模型中受益，但在非文本数据方面仍存在差距。我常把当前的机器学习阶段比作汽车工业中从燃油车向电动车的转变。燃油车已经有完善的基础设施（如汽车服务...

AIGC 2024-05-17 人工智能

931阅读

路径规划概述：基于采样、搜索、优化全搞定！

本文经自动驾驶之心公众号授权转载，转载请联系出处。 1 决策控制与运动规划概述目前决策控制方法可以分为三类：sequential planning、behavior-aware planning、和end-to-end planning。 seq...

大数据 2024-05-17 人工智能

1161阅读

ChatGPT增强数据分析功能，实现与数据表格的实时交互

ChatGPT最近推出了一系列改进的数据分析功能，这些新功能将在未来几周内向ChatGPT Plus、Team和Enterprise用户提供。以下是主要的改进点: 文件上传:用户现在可以直接从Google Drive和Microsoft OneDriv...

人工智能 2024-05-17 人工智能

903阅读

浅析“yzmcms爬虫”技术及其应用

随着互联网技术的迅猛发展，信息获取与数据处理成为当下极为重要的任务。在这样的大背景下，爬虫技术应运而生，成为信息搜集与分析的得力助手。其中，“yzmcms爬虫”作为一款特定领域的爬取工具，备受业界关注。本文将从定义、原理、应用场景以及面临的挑战等多方面，对...

大数据 2024-05-17 大数据

896阅读

通义千问 2.5 “客串” ChatGPT4，你分的清吗？

作者：张添翼、董艺荃引子 OpenAI 发布了最新的 GPT-4o 模型，通义千问也在前不久刚发布通义千问 2.5，已经和 GPT-4-Turbo 不分伯仲：既然目前还没有和 GPT-4o 文本生成能力的对比数据，就让我们来和大模型一起做个游...

人工智能 2024-05-16 人工智能

963阅读

Ollama如何构建自己的Llama3中文模型

Ollama Ollama 是一个开源的大型语言模型（LLM）服务工具，它允许用户在本地机器上运行和部署大型语言模型。Ollama 设计为一个框架，旨在简化在 Docker 容器中部署和管理大型语言模型的过程，使得这一过程变得简单快捷。用户可以通过简单的...

大数据 2024-05-16 人工智能

1286阅读

谷歌推全新AI视频生成模型Veo，可创建高质量60秒、1080p视频

谷歌在其深度学习 AI 部门 DeepMind 的研究人员发布了一款名为 Veo 的全新式 AI 视频模型，能够创建“超过60秒的高质量、1080p 剪辑”，“从照片写实主义到超现实主义和动画，它可以应对一系列电影风格”，在逼真度和视觉果方面达到了令人惊叹...

生成式AI 2024-05-15 人工智能

1029阅读

谷歌反击：Project Astra正面硬刚GPT-4o、Veo对抗Sora、新版Gemini变革搜索

通用的 AI，能够真正日常用的 AI，不做成这样现在都不好意思开发布会了。 5 月 15 日凌晨，一年一度的「科技界春晚」Google I/O 开发者大会正式开幕。长达 110 分钟的主 Keynote 提到了几次人工智能？谷歌自己统计了一下：是的，...

AIGC 2024-05-15 人工智能

789阅读

谷歌Gemini对OpenAI贴脸开大！文生视频模型Veo硬刚Sora

谷歌近日发布了一系列强大的AI工具，展开了一场针对OpenAI的激烈竞争。这一波强势反击包括了Project Astra、Veo视频模型以及Gemini1.5Pro等一连串武器，旨在彻底颠覆谷歌搜索，并对OpenAI展开全面挑战。其中，谷歌发布的视频模型...

大数据 2024-05-15 人工智能

805阅读