图像编码第3页 - AIGC资讯

【多模态】3、CLIP | OpenAI 出品使用 4 亿样本训练的图文匹配模型

文章目录一、背景二、方法 2.1 使用自然语言来监督训练 2.2 建立一个超大数据集 2.3 选择预训练的方式——对比学习而非预测学习 2.4 模型缩放和选择三、效果四、思考论文：Learning Transferabl...

AIGC 2023-11-27 人工智能

2287阅读

从年初到现在，生成式 AI 发展迅猛。但很多时候，我们又不得不面临一个难题：如何加快生成式 AI 的训练、推理等，尤其是在使用 PyTorch 的情况下。本文 PyTorch 团队的研究者为我们提供了一个解决方案。文章重点介绍了如何使用纯原生 PyTo...

人工智能 2023-11-22 人工智能

850阅读

目录总体介绍总体流程模块介绍目标检测： grounding dino 目标分割：Segment Anything Model (SAM 整体思路模型结构：数据引擎图片绘制集成样例其他问题附录总体介绍...

生成式AI 2023-11-21 人工智能

2044阅读

最近几个月，整个AI行业的LLM（大语言模型）蓬勃发展，除了过去传统的纯文字的多模态能力的视觉语言模型，如 GPT-4，ImageBind等表现令人印象深刻。 ChatGLM-6B是中文用户使用非常舒服的一个开源中文LLM。2023年5月17日，智谱...

人工智能 2023-11-09 人工智能

1035阅读

功能简介屏幕共享包括屏幕采集和视频流推送两部分功能。与远程桌面不同，屏幕共享只是将本地桌面内容以视频流的方式分享到网络。本文的重点，是讲解如何应用 webrtc 的屏幕采集功能。对于 webrtc 视频编码传输功能的应用，需要专门的文章进行讲解，这里暂...

大数据 2023-11-08 大数据

1002阅读

Midjourney、Stable Difusion在商业变现和场景化落地方面获得了巨大成功，这让OpenAI看到了全新的商机，也是推出DALL·E3的重要原因之一。上周，OpenAI宣布在ChatGPT Plus和企业版用户中，全面开放文生图模型DAL...

AIGC 2023-10-24 人工智能

1281阅读