物体计数 - AIGC资讯

当前位置：AIGC资讯 > 物体计数

Gemini vs GPT-4V到底哪家强？视觉-语言模型的全面比较和结合使用

概括大家好，我是戚张扬，目前就读于香港大学，今天和大家分享一篇我们关于视觉语言模型最新的研究，这篇论文提供了对谷歌的Gemini和OpenAI的GPT-4V(ision 两个SOTA模型的深入定性比较研究。我们的研究涉及到对这两个模型在视觉语言能力、与...

大数据 2023-12-29 人工智能
1269阅读
视觉CV-AIGC一周最新技术精选(2023-11)

PG-Video-LLaVA: Pixel Grounding Large Video-Language Models https://github.com/mbzuai-oryx/Video-LLaVA 将基于图像的大型多模态模型（LMM）扩...

生成式AI 2023-12-08 人工智能
871阅读

第一页 1 没有了