当前位置:AIGC资讯 > 可扩展 第13页
-
Datasaur推出LLM实验室,助力企业构建自定义AI应用
San Francisco的AI初创公司Datasaur宣布推出LLM Lab,这是一款全面的工具,旨在帮助企业构建自定义的大型语言模型应用,类似于ChatGPT。LLM Lab可在云端或本地部署,为企业提供构建内部自定义生成式AI应用的起点,同时减少了来...
-
让大模型看图比打字管用!NeurIPS 2023新研究提出多模态查询方法,准确率提升7.8%
大模型“识图”能力都这么强了,为啥还老找错东西? 例如,把长得不太像的蝙蝠和拍子搞混,又或是认不出一些数据集中的稀有鱼类…… 这是因为,我们让大模型“找东西”时,往往输入的是文本。 如果描述有歧义或太偏门,像是“bat”(蝙蝠还是拍子?)或“魔鳉”(Cy...
-
首个多视角自动驾驶场景视频生成世界模型 | DrivingDiffusion: BEV数据和仿真新思路
笔者的一些个人思考 在自动驾驶领域,随着BEV-based子任务/端到端方案的发展,高质量的多视图训练数据和相应的仿真场景构建愈发重要。针对当下任务的痛点,“高质量”可以解耦成三个方面: 不同维度上的长尾场景:如障碍物数据中近距离的车辆以及切车过程中...