多任务第3页 - AIGC资讯

Discuz采集器吧：解析其功能与使用注意事项

在网络信息时代，内容的采集与整合成为许多网站和论坛运营者的重要工作。而“Discuz采集器”作为一款功能强大的内容采集工具，受到了广泛关注。本文将从Discuz采集器的基本概念、功能特点、使用注意事项等方面进行分析，为广大网友提供有益的参考。一、Discu...

大数据 2024-03-08 大数据

534阅读

一个关于BEV车道线落地的点点滴滴

本文经自动驾驶之心公众号授权转载，转载请联系出处。 21年埋下了一颗种子看过BEV障碍物故事的同学应该清楚，我们组是在21年10月左右开始做BEV 障碍物的。那个时候不敢想着去做BEV 车道线，因为没有人力。但是我记得在12月左右的时候，我们面到了...

人工智能 2024-03-06 人工智能

472阅读

CVPR2024｜AIGC(图像生成，视频生成等)相关论文汇总（附论文链接/开源代码/解析）【持续更新】

CVPR2024｜AIGC相关论文汇总（如果觉得有帮助，欢迎点赞和收藏） Awesome-CVPR2024-AIGC 1.图像生成(Image Generation/Image Synthesis ECLIPSE: A Resource-E...

人工智能 2024-03-05 人工智能

901阅读

逆天UniVision：BEV检测和Occ联合统一框架，双SOTA！

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&个人理解最近这几年以视觉为中心的3D感知在自动驾驶中得到了快速发展。尽管3D感知模型在结构和概念上有许多相似之处，但在特征表示、数据格式和目标方面仍存在差距，这对统一高效的3D感知...

生成式AI 2024-03-05 人工智能

519阅读

惊艳！！！特斯拉端到端演示视频分析

本文经自动驾驶之心公众号授权转载，转载请联系出处。外网有用户放了一段特斯拉FSD v12的视频，有人搬运到b站上了： https://www.bilibili.com/video/BV1Z6421M797www.bilibili.com/video/...

大数据 2024-03-04 人工智能

475阅读

金融分析多模态LLM FinTral:基于Mistral-7B模型得分接近GPT-4

近日，来自不列颠哥伦比亚大学和Invertible AI的研究人员推出了一款具有突破性的大型语言模型（LLM）——FinTral，专为金融领域量身定制。FinTral采用了多模态方法，能够处理文本、数字、表格和视觉数据，以应对金融文件的复杂性。该模型引入了...

生成式AI 2024-02-29 人工智能

633阅读

谷歌发布基础世界模型：11B参数，能生成可交互虚拟世界

Sora 问世才不到两个星期，谷歌的世界模型也来了，能力看起来更强大：它生成的虚拟世界「自主可控」。刚刚，谷歌定义了生成式 AI 的全新范式 —— 生成式交互环境（Genie，Generative Interactive Environments）。G...

生成式AI 2024-02-27 人工智能

496阅读

跨越千年医学对话：用AI技术解锁中医古籍知识，构建能够精准问答的智能语言模型，成就专业级古籍解读助手（LLAMA）

跨越千年医学对话：用AI技术解锁中医古籍知识，构建能够精准问答的智能语言模型，成就专业级古籍解读助手（LLAMA）介绍：首先在 Ziya-LLaMA-13B-V1基线模型的基础上加入中医教材、中医各类网站数据等语料库，训练出一个具有中医知识理解力的预...

大数据 2024-02-27 人工智能

513阅读

VSP-LLM官网体验入口视觉语音处理AI模型免费使用下载地址

VSP-LLM是一个结合视觉语音处理与大型语言模型的框架，旨在通过LLMs的强大能力最大化上下文建模能力。VSP-LLM设计用于执行视觉语音识别和翻译的多任务，通过自监督视觉语音模型将输入视频映射到LLM的输入潜在空间。该框架通过提出一种新颖的去重方法和低...

AIGC 2024-02-27 人工智能

583阅读

YOLOv8官网体验入口 AI计算机视觉目标检测模型免费在线使用地址

YOLOv8是YOLO系列目标检测模型的最新版本。它能够在图像或视频中准确快速地识别和定位多个对象，并实时跟踪它们的移动。相比之前版本，YOLOv8在检测速度和精确度上都有很大提升，同时支持多种额外的计算机视觉任务，如实例分割、姿态估计等。YOLOv8可通...

生成式AI 2024-02-21 人工智能

552阅读

逆天了！UniVision：BEV检测和Occ联合统一框架，双任务SOTA！

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&个人理解最近这几年以视觉为中心的3D感知在自动驾驶中得到了快速发展。尽管3D感知模型在结构和概念上有许多相似之处，但在特征表示、数据格式和目标方面仍存在差距，这对统一高效的3D感知...

AIGC 2024-02-21 人工智能

575阅读

如何免费访问和使用Gemini API？

Gemini是谷歌开发的一个新模型。有了Gemini可以为查询提供图像、音频和文本，获得几乎完美的答案。我们在本教程中将学习Gemini API以及如何在机器上设置它。我们还将探究各种Python API函数，包括文本生成和图像理解。 Gemini A...

大数据 2024-02-18 人工智能

1334阅读

近期关于AIGC方面的学习笔记和思路整理

LLM 对于LLM，我现在重点关注在这几个方面：开源且可私有化部署的代码生成模型：因为大部分软件企业对于安全都很重视，文档、数据、代码一般都会尽量避免被泄露。所以很难使用类似Copilot或者OpenAI的Bito这种需要连到互联网上的服务。如果...

生成式AI 2024-02-17 人工智能

567阅读

实战whisper：本地化部署通用语音识别模型

前言 Whisper 是一种通用语音识别模型。它是在大量不同音频数据集上进行训练的，也是一个多任务模型，可以执行多语言语音识别、语音翻译和语言识别。这里呢，我将给出我的一些代码，来帮助你尽快实现【语音转文字】的服务部署...

生成式AI 2024-02-09 人工智能

1995阅读

跟着AIGC学Linux：简介（一）

文章目录 1.Linux内核的历史 2.基本概念 3.发行版 4.Linux应用领域 5.Linux VS Windows 横向对比表格： 1.Linux内核的历史 Linux内核最初由一位名叫Linus Torvalds的芬兰计...

人工智能 2024-02-08 人工智能

562阅读

三个Agent顶个GPT-4，基于开源小模型的那种

真·“三个臭皮匠，顶个诸葛亮”—— 基于开源小模型的三个Agent协作，比肩GPT-4的工具调用效果！话不多说，直接来看两个系统执行记录。用户表示自己是一个音乐爱好者，想探索不同的音乐流派以及音乐家。于是指定模型使用Deezer和Shazam的API...

AIGC 2024-02-07 人工智能

506阅读

MedicalGPT：基于LLaMA-13B的中英医疗问答模型（LoRA）、实现包括二次预训练、有监督微调、奖励建模、强化学习训练[LLM:含Ziya-LLaMA]。

项目设计集合（人工智能方向）：助力新人快速实战掌握技能、自主完成项目设计升级，提升自身的硬实力（不仅限NLP、知识图谱、计算机视觉等领域）：汇总有意义的项目设计集合，助力新人快速实战掌握技能，助力用户更好利用 CSDN 平台，自主完成项目设计升级，提升自身...

生成式AI 2024-02-06 人工智能

557阅读

香港最大AI诈骗案：Deepfake换脸「英国CFO」，直接骗走公司2亿港币

【新智元导读】香港一家跨国公司员工，被骗子邀请进了用Deepfake做的「高管视频会议」中，下令让他转了2亿港币到不知名中账户，5天之后才发现被骗了。这几天，古老的AI应用——「AI换脸」多次破圈，屡屡登上热搜。先是网上充斥的大量泰勒斯威夫特的「AI艳...

人工智能 2024-02-05 人工智能

483阅读

香港最大AI诈骗案！Deepfake换脸「英国CFO」，直接骗走公司2亿港币

这几天，古老的AI应用——「AI换脸」多次破圈，屡屡登上热搜。先是网上充斥的大量泰勒斯威夫特的「AI艳照」，逼得X（原推特）只能直接屏蔽了所有有关「Tylor Swift」的搜索。而今天香港警方向社会公布了一起更离谱的诈骗案件：一家英国跨国企业的中...

AIGC 2024-02-05 人工智能

488阅读

Segment Anything论文翻译，SAM模型，SAM论文，SAM论文翻译；一个用于图像分割的新任务、模型和数据集；SA-1B数据集

【论文翻译】- Segment Anything / Model / SAM论文论文链接： https://arxiv.org/pdf/2304.02643.pdf https://ai.facebook.com/research/publica...

大数据 2024-02-05 人工智能

859阅读

一文搞懂使用 Arthur Bench 进行 LLM 评估

Hello folks，我是 Luga，今天我们来聊一下人工智能(AI 生态领域相关的技术 - LLM 评估。一、传统文本评估面临的挑战近年来，随着大型语言模型(LLM 的快速发展和改进，传统的文本评估方法在某些方面可能已经不再适用。在文本评估领...

人工智能 2024-02-04 人工智能

512阅读

Vision Pro开卖炸出各种显眼包！开车/健身/过马路操作秀翻天，AI大牛Karpathy发千字亲测体验

全球第一台Vision Pro被捧出店门的那一刻，整个人群沸腾了。历史会记住这一刻。苹果Vision Pro的诞生，注定改变全人类，改变全世界。 2月2日早上9点，库克亲临现场，推开纽约苹果门店的大门。国内的网友，开始打飞的去大洋彼岸抢Visio...

大数据 2024-02-04 人工智能

470阅读

大的要来了：谷歌Bard被曝将更名为Gemini，Ultra 1.0更强但收费、安卓App也会来

终于，谷歌去年 12 月承诺的 Gemini Ultra 要与大家见面了吗？今天，推特网友爆出的谷歌 Bard「大料」引发了社媒广泛热议。这位爆料者提供了一张谷歌 Bard 的更新日志截图，显示接下来几天会迎来一次非常重大的调整。谷歌 Bard 预...

AIGC 2024-02-04 人工智能

548阅读

图领域首个通用框架来了！入选ICLR'24 Spotlight，任意数据集、分类问题都可搞定

能不能有一种通用的图模型—— 它既能够根据分子结构预测毒性，又能够给出社交网络的朋友推荐？或者既能预测不同作者的论文引用，还可以发现基因网络中的人类衰老机制？你还真别说，被ICLR 2024接收为Spotlight的“One for All（OFA）...

生成式AI 2024-02-04 人工智能

509阅读

讯飞星火大模型重磅升级，对标GPT-4 Turbo！星火语音大模型发布，37个主流语种识别超OpenAI！

出品 | 51CTO技术栈（微信号：blog51cto） 1月30日，讯飞星火认知大模型V3.5成功发布！用核心能力的突破，回应时代的疑问。迈向更通用、实用的全民开放大模型，讯飞星火全面对标国际先进水平，同时首次发布星火语音大模型和星火开源大模型。 1、...

人工智能 2024-02-02 人工智能

560阅读

Depth Anything：释放大规模无标注数据的深度估计

本文经自动驾驶之心公众号授权转载，转载请联系出处。 24年1月论文“Depth Anything: Unleashing the Power of Large-Scale Unlabeled Data“，来自香港大学、字节、浙江实验室和浙江大学。这项...

AIGC 2024-02-01 人工智能

537阅读

多模态LLM多到看不过来？先看这26个SOTA模型吧

当前 AI 领域的关注重心正从大型语言模型（LLM）向多模态转移，于是乎，让 LLM 具备多模态能力的多模态大型语言模型（MM-LLM）就成了一个备受关注的研究主题。近日，腾讯 AI Lab、京都大学和穆罕默德・本・扎耶德人工智能大学的一个研究团队发布...

生成式AI 2024-01-31 人工智能

488阅读

近200+自动驾驶数据集全面调研！一览如何数据闭环全流程

写在前面&个人理解自动驾驶技术在硬件和深度学习方法的最新进展中迅速发展，并展现出令人期待的性能。高质量的数据集对于开发可靠的自动驾驶算法至关重要。先前的数据集调研试图回顾这些数据集，但要么集中在有限数量的数据集上，要么缺乏对数据集特征的详细调查...

生成式AI 2024-01-31 人工智能

754阅读

PAI-ChatLearn ：灵活易用、大规模 RLHF 高效训练框架（阿里云最新实践）

PAI-ChatLearn 是阿里云机器学习平台 PAI 团队自主研发的，灵活易用、大规模模型 RLHF 高效训练框架，支持大模型进行 SFT（有监督指令微调）、RM（奖励模型）、RLHF（基于人类反馈的强化学习）完整训练流程。PAI-ChatLear...

人工智能 2024-01-30 人工智能

704阅读

无需人工标注！LLM加持文本嵌入学习：轻松支持100种语言，适配数十万下游任务

文本嵌入（word embedding）是自然语言处理（NLP）领域发展的基础，可以将文本映射到语义空间中，并转换为稠密的矢量，已经被广泛应用于各种自然语言处理（NLP）任务中，如信息检索（IR）、问答、文本相似度计算、推荐系统等等，比如在IR领域，第...

AIGC 2024-01-29 人工智能

507阅读

未来五年AI如何改变各学科？从LLM到AI蛋白设计、医疗保健......

五年前（2019 年 1 月），《Nature Machine Intelligence》创刊。当然，就人工智能（AI）而言，五年前似乎是一个不同的时代。 1 月 24 日，Nature Machine Intelligence 杂志在《Annivers...

AIGC 2024-01-29 人工智能

511阅读

中文性能反超VLM顶流GPT-4V，阿里Qwen-VL超大杯限免！看图秒写编程视觉难题一眼辨出

【新智元导读】多模态大模型将是AI下一个爆点。最近，通义千问VLM模型换新升级，超大杯性能堪比GPT-4V。最最重要的是，还能限时免费用。最近，通义千问实火。前段时间被网友玩疯的全民舞王，让「AI科目三」频频登上热搜。让甄嬛、慈禧、马斯克、猫主子和兵...

生成式AI 2024-01-26 人工智能

662阅读

文心一言快速上手方法及常用指令汇总

文心一言四个字的来源是《文心雕龙》，这本书是中国南朝梁代文学家刘飙所著的一本文学理论著作，而其中的“文心”二字恰好与“一言”共用一个“言”字，这便构成了“文心一言””这一名字。文心一言是百度研发的知识增强大语言模型，能够与人对话互动，回答问题,协助创作...

生成式AI 2024-01-26 人工智能

874阅读

AIGC领域的多模态深度学习你知道多少？一文带你Get

Look！?我们的大模型商业化落地产品 ?更多AI资讯请??关注 Free三天集训营助教在线为您火热答疑??‍? 什么是多模态深度学习? 多模态深度学习(英文名:Multimodal Deep Learning 是人工智能(AI 的一个子领域...

大数据 2024-01-25 人工智能

728阅读

迈向分割的大一统！OMG-Seg：一个模型搞定所有分割任务

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者个人思考图像分割已经从单任务分割走到了语义分割、实例分割、全景分割三种分割任务的统一；大模型以及多模态的发展又带来了文本和图像统一，使得跨模态端到端成为可能；追求更高级、更全面...

生成式AI 2024-01-24 人工智能

644阅读

UCLA提出多模态具身智能大模型MultiPLY AI首次拥有类人感官

近日，UCLA等机构的研究人员推出了具身智能大模型MultiPLY，该模型不仅具备多模态感知能力，包括触觉、视觉、听觉等，使得AI能够更全面地与3D环境进行交互。这标志着具备多感官能力的大模型成为未来AI发展的重要方向。 MultiPLY在多任务实验中表...

AIGC 2024-01-22 人工智能

602阅读

逆天了！UniVision：BEV检测和Occupancy联合统一框架，双任务SOTA！

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&个人理解最近这几年以视觉为中心的3D感知在自动驾驶中得到了快速发展。尽管3D感知模型在结构和概念上有许多相似之处，但在特征表示、数据格式和目标方面仍存在差距，这对统一高效的3D感知...

AIGC 2024-01-22 人工智能

526阅读

大模型自我奖励：Meta让Llama2自己给自己微调，性能超越了GPT-4

大模型领域中，微调是改进模型性能的重要一步。随着开源大模型逐渐变多，人们总结出了很多种微调方式，其中一些取得了很好的效果。最近，来自 Meta、纽约大学的研究者用「自我奖励方法」，让大模型自己生成自己的微调数据，给人带来了一点新的震撼。在新方法中，作者...

人工智能 2024-01-21 人工智能

488阅读

每日一看大模型新闻（2023.11.20）OpenAI安全系统负责人长文梳理：大模型的对抗攻击与防御；谷歌Bard「破防」，用自然语言破解，提示注入引起数据泄漏风险；真正实现一步文生图，谷歌UFO

1.产品发布 1.1长虹：首个基于大模型的智慧家电AI平台发布日期：2023.11.20 全球首个基于大模型智慧家电AI平台长虹云帆震撼发布！主要内容：长虹智慧AI平台发布会上，发布了全球首个基于大模型的智慧家电AI平台——长虹云帆。据介绍...

AIGC 2024-01-21 人工智能

608阅读

被OpenAI、Mistral AI带火的MoE是怎么回事？一文贯通专家混合架构部署

选自 HuggingFace 博客编译:赵阳专家混合（MoE）是 LLM 中常用的一种技术，旨在提高其效率和准确性。这种方法的工作原理是将复杂的任务划分为更小、更易于管理的子任务，每个子任务都由专门的迷你模型或「专家」处理。早些时候，有人爆料...

生成式AI 2024-01-21 人工智能

1272阅读

最近读的AIGC相关论文思路解读

AIGC之SD可控生成论文阅读记录提示：本博客是作者本人最近对AIGC领域相关论文调研后，临时记录所用，所有观点都是来自作者本人局限理解，以及个人思考，不代表对。如果你也正好看过相关文章，发现作者的想法和思路有问题，欢迎评论区留言指正！既然是论...

生成式AI 2024-01-19 人工智能

550阅读

ICLR'24无图新思路！LaneSegNet：基于车道分段感知的地图学习

写在前面&笔者的个人理解地图作为自动驾驶系统下游应用的关键信息，通常以车道或中心线表示。然而，现有的地图学习文献主要集中在检测基于几何的车道或感知中心线的拓扑关系。这两种方法都忽略了车道线与中心线的内在关系，即车道线绑定中心线。虽然在一个模型中...

人工智能 2024-01-19 人工智能

610阅读

GLM-4体验入口智谱AI多模态大模型在线使用地址

GLM-4是由智谱AI在首届技术开放日上发布的一款新型大模型。GLM- 4 在性能上全面提升近60%，支持更长的上下文、更强的多模态支持和更快速的推理。产品定位为下一代基座大模型，旨在为文本处理、数据分析、图像生成等领域提供高效的AI解决方案。点击前往...

生成式AI 2024-01-18 人工智能

615阅读

AI聊天机器人，一个就够了：文心一言、讯飞星火、通义千问AI聊天机器人深度对比（二）

一些结论本次为第二部分的测评，第一部分的测评请点击这里。综合结论：：通义千问 > 讯飞星火 > 文心一言。逻辑推理能力：讯飞星火 = 通义千问 > 文心一言。对于基本的逻辑推理问题，三个AI聊天机器人都能通过测试。但对...

大数据 2024-01-18 人工智能

1144阅读

如何将知识图谱与AIGC结合？京东是这么做的

一、导言首先介绍一下京东在电商场景下 AIGC 方面的探索。这是一个商品营销文案自动生成的全景图，自下而上首先是商品的输入信息。输入信息是异构多源的，包括商品的商详页里的图片、文本、商品的标题以及商品的知识图谱。通用的知识图谱是三元组的形式，...

大数据 2024-01-18 人工智能

592阅读

语音识别whisper的介绍、安装、错误记录

介绍 Whisper是OpenAI于2022年9月份开源的通用的语音识别模型。它是在各种音频的大型数据集上训练的模型，也是一个可以执行多语言语音识别、语音翻译和语言识别的多任务模型。论文链接：https://arxiv.org/abs/2212.04...

人工智能 2024-01-17 人工智能

911阅读

机器人领域首个开源视觉-语言操作大模型，RoboFlamingo框架激发开源VLMs更大潜能

近年来，大模型的研究正在加速推进，它逐渐在各类任务上展现出多模态的理解和时间空间上的推理能力。机器人的各类具身操作任务天然就对语言指令理解、场景感知和时空规划等能力有着很高的要求，这自然引申出一个问题：能不能充分利用大模型能力，将其迁移到机器人领域，直接...

大数据 2024-01-17 人工智能

522阅读

请查收使用OpenAI的Whisper进行语音识别的攻略

Whisper是一种令人激动的新型语言模型，采用了全新的语音识别方法，即使是低质量的音频，Whisper也能产生高质量的结果，并且对各种声音和语言的适应性极强，无需进行微调。 Whisper是开源的，有一系列可用的模型尺寸，可以作为众多语音转文字应用的有...

AIGC 2024-01-16 人工智能

860阅读

马斯克机器人炫技引千万网友围观！

特斯拉机器人，开始干家务了。马斯克通过最新视频，晒起特斯拉擎天柱机器人叠衣服，引发大量网友围观。现在机器人叠衣服只需要3步，30秒一件。第一步，先把衣服从篮子里拿出来，直接就叠好一边袖子。第二步，丝滑调整衣服位置，对齐另外半边。最后一头一...

大数据 2024-01-16 人工智能

462阅读

广义人工智能时代：通往通用人工智能（AGI）之路

人工智能(AI 将于2024年进一步改进，大型语言模型有望进一步发展。 2023年对于人工智能和生成式人工智能来说是激动人心的一年，特别是那些采用大型语言模型(LLM 架构的人工智能，比如来自开放人工智能(GPT 4 、Anthropic(Claud...

AIGC 2024-01-16 人工智能

504阅读