多任务第2页 - AIGC资讯

OpenAI 和谷歌 DeepMind已风险重重，13位硅谷AI大厂员工联名上信：我们需要对前沿AI发出警告的权利！

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）忍无可忍！面对AI技术发展的各种风险隐患，这些前沿AI企业的一线员工再也不堪忍受任人捂嘴的现状了！他们想要挣脱保密协议和公司报复的重重风险，获得对公众发出警告的权利。昨...

人工智能 2024-06-06 人工智能

753阅读

whisper 的安装pycharm使用以及出现的BUG（已经解决）！

whisper（语音识别）+ffmpeg介绍 Whisper是OpenAI于2022年9月份开源的通用的语音识别模型。它是在各种音频的大型数据集上训练的模型，也是一个可以执行多语言语音识别、语音翻译和语言识别的多任务模型。Whisper 是一它在不同音频...

人工智能 2024-06-04 人工智能

1367阅读

通用大模型研究重点之五：llama family

LLAMA Family decoder-only类型 LLaMA（Large Language Model AI）在4月18日公布旗下最大模型LLAMA3，参数高达4000亿。目前meta已经开源了80亿和700亿版本模型，主要升级是多模态、长文本方...

AIGC 2024-05-30 人工智能

1155阅读

超详细！AIGC面试系列大模型进阶(2)

本期问题快览 1. 如何让大模型处理更长的文本？ 2. 如果想要在某个模型基础上做全参数微调，究竟需要多少显存？ 3. 什么是有监督微调SFT 4. SFT 指令微调数据如何构建? 5. 领域数据训练后，通用能力往往会有所下降，如何缓解模型遗忘...

人工智能 2024-05-30 人工智能

1763阅读

OpenAI 开源的免费 AI 语音转文字工具 - Whisper，一步一步本地部署运行

Whisper 是 OpenAI 研发的一个通用的语音识别模型，可以把语音转为文本。它在大量多样化的音频数据集上进行训练，同时还是一个多任务模型，可以执行多语言语音识别、语音翻译和语言识别。一、使用场景语音 => 文字是一个非常实用的功能，...

生成式AI 2024-05-29 人工智能

1937阅读

OpenAI正训练GPT-4的继任者，GPT-5或将带来三个重大升级

虽然 OpenAI 最近推出的模型 GPT-4o 在大型语言模型（LLM）领域有了重大突破，但该公司已经开始着手研发下一个旗舰模型 GPT-5。许多人在 GPT-4o 发布前期就期待着 OpenAI 推出备受瞩目的 GPT-5。为了澄清这种猜测，首席执行官...

人工智能 2024-05-29 人工智能

844阅读

Yolov10：详解、部署、应用一站式齐全！

一、前言在过去的几年里，YOLOs由于其在计算成本和检测性能之间的有效平衡，已成为实时目标检测领域的主导范式。研究人员探索了YOLO的架构设计、优化目标、数据扩充策略等，取得了显著进展。然而，依赖非极大值抑制（NMS）进行后处理阻碍了YOLO的...

生成式AI 2024-05-29 人工智能

1713阅读

AIGC笔记--特征线性调制（FiLM）层的实现

目录 1--特征线性调制层的作用 2--特征线性调制层的实现 3--论文实例 1--特征线性调制层的作用特征线性调制（Feature-wise Linear Modulation，FiLM）层是一种神经网络模块...

生成式AI 2024-05-29 人工智能

2620阅读

深入剖析“脚本之家自动采集器”的功能与应用

在当今信息化社会，数据采集已成为各行业不可或缺的环节。无论是市场分析、竞争情报收集，还是学术研究、内容创作，高效的数据采集工具都能为从业者提供强大的支持。近年来，“脚本之家自动采集器”以其强大的功能和灵活的应用场景，受到了广大用户的青睐。本文将对“脚本之家...

AIGC 2024-05-29 大数据

871阅读

Llama中文大模型-模型预训练

Atom系列模型包含Atom-7B和Atom-13B，基于Llama2做了中文能力的持续优化。Atom-7B和Atom-7B-Chat目前已完全开源，支持商用，可在Hugging Face仓库获取模型:https://huggingface.co/Flag...

人工智能 2024-05-28 人工智能

916阅读

CoT提出者Jason Wei：大模型评估基准的「七宗罪」

在 CV 领域，研究者一直把李飞飞等人创建的 ImageNet 奉为模型在下游视觉任务中能力的试金石。在大模型时代，我们该如何评估 LLM 性能？现阶段，研究者已经提出了诸如 MMLU、GSM8K 等一些评估基准，不断有 LLM 在其上刷新得分。但这...

生成式AI 2024-05-27 人工智能

785阅读

探秘ourphp爬虫：原理、应用与未来发展

在数字化信息时代，数据已经成为一种宝贵的资源。为了获取这些数据，人们开发了各种各样的工具，其中就包括爬虫。ourphp爬虫作为一种特定类型的网络爬虫，近年来备受关注。本文将对ourphp爬虫进行深入的探讨，分析其原理、应用场景以及未来发展趋势，带领读者一起...

生成式AI 2024-05-24 大数据

833阅读

案例分享｜Alluxio在自动驾驶模型训练中的应用与部署

分享嘉宾：杨林三-辉羲智能关于辉羲智能：辉羲智能是一家做自动驾驶芯片的初创公司，成立于2022年。致力打造创新车载智能计算平台，提供高阶智能驾驶芯片、易用开放工具链及全栈自动驾驶解决方案，助力车企实现优质高效的自动驾驶量产交付，构建低成本、大规...

生成式AI 2024-05-21 人工智能

836阅读

百度推荐资源冷启动实践

一、内容冷启动概念及挑战百度 feed 推荐是一个月活数亿的综合信息流推荐平台。该平台涵盖了图文、视频、动态、小程序、问答等多种内容类型。它不仅提供类似于单列或双列的点选式推荐，还包括视频沉浸式等多种推荐形式。同时，推荐系统是一个多利益方的系统，不仅...

人工智能 2024-05-20 人工智能

1085阅读

恒生电子首席科学家白硕：长文本和多模态是生成式AI落地金融的两大利器

嘉宾丨白硕采访/撰稿丨张洁编辑丨千山出品 | 51CTO技术栈（微信号：blog51cto）在千行百业中，金融业一贯是新技术的早期采用者。无论是在数字化水平，还是在关于产业AI化的探索上，都走在了前列。因此，金融业也被视为生成式AI应用落地的潜力...

人工智能 2024-05-17 人工智能

851阅读

Ilya离职后第一个动作：点赞了这篇论文，网友抢着传看

自Ilya Sutskever官宣离职OpenAI后，他的下一步动作成了大家关注焦点。甚至有人密切关注着他的一举一动。这不，Ilya前脚刚刚点赞❤️了一篇新论文—— ——网友们后脚就抢着都看上了：论文来自MIT，作者提出了一个假说，用一句话总结...

AIGC 2024-05-17 人工智能

840阅读

划重点！！因果推断两大算法框架解析

一、整体框架因果推断的主要任务可分为三类。首先是因果结构的发现，即从数据中识别出变量之间的因果关系。其次是因果效应的估计，即从数据中推断一个变量对另一个变量的影响程度。需要注意的是，这种影响并非指相关性，而是指在对一个变量进行干预时，另一个变量的数值...

生成式AI 2024-05-11 人工智能

867阅读

英伟达在印度招聘 AI 工程师

NVIDIA 正在印度招聘经验丰富的 AI 工程师，加入其合作伙伴公司。被选中的候选人将作为员工加入 NVIDIA 合作伙伴网络，负责推动 NVIDIA 技术的采用，并在数据中心、边缘和云部署领域获取创新设计。这些位基于班加罗尔和新德里，专注于深度学习...

生成式AI 2024-05-07 人工智能

806阅读

模型量化与量化在LLM中的应用｜得物技术

【图片出处：Knowledge Distillation: A survey,2021,p2】剪枝则是通过靠剪除模型中不重要的权重从而给模型“瘦身”，提高模型的推理效率，为了保证模型的能力，通常剪枝过程也需要伴随着模型基于训练数据的微调。根据剪除权重的...

人工智能 2024-04-30 人工智能

1001阅读

大模型时代，九章云极DataCanvas点亮五座“灯塔”

“计算”是贯穿人类文明史的一大主题。早在茹毛饮血的原始社会，先民们就开始结绳记事；进入20世纪，世界上首台数字式电子计算机ENIAC诞生，标志着人类算力正式跨越阈限；随后半导体技术出现，芯片成为了算力的主要载体；科技巨轮驶入21世纪，云计算的发展再度为...

大数据 2024-04-30 人工智能

912阅读

写真视频击败Sora？人大自研全新多模态大模型Awaker 1.0震撼登场

在人工智能领域，人大系初创公司智子引擎近日发布了一款名为Awaker1.0的全新多模态大模型，标志着向通用人工智能（AGI）迈出了重要一步。该模型在写真视频效果上超越了Sora，展现了其在视觉生成方面的卓越能力。 4月27日，在中关村论坛的通用人工智能平...

AIGC 2024-04-29 人工智能

830阅读

超级智能体生命力觉醒！可自我更新的AI来了，妈妈再也不用担心数据瓶颈难题

哭死啊，全球狂炼大模型，一互联网的数据不够用，根本不够用。训练模型搞得跟《饥饿游戏》似的，全球AI研究者，都在苦恼怎么才能喂饱这群数据大胃王。尤其在多模态任务中，这一问题尤为突出。一筹莫展之际，来自人大系的初创团队，用自家的新模型，率先在国内把“模...

生成式AI 2024-04-29 人工智能

760阅读

会颠勺的国产机器人来了！星尘智能推AI机器人Astribot S1 家务活全包

随着人工智能向通用人工智能（AGI）目标加速发展，星尘智能公司最新研发的AI机器人Astribot S1，以其卓越的操作性能，在同规格机器人中脱颖而出。Astribot S1在未经加速的1倍速视频中，展示了其在家居和工作场景中的多任务能力，包括叠衣、分拣物...

大数据 2024-04-26 人工智能

1136阅读

会颠勺的国产机器人来了：大模型加持，家务能力满分

随着 AI 向 AGI（通用人工智能）的圣杯方向加速发展，大模型与机器人的结合是必然趋势。数十年来，单一用途机器人市场已趋于饱和，AI 通用机器人的巨大潜力急待开垦。刚刚，来自星尘智能公司的自研 AI 机器人 Astribot S1，在同规格机器人中展现...

大数据 2024-04-26 人工智能

940阅读

7个prompt小技巧，让你和AI的对话更有效

向AI工具提供的背景信息越详尽，收到的回复质量越高。获取初步回答后进一步询问信息在您越来越频繁地使用ChatGPT等工具时，您会很快意识到初次得到的答案并不总是可以直接采纳的。正如您会向他人提出更多问题以获取更多信息一样，与AI交互时也应如此。这次...

人工智能 2024-04-25 人工智能

912阅读

商汤科技Copilot技术应用负责人张涛：大模型不能解决一切，AI产品需要领域知识

嘉宾 | 张涛采访&撰稿 | 云昭出品 | 51CTO技术栈（微信号：blog51cto） “程序员的饭碗被AI惦记”，早已不是新鲜事。李彦宏说未来不需要程序员，黄仁勋说未来不要再让孩子学编程！ Coding这个行业会消失？要回答这个问题，...

大数据 2024-04-24 人工智能

793阅读

OpenAI陷巨大算力荒，国内大厂抢先破局！打破单芯片限制，算力效率提升33%

国内AI不行，是因为芯片不行？我们跟国外的差距，是因为和英伟达芯片的差距过大？最近，圈内有许多这样的论调。其实深挖下去，就会发现事实完全不是这样。即使是英伟达最先进的芯片，依然无法满足当下人工智能在算力上的需求。随着模型参数量和数据量的增加，智慧...

大数据 2024-04-24 人工智能

882阅读

超越BEVFusion！DifFUSER：扩散模型杀入自动驾驶多任务（BEV分割+检测双SOTA）

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解目前，随着自动驾驶技术的越发成熟以及自动驾驶感知任务需求的日益增多，工业界和学术界非常希望一个理想的感知算法模型，可以同时完成如3D目标检测以及基于BEV空间的语义分...

AIGC 2024-04-22 人工智能

883阅读

基于因果推断的推荐系统：回顾和前瞻

本次分享的主题为基于因果推断的推荐系统，回顾过去的相关工作，并提出本方向的未来展望。为什么在推荐系统中需要使用因果推断技术？现有的研究工作用因果推断来解决三类问题（参见 Gao et al.的 TOIS 2023 论文 Causal Inference...

人工智能 2024-04-12 人工智能

1117阅读

「大模型+强化学习」最新综述！港中文深圳130余篇论文：详解四条主流技术路线

强化学习（RL）通过与环境交互的试错反馈来优化顺序决策问题。虽然RL在允许大量试错的复杂电子游戏环境中实现了超越人类的决策能力（例如王者荣耀，Dota 2等），但很难在包含大量自然语言和视觉图像的现实复杂应用中落地，原因包括但不限于：数据获取困难、样本...

人工智能 2024-04-11 人工智能

1144阅读

破除36年前魔咒！Meta推出反向训练大法消除大模型「逆转诅咒」

大语言模型的「逆转诅咒」，被解开了！这个诅咒在去年9月首次被发现，一时间引起LeCun、Karpathy、马库斯等一众大佬的惊呼。因为风光无两、不可一世的大模型竟存在着“阿克琉斯之踵”：一个在「A是B」上训练的语言模型，并不能正确回答出「B是A」。...

人工智能 2024-04-09 人工智能

918阅读

多模态大模型有了统一分割框架，华科PSALM多任务登顶，模型代码全开源

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 最近，多模态大模型（LMM）取得了一系列引人注目的成就，特别是在视觉 - 语言任务上的表现令人瞩目。它们的成功不仅展现了多模态大模型在各...

AIGC 2024-04-08 人工智能

859阅读

快手强化学习与多任务推荐

一、Two-Stage Constrained Actor-Critic for Short Video Recommendation 第一篇工作是快手自研的，主要针对的是带约束的多任务场景。 1. 短视频多任务推荐场景这篇工作主要针对的是短视频的一...

人工智能 2024-04-03 人工智能

1266阅读

LLaMA 模型中的Transformer架构变化

目录 1. 前置层归一化（Pre-normalization） 2. RMSNorm 归一化函数 3. SwiGLU 激活函数 4. 旋转位置嵌入（RoPE） 5. 注意力机制优化 6. Group Query Attention 7. 模型...

AIGC 2024-04-02 人工智能

1235阅读

比LoRA还快50%的微调方法来了！一张3090性能超越全参调优，UIUC联合LMFlow团队提出LISA

2022 年底，随着 ChatGPT 的爆火，人类正式进入了大模型时代。然而，训练大模型需要的时空消耗依然居高不下，给大模型的普及和发展带来了巨大困难。面对这一挑战，原先在计算机视觉领域流行的 LoRA 技术成功转型大模型 [1][2]，带来了接近 2...

大数据 2024-04-01 人工智能

855阅读

“真假难辨”！巧用NeRF生成的自动驾驶仿真数据

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解神经辐射场（NeRF）已成为推进自动驾驶（AD）重新搜索的有前途的工具，提供可扩展的闭环模拟和数据增强功能。然而，为了信任模拟中获得的结果，需要确保AD系统以相同的方式...

生成式AI 2024-04-01 人工智能

1028阅读

相机与激光雷达是怎么标定的？一览行业所有主流的标定工具

本文经自动驾驶之心公众号授权转载，转载请联系出处。相机与激光雷达的标定是很多任务的基础工作，标定精度决定了下游方案融合的上限，因为许多自动驾驶与机器人公司投入了较大的人力物力不断提升，今天也为大家盘点下常见的Camera-Lidar标定工具箱，建议收...

AIGC 2024-03-22 人工智能

911阅读

本地部署whisper模型（语音转文字）

Whisper是 OpenAI 2022年发布的一款语音预训练大模型，集成了多语种ASR、语音翻译、语种识别的功能。 Whisper使用弱监督训练的方法，可以直接进行多任务的学习 1. 安装ffmpeg 1.1 更新yum yum update...

人工智能 2024-03-22 人工智能

922阅读

微软在AI领域是不是大而不倒？

在2023年11月OpenAI的剧变中，联合创始人兼CEO奥特曼被解雇并重新聘用，微软CEO纳德拉接受了采访，分享了他对这一事件的两点看法，以及人工智能如何在企业中渗透。纳德拉在谈到微软在人工智能领域的存在时表示：“我们对自己的能力非常有信心，我们拥...

AIGC 2024-03-19 人工智能

851阅读

谷歌AI推出新型评分器Cappy 助力多任务语言模型性能提升

在最新的研究论文中，谷歌研究人员引入了一种名为Cappy的预训练评分器模型，旨在增强和超越大型多任务语言模型的性能。这项研究旨在解决大型语言模型（LLM）所面临的挑战，其中包括高昂的计算资源成本和效率低下的训练和推理过程。目前，多任务法学硕士如T0、F...

大数据 2024-03-19 人工智能

801阅读

AIGC: 2 语音转换新纪元-Whisper技术在全球客服领域的创新运用

背景现实世界，人跟人的沟通相当一部分是语音沟通，比如打电话，聊天中发送语音消息。而在程序的世界，大部分以处理字符串为主。所以，把语音转换成文字就成为了编程世界非常普遍的需求。 Whisper 是由 OpenAI 开发的一种高效的语音识别（AS...

生成式AI 2024-03-19 人工智能

938阅读

phpyun采集插件在网页数据采集中的应用与优势

在当前的互联网时代，数据采集已经成为了许多行业和企业不可或缺的一部分。从市场分析、竞争情报到内容聚合，大量的数据需要被快速、准确地抓取并处理。而在这个过程中，一款高效、稳定的数据采集插件扮演着至关重要的角色。本文将深入探讨phpyun采集插件在网页数据采集...

AIGC 2024-03-18 大数据

929阅读

语音转字幕：Whisper模型的功能和使用

? 作者：知识浅谈，CSDN签约讲师，CSDN博客专家，华为云云享专家，阿里云专家博主 ? 擅长领域：全栈工程师、爬虫、ACM算法 ? 公众号：知识浅谈 ?语音转字幕：Whisper模型的功能和使用? 使用到的工具和模型: 公众号知识浅谈回复 w...

大数据 2024-03-16 人工智能

1316阅读

织梦CMS采集插件下载：功能、应用与注意事项详解

随着互联网的迅速发展，内容管理系统（CMS）已成为网站建设不可或缺的一部分。其中，织梦CMS以其简单易用和强大的功能而备受欢迎。为满足用户日益增长的需求，织梦CMS的采集插件应运而生，帮助用户更高效地收集和整合内容。本文将详细介绍织梦CMS采集插件的下载、...

生成式AI 2024-03-15 大数据

1009阅读

bbs-go采集插件：深入解析与应用实践

在当今大数据时代，数据采集与分析已成为各个行业和领域不可或缺的环节。伴随着技术的发展，越来越多的数据采集工具应运而生。其中，“bbs-go采集插件”作为一款高效、稳定的数据采集利器，备受业界关注。本文将从bbs-go采集插件的特点、功能、应用案例等方面进行...

AIGC 2024-03-15 大数据

945阅读

基于“ptnovelsteal采集插件”的深度分析与应用探讨

在当今信息化的时代，网络数据呈指数级增长，数据获取与分析成为了各行各业所依赖的重要工具。在这一大背景下，插件作为一种轻量化、模块化的软件组件，广泛应用于数据的采集和处理过程中。“ptnovelsteal采集插件”作为一个具备特定功能的数据采集插件，一经推出...

大数据 2024-03-15 大数据

849阅读

Google大模型Bard更名Gemini，现在实力如何？比gpt更强?

名人说：一花独放不是春，百花齐放花满园。——《增广贤文》作者：Code_流苏(CSDN （一个喜欢古诗词和编程的Coder?）目录一、简要介绍 1、Gemini是什么？ 2、主要特点 3、Gemini的版本 4、应用潜力 5、使用...

大数据 2024-03-13 人工智能

931阅读

《深度探索WordPress自动采集图片主题的功能与应用》

在互联网高速发展的当下，内容的更迭与视觉效果的提升变得尤为关键，特别是对于那些以图文为主的网站而言。WordPress作为一款广泛使用的内容管理系统（CMS），为全球数以万计的网站提供支持。其丰富的主题与插件资源使网站管理员能轻易地更改网站的外观和功能，以...

AIGC 2024-03-12 大数据

871阅读

基于Discuz采集器的开发与实践

在互联网信息时代，数据采集与处理已经成为了各个行业的基础工作。尤其是对于依靠网络信息为主的内容提供者而言，高效地抓取并整理互联网上的有效资源成为了不可或缺的需求。在这种背景下，以Discuz论坛系统为代表的社交网络平台上的数据成为了采集的热门对象，因为它们...

AIGC 2024-03-12 大数据

818阅读

扩散模型如何构建新一代决策智能体？超越自回归，同时生成长序列规划轨迹

设想一下，当你站在房间内，准备向门口走去，你是通过自回归的方式逐步规划路径吗？实际上，你的路径是一次性整体生成的。近期的研究表明，采用扩散模型的规划模块能够同时生成长序列的轨迹规划，这更加符合人类的决策模式。此外，扩散模型在策略表征和数据合成方面也能为...

人工智能 2024-03-11 人工智能

898阅读