action 第2页 - AIGC资讯

快速入门大模型技术与应用，推荐你从Stable Diffusion开始学起

ChatGPT狂飙160天，世界已经不是之前的样子。新建了免费的人工智能中文站https://ai.weoknow.com 新建了收费的人工智能中文站https://ai.hzytsoft.cn/ 更多资源欢迎关注世界是变化的，分子是...

大数据 2024-06-09 人工智能

1058阅读

LLaMA3（Meta）微调SFT实战Meta-Llama-3-8B-Instruct

LlaMA3-SFT LlaMA3-SFT, Meta-Llama-3-8B/Meta-Llama-3-8B-Instruct微调(transformers /LORA(peft /推理项目地址 https://github.com/yong...

大数据 2024-06-07 人工智能

1217阅读

一文教你在MindSpore中实现A2C算法训练

本文分享自华为云社区《MindSpore A2C 强化学习》，作者：irrational。 Advantage Actor-Critic (A2C 算法是一个强化学习算法，它结合了策略梯度（Actor）和价值函数（Critic）的方法。A2C算法在许多强...

生成式AI 2024-06-07 人工智能

870阅读

LightGBM实战+随机搜索调参：准确率96.67%

大家好，我是Peter~ 今天给大家分享一下树模型的经典算法：LightGBM，介绍算法产生的背景、原理和特点，最后提供一个基于LightGBM和随机搜索调优的案例。 LightGBM算法在机器学习领域，梯度提升机（Gradient Boosting...

大数据 2024-06-06 人工智能

1135阅读

多模态模型学会打扑克：表现超越GPT-4v，全新强化学习框架是关键

只用强化学习来微调，无需人类反馈，就能让多模态大模型学会做决策！这种方法得到的模型，已经学会了看图玩扑克、算“12点”等任务，表现甚至超越了GPT-4v。图片这是来自UC伯克利等高校最新提出的微调方法，研究阵容也是相当豪华：图灵奖三巨头之一、M...

生成式AI 2024-06-04 人工智能

833阅读

港科大最新！Vista：一种具有高保真度和多功能可控的世界模型

本文经自动驾驶之心公众号授权转载，转载请联系出处。原标题：Vista: A Generalizable Driving World Model with High Fidelity and Versatile Controllability 论文链接...

人工智能 2024-06-04 人工智能

1067阅读

英伟达新研究：上下文长度虚标严重，32K性能合格的都不多

无情戳穿“长上下文”大模型的虚标现象—— 英伟达新研究发现，包括GPT-4在内的10个大模型，生成达到128k甚至1M上下文长度的都有。但一番考验下来，在新指标“有效上下文”上缩水严重，能达到32K的都不多。新基准名为RULER，包含检索、多跳追踪、...

大数据 2024-06-03 人工智能

802阅读

使用 Springboot3.x 实现考试系统中接打电话的识别与处理

本专题将深入探讨考试系统中常见的复杂技术问题，并提供基于Spring Boot 3.x的解决方案。涵盖屏幕切换检测与防护、接打电话识别处理、行为监控摄像头使用、网络不稳定应对等，每篇文章详细剖析问题并提供实际案例与代码示例，帮助开发者应对挑战，提升考试系...

生成式AI 2024-06-03 人工智能

988阅读

OpenAI API - 使用Whisper和GPT-4模型开发一个自动化会议记录生成器

前言本文章结合官方教程给大家介绍如何利用OpenAI的Whisper和GPT-4模型来开发一个自动化会议记录生成器。这个应用程序可以转录会议音频一应用程序基本介绍 Whisper和GPT-4模型：Whisper是一个用于音频转录的模型，而G...

AIGC 2024-06-01 人工智能

924阅读

GitHub Copilot Workspace：欢迎进入原生Copilot开发环境

每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同...

人工智能 2024-05-31 人工智能

1015阅读

MonoDETRNext：下一代准确高效的单目3D检测方法！

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解基于单目视觉的3D目标检测在各个领域都至关重要，但现有方法在准确性和计算效率方面面临着重大挑战。在2D检测和深度估计的成功策略的基础上，本文提出了MonoDETRNe...

人工智能 2024-05-30 人工智能

1070阅读

LLMs之LLaMA-3：Llama-3-70B-Gradient-1048k-adapter的简介、源代码解读merge_adapters.py(仅需58行代码)合并多个PEFT模型(LoRA技术)

LLMs之LLaMA-3：Llama-3-70B-Gradient-1048k-adapter的简介、源代码解读merge_adapters.py(仅需58行代码合并多个PEFT模型(LoRA技术将LLaMA-3扩展到100万/1048k上下文——解析...

AIGC 2024-05-30 人工智能

1235阅读

AI绘画，Midjourney API 接口对接和使用

项目背景众所周知，Midjourney并没有提供任何的Api服务，但是基于Midjourney目前的行业龙头位置，很多企业以及个人会有相关的需求。TTApi平台基于Midjourney现有功能整理出一套完整的可集成性高的服务，如果你有类似的需求，那么...

AIGC 2024-05-30 人工智能

1207阅读

LightGBM算法背景、原理、特点+Python实战案例

大家好，我是Peter~ 今天给大家分享一下树模型的经典算法：LightGBM，介绍算法产生的背景、原理和特点，最后提供一个基于LightGBM和随机搜索调优的案例。 LightGBM算法在机器学习领域，梯度提升机（Gradient Boosting...

大数据 2024-05-29 人工智能

1211阅读

Stack Overflow 与 OpenAI 的合作引起了巨大争议

前两天在推送中看到一条新闻：Stack Overflow Upset Over Users Deleting Answers After OpenAI Partnership。简单来说就是 SF 与 OpenAI 建立了合作关系，会使用用户的提问以及回...

生成式AI 2024-05-28 人工智能

810阅读

一文深度剖析 ColBERT

近年来，向量搜索领域经历了爆炸性增长，尤其是在大型语言模型（LLMs）问世后。学术界开始重点关注如何通过扩展训练数据、采用先进的训练方法和新的架构等方法来增强 embedding 向量模型。在之前的文章中，我们已经深入探讨了各种类型的 embeddin...

大数据 2024-05-27 人工智能

907阅读

Midjourney画图关键词-日本漫画类型关键词

Midjourney的画图关键词中，日本漫画类型关键词可以包括以下几种： 1. **Shonen**：少年漫画，通常以年轻男性为主要读者群，内容包含冒险、动作、科幻等元素。 2. **Shojo**：少女漫画，以年轻女性为主要读者群，内容通常包含浪漫、友...

人工智能 2024-05-26 人工智能

1133阅读

使用Flask实现：基于midjourney-proxy的MJ绘画实现（开源）

文章目录实现效果实现步骤完整源码实现效果运行mj.py，如下所示。输入中文，自动生成提示词，自动开始下载。用户选择是否需要变换图片，选择需要对哪个图片变换，自动保存。之前想做一个网页版，只实现了demo效果不好看，就不...

人工智能 2024-05-25 人工智能

867阅读

实战whisper第二天：直播语音转字幕（全部代码和详细部署步骤）

直播语音实时转字幕：基于Whisper的实时直播语音转录或翻译是一项使用OpenAI的Whisper模型实现的技术，它能够实时将直播中的语音内容转录成文本，甚至翻译成另一种语言。这一过程大致分为三个步骤：捕获直播音频流、语音识别（转录）以及翻译（如...

人工智能 2024-05-25 人工智能

1679阅读

通用世界模型问世：不学习就能生成新领域视频，可实时控制

随着 OpenAI 今年 2 月发布 Sora，世界模型（World Model）再次成为了 AI 领域的热门。世界模型，即通过预测未来的范式对数字世界和物理世界进行理解，一直以来被认为是通往通用人工智能（AGI）的关键路径之一，与当前大模型推崇的智能...

人工智能 2024-05-24 人工智能

983阅读

使用自己的数据集训练DETR模型

众所周知，Transformer已经席卷深度学习领域。Transformer架构最初在NLP领域取得了突破性成果，尤其是在机器翻译和语言模型中，其自注意力机制允许模型处理序列数据的全局依赖性。随之，研究者开始探索如何将这种架构应用于计算机视觉任务，特别是...

人工智能 2024-05-23 人工智能

1817阅读

14个Flink SQL性能优化实践分享

本文分享自华为云社区《Flink SQL性能优化实践》，作者：超梦。在大数据处理领域，Apache Flink以其流处理和批处理一体化的能力，成为许多企业的首选。然而，随着数据量的增长，性能优化变得至关重要。本文将深入浅出地探讨Flink SQL的常...

生成式AI 2024-05-23 人工智能

863阅读

克雷研究所100万美元奖金要归AI了数学界规则大改，未来数学家如何应对「海量猜想」

在数学的世界里，想要对「一个未经证实的猜想」进行完整的证明，往往需要天赋、直觉和经验的结合，即使是数学家也很难解释自己的发现过程。然而，随着近几年大模型的崛起，我们共同见证了一种新的变革力量，AI不仅在预测椭圆曲线的复杂度上超越了人类，还在探索基本常...

AIGC 2024-05-23 人工智能

863阅读

「懂物理」是具身智能核心！北大高逼真物理仿真，加持磁性微米级机器人登Nature子刊

日前，北京大学智能学院可视计算与学习实验室陈宝权教授团队与苏黎世联邦理工学院健康科技系转化医学研究所Simone Schürle-Finke教授团队展开合作，首次使用物理模拟技术辅助可编程磁性微米级机器人的制造。相关研究论文《Programming S...

AIGC 2024-05-16 人工智能

938阅读

「大模型」之所短，「知识图谱」之所长

最近一年以来，大语言模型技术突飞猛进，被广泛地认为开启了人工智能研究的新阶段。大语言模型时代的到来，给知识图谱技术也带来了新的机遇与挑战。我们在 5 月份的时候曾经发布过知识图谱与 AIGC 大模型的知识地图，其中包括了文本生成、图像生成等技术。本次分享...

人工智能 2024-05-16 人工智能

1016阅读

超越ORB-SLAM3！SL-SLAM：低光、严重抖动和弱纹理场景全搞定

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面今天我们探讨下深度学习技术如何改善在复杂环境中基于视觉的SLAM（同时定位与地图构建）性能。通过将深度特征提取和深度匹配方法相结合，这里介绍了一种多功能的混合视觉SLAM系统，旨在提高在诸如低...

大数据 2024-05-13 人工智能

1649阅读

LangGraph实战：从零分阶打造人工智能航空客服助手

客服助手机器人能够帮助团队更高效地处理日常咨询，但要打造一个能够稳定应对各种任务且不会让用户感到烦恼的机器人并非易事。完成本教程后，你不仅会拥有一个功能完备的机器人，还将深入理解LangGraph的核心理念和架构设计。这些知识将帮助你在其他人工智能项目...

生成式AI 2024-05-09 人工智能

1256阅读

硬核解决Sora的物理bug！美国四所顶尖高校联合发布：给视频生成器装个物理引擎

Sora刚发布后没多久，火眼金睛的网友们就发现了不少bug，比如模型对物理世界知之甚少，小狗在走路的时候，两条前腿就出现了交错问题，让人非常出戏。对于生成视频的真实感来说，物体的交互非常重要，但目前来说，合成真实3D物体在交互中的动态行为仍然非常困难。...

AIGC 2024-05-07 人工智能

873阅读

微调大语言模型的七个步骤

译者 | 布加迪审校 | 重楼在最近一年半的时间里，自然语言处理（NLP）领域发生了显著的变化，这主要得益于OpenAI的GPT系列等大语言模型（LLM）的兴起。这些功能强大的模型已彻底改变了我们处理自然语言任务的方法，在翻译、情绪分析和文本自动...

人工智能 2024-05-07 人工智能

1350阅读

惨！Rabbit R1被持续扒皮：AI风口一夜转型，NFT充值用户欲哭无泪，动作大模型也是套壳的

一波未平一波又起，不光APP被批评套壳安卓，主推的大动作模型LAM依赖OpenAI接口，现在公司也被扒皮有猫腻—— Rabbit公司本来是搞元宇宙的，原地改名转投AI?! 这家曾经主打NFT游戏的创业公司，去年转型做AI终端（即R1）。并在转型后疑似“删号...

生成式AI 2024-05-06 人工智能

920阅读

小红书让智能体们吵起来了！联合复旦推出大模型专属群聊工具

语言，不仅仅是文字的堆砌，更是表情包的狂欢，是梗的海洋，是键盘侠的战场（嗯？哪里不对）。语言如何塑造我们的社会行为？我们的社会结构又是如何在不断的言语交流中演变的？近期，来自复旦大学和小红书的研究者们通过引入一种名为AgentGroupChat的...

人工智能 2024-04-30 人工智能

787阅读

百度前总经理打造，AI硬件Rabbit R1交卷了！能否超越AI Pin被“群嘲”命运？

出品 | 51CTO技术栈（微信号：blog51cto）整理 | 伊风 Rabbit R1，到货了！海外媒体和科技博主纷纷发出对这只“橙色兔子”的测评！鉴于AI Pin到货后掀起的一阵“吐槽”狂潮，不禁让人为同为AI硬件定位的Rabbit...

生成式AI 2024-04-26 人工智能

838阅读

曾秒售罄口袋AI设备Rabbit R1竟是一场骗局？设备源代码首次曝光

美国初创公司rabbit.tech推出的口袋 AI 设备 Rabbit R1曾一度引起轰动，声称该设备能够代替用户执行任务，让用户远离应用程序的束缚。Rabbit首批1万台竟在短短一天内就被抢购一空，其售价为199美元不过，有开发者在github曝光，...

生成式AI 2024-04-24 人工智能

888阅读

开箱黑盒LLM！谷歌大一统框架Patchscopes实战教程来了

虽然大型语言模型（LLM）在各种常见的自然语言处理任务中展现出了优异的性能，但随之而来的幻觉，也揭示了模型在真实性和透明度上仍然存在问题。在模型生成错误回复内容时，如果能够「深入理解其背后运行机制」，或许可以解决模型的幻觉问题。然而，随着深度神经网络...

大数据 2024-04-23 人工智能

876阅读

如何利用Transformer有效关联激光雷达-毫米波雷达-视觉特征？

本文经自动驾驶之心公众号授权转载，转载请联系出处。笔者个人理解自动驾驶的基础任务之一是三维目标检测，而现在许多方法都是基于多传感器融合的方法实现的。那为什么要进行多传感器融合?无论是激光雷达和相机融合，又或者是毫米波雷达和相机融合，其最主要的目的就是...

大数据 2024-04-20 人工智能

958阅读

通透！机器学习各大模型原理的深度剖析！

通俗来说，机器学习模型就是一种数学函数，它能够将输入数据映射到预测输出。更具体地说，机器学习模型就是一种通过学习训练数据，来调整模型参数，以最小化预测输出与真实标签之间的误差的数学函数。机器学习中的模型有很多种，例如逻辑回归模型、决策树模型、支持向量...

大数据 2024-04-12 人工智能

941阅读

MagicTime官网体验入口 AI生成延时视频软件使用地址

MagicTime是一种基于文本描述生成高质量变化视频的模型。它通过学习时间流逝视频中的物理知识，实现了高度逼真的变化过程模拟。该模型包括MagicAdapter、Dynamic Frames Extraction和Magic Text-Encoder三个...

人工智能 2024-04-10 人工智能

1123阅读

陶哲轩转发、菲尔兹奖得主领衔：AI正在颠覆数学家的工作方式

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 陶哲轩点赞转发，《美国数学学会通报》用一整期特刊介绍了AI给数学带来的改变。这些文章读起来很有趣，尽管使我自己即将发表的一篇文章显得多...

生成式AI 2024-04-08 人工智能

791阅读

「有效上下文」提升20倍！DeepMind发布ReadAgent框架

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 基于Transformer的大语言模型（LLM）具有很强的语言理解能力，但LLM一次能够读取的文本量仍然受到极大限制。除了上下文窗口...

生成式AI 2024-04-07 人工智能

866阅读

20240203在WIN10下使用GTX1080配置stable-diffusion-webui.git不支持float16精度出错的处理

20240203在WIN10下使用GTX1080配置stable-diffusion-webui.git不支持float16精度出错的处理 2024/2/3 21:23 缘起：最近学习stable-diffusion-webui.git，在Ubuntu...

生成式AI 2024-04-06 人工智能

891阅读

快手强化学习与多任务推荐

一、Two-Stage Constrained Actor-Critic for Short Video Recommendation 第一篇工作是快手自研的，主要针对的是带约束的多任务场景。 1. 短视频多任务推荐场景这篇工作主要针对的是短视频的一...

人工智能 2024-04-03 人工智能

1276阅读

面向2026年的推荐算法前瞻

常规的推荐系统范式已经逐渐走入瓶颈，原因是在当前固定化的问题描述下模型和系统几乎已经发展到极限。当前的主要范式在模型上为召回+排序+重排，系统上为样本挖掘+特征工程+线上打分预估能力建设。一线大厂在上述领域已经把空间挖掘殆尽。同时可以看到，我们的用户对当...

人工智能 2024-04-03 人工智能

1281阅读

llama笔记：官方示例解析 example_chat_completion.py

1 导入库 from typing import List, Optional ''' 从typing模块中导入List和Optional。 typing模块用于提供类型注解的支持，以帮助明确函数预期接收和返回的数据类型。 List用于指定列表...

AIGC 2024-04-02 人工智能

1163阅读

微软财务GPT Excel Copilot for Finance使用攻略

功能本身不收费，但是这个功能需要微软的商业版office账号才能使用，如果你没有账号，可以直说。在桌面Excel软件中登录账号后，点击“copilot for finance”按钮，如果没有出现，则点击“加载项”，第一个就是：它现在...

AIGC 2024-04-01 人工智能

1060阅读

stable-diffusion.cpp 一个文件解决stable diffusion所有环境，不需要python，stable-diffusion.dll动态库C#调用Demo

stable-diffusion.cpp 一个文件解决stable-diffusion所有环境，不需要python，stable-diffusion.dll动态库C#调用Demo 目录介绍效果 Text To Image Image To...

人工智能 2024-04-01 人工智能

883阅读

[AIGC] 探索消息队列事务

探索消息队列事务消息队列(Transaction 被广泛地应用在分布式系统中，它可提供一种异步通信机制，在多个独立组件间传递消息。然而，消息处理的正确性和一致性是构建高效、可用的分布式系统的关键。继续阅读，以了解消息队列事务的概念和重要性。什么...

大数据 2024-03-31 人工智能

794阅读

开启论文写作加速模式科研AI助手必备的GPTs技能

2023年11月OpenAI 发布了自定义GPTs。它提供了一种新的方式来使用ChatGPT，可以让用户根据自己的需求定制化，并可以与其他用户共享。 GPTs的制作流程非常轻松，因为都是引导对话式。用户可以通过自然语言对话，指定所需的功能和任务，然后G...

人工智能 2024-03-29 人工智能

888阅读

全球下载量最大的AI绘画大模型，更新Lightning极速版

几个月前，Stable Diffusion的大模型连续推出了两中提速技术，一个是官方的Turbo，一个是清华团队的LCM。都能在5-8步实现出图效果，把出图时间缩短了5-10倍。但是，除了Dreamshaper等少数几个大模型坚决跟进外，大部分大模...

生成式AI 2024-03-28 人工智能

1197阅读

教育GPT是怎样炼成的？

2024年1月，OpenAI官宣GPTs（商城）正式上线。至此，程序员的门槛被再次降低，只要有足够的创造力和想象力，每个人都可以根据自己的专业知识创造一个GPT工具的时代已经到来。在GPTs上线后，至顶网发现，教育类目很快成了被官方推荐的一个热门类...

AIGC 2024-03-28 人工智能

820阅读

使用Unity 接入 Stable-Diffusion-WebUI 文生图生成图像

参考：stable diffusion 远端跑图—— Api基础知识掌握 - 知乎 (zhihu.com 1、准备工作(下载启动器这一部分就不多赘诉了，我使用的是B站秋叶大佬的整合包，要启用API。网上蛮多自己配置的，可能需要设密码之类...

AIGC 2024-03-28 人工智能

1421阅读