-
北大&火山引擎夺冠!CLIC视频压缩挑战赛结果公布,中国团队表现亮眼
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 随着以深度学习为代表的新一代人工智能技术不断取得突破,学术界与工业界逐渐意识到人工智能技术在图像、视频压缩领域的巨大应用潜力。 基于深度...
-
谷歌AI研究人员提出噪声感知训练方法(NAT)用于布局感知语言模型
在文档处理中,特别是在视觉丰富的文档(VRDs)中,高效信息提取(IE 的需求变得越来越关键。VRDs,如发票、水电费单和保险报价,在业务工作流中随处可见,通常以不同的布局和格式呈现类似信息。自动从这些文档中提取相关数据可以显著减少解析所需的手动工作量。然...
-
GitHub突破1000星!上交、清华开源个性化联邦学习算法库PFLlib
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 我们在 GitHub 上开源了一个个性化联邦学习算法仓库(PFLlib),目前已经获得 1K+ 个 Star 和 200+ 个 Fork...
-
音乐圈的Sora要来了?AI音乐应用xgboost曝光 据说比Suno好10倍!
近日,博主@maxescu分享了他参与内测的一款人工智能音乐应用的体验。他对这款AI音乐应用的评价极高,认为它将是一款划时代的产品,甚至将其与Sora相提并论,认为它将会让人们再次震惊。 据@maxescu的描述,这款AI音乐应用生成的音乐和我们在Spot...
-
Stable Diffusion的界面参数详解
Stable Diffusion作为一款强大的文本到图像生成模型,其界面参数是用户与模型进行交互的重要桥梁。这些参数不仅影响着模型的生成效果,还能够帮助用户更加精准地控制生成图像的风格、内容等。本文将详细介绍Stable Diffusion的界面参数,帮助...
-
北航联合港大发布全新文本引导矢量图形合成方法SVGDreamer
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 可缩放矢量图形(Scalable Vector Graphics,SVG)是用于描述二维图型和图型应用程序的基本元素;与传统的像素图形...
-
MiniGPT4-Video官网体验入口 视频理解多模态AI大模型使用地址
MiniGPT4-Video是什么? MiniGPT4-Video是为视频理解设计的多模态大模型,能处理时态视觉数据和文本数据,配标题、宣传语,适用于视频问答。 点击前往MiniGPT4-Video官网体验入口 MiniGPT4-Video的主要特点...
-
月之暗面真的很强?我们来用一个问题评测这些 ChatGPT 平替
号称平替甚至超越 ChatGPT 的产品层出不穷,今天就来做一个横向评测。本次评测的对象有: ChatGPT 3.5 ChatGPT 4 Google Gemini Anthropic Claude 3 Sonnet Perplexit...
-
报道称生成式AI在商业领域中并未铺开,很多企业还在观望
4月8日消息,虽然生成式人工智能如ChatGPT等正迅猛发展并已积累了大量用户,但许多企业对采用此技术仍持谨慎态度,不愿轻率行事。 以美国烟草公司雷诺兹(Reynolds American)为例,其正采取缓慢的步骤,投入有限的人力物力来测试人工智能。公...
-
QQ是怎么成为中国AI原住民培养皿的?
QQ,这个被很多人以为早已“被遗弃”的古早社交产品,不仅依然有大量用户,而且还正在变成中国“AI浓度”最高的产品之一。 今年 2 月QQ25 周年的时候,大众以“怀旧”的理由去关注这个产品,却发现在腾讯此前的财报里透露,“仍有 5 亿人坚持用QQ”。这个话...
-
AI写作:一场人脑与电脑的较量
大家好,小发猫降重今天来聊聊AI写作:一场人脑与电脑的较量,希望能给大家提供一点参考。 以下是针对论文重复率高的情况,提供一些修改建议和技巧,可以借助此类工具: AI写作:一场人脑与电脑的较量 随着科技的日新月异,AI写作成为了一个备受瞩目的新领...
-
智能百科 | 多模态人工智能及其应用
多模态人工智能概述 多模态人工智能是一种人工智能技术,其能够处理和理解多种类型的输入数据,例如文本、图像、语音和视频等。与传统的单一模态人工智能相比,多模态人工智能能够更全面地理解和处理信息,因为其能够同时考虑多种输入源的信息。 多模态人工智能通常利用...
-
Midreal.ai官网体验入口 AI文本冒险游戏免费使用地址
Midreal.ai是什么? Midreal.ai是一个基于先进人工智能技术的文本冒险游戏平台。它拥有强大的长篇叙事能力和近乎无限的记忆能力,可以根据玩家的选择来生成一个连贯、沉浸式的故事剧情。 点击前往Midreal.ai官网体验入口 Midreal....
-
AI写作助手疑似度多少正常?七个方面为你解答疑惑!
大家好,今天来聊聊AI写作助手疑似度多少正常?七个方面为你解答疑惑!,希望能给大家提供一点参考。 以下是针对论文AI辅写率高的情况,提供一些修改建议和技巧,可以借助此类工具: 还有: AI写作助手疑似度多少正常?七个方面为你解答疑惑! 随着...
-
阿里刚开源32B大模型,我们立马测试了“弱智吧”
阿里的通义千问(Qwen),终于拼齐了1.5系列的最后一块拼图—— 正式开源Qwen 1.5-32B。 话不多说,直接来看“成绩单”。 这次官方pick同台竞技的“选手”是Mixtral 8x7B模型和同为Qwen 1.5系列的72B模型。 从结果上...
-
Midjourney从入门到实战:图像生成命令及参数详解
目录 0 专栏介绍 1 Midjourney Bot常用命令 2 Midjourney绘图指令格式 3 Midjourney绘图指令参数 3.1 模型及版本 3.2 画面比例 3.3 风格化 3.4 图片质量 3.5 混乱值 3.6 随机数种...
-
文心一言网页版怎么同步到手机:全面解析与实用指南
大家好,小发猫降ai今天来聊聊文心一言网页版怎么同步到手机:全面解析与实用指南,希望能给大家提供一点参考。降ai辅写 以下是针对论文AI辅写率高的情况,提供一些修改建议和技巧,可以借助此类工具: 还有: 文心一言网页版怎么同步到手机:全面解析...
-
机器学习如何提高商业智能
机器学习(ML 在商业智能(BI 的持续发展中发挥着关键作用。随着ML的出现,企业正在超越传统分析,采用更复杂的方法来解读庞大的数据集。本文探讨了ML为BI带来的革命,标志着从单纯的数据分析到预测洞察和决策策略的重大转变。 ML在BI中的集成 将ML集...
-
文心一言App怎么用不了了呀?
大家好,小发猫降ai今天来聊聊文心一言App怎么用不了了呀?,希望能给大家提供一点参考。降ai辅写 以下是针对论文AI辅写率高的情况,提供一些修改建议和技巧,可以借助此类工具: 还有: 文心一言App怎么用不了了呀? 随着科技的发展,手机应...
-
1MB的神奇AI,检测百万文件,99%的准确率!
在 Web 开发中,上传文件至服务器前的文件类型检测至关重要。这一步骤不仅能够确保服务器和用户的安全,拦截可能的恶意文件,还能保证上传的文件完整且符合预期,提高数据的合规性。同时,通过及时给予用户反馈和指导,也能提升用户体验,避免不必要的困惑。 之前阿宝...
-
Stable Diffusion 进阶教程 - 二次开发(制作您的文生图应用)
目录 1. 引言 2. 基于Rest API 开发 2.1 前置条件 2.2 代码实现 2.3 效果演示 2.4 常见错误 3. 总结 1. 引言 Stable Diffusion作为一种强大的文本到...
-
llama.cpp部署
llama.cpp 介绍 部署 介绍 大模型的研究分为训练和推理两个部分: 训练的过程,实际上就是在寻找模型参数,使得模型的损失函数最小化; 推理结果最优化的过程; 训练完成之后,模型的参数就固定了,这时候就可以使用模型进行推理,对外...
-
8款AI写作软件推荐,让文章撰写更加轻松! #其他#知识分享
从事自媒体运营光靠自己手动操作效率是非常低的,想要提高运营效率就必须要学会合理的使用一些辅助工具。下面小编就跟大家分享一些自媒体常用的辅助工具,觉得有用的朋友可以收藏分享。 1.写作兔 这是一个微信公众号 面向专业写作领域的ai写作工具,写作...
-
2024最新AI创作系统ChatGPT源码+Ai绘画网站源码,GPTs应用、AI换脸、插件系统、GPT文档分析、GPT语音对话一站式解决方案
一、前言 SparkAi创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。本期针对源码系统整体测试下来非常完美,那么如何搭建部署AI创作ChatGPT?小编这里写一个详细...
-
AI绘画利器:Stable-Diffusion-ComfyUI保姆级教程
AI绘画在今天,已经发展到了炽手可热的地步,相比于过去,无论是从画面精细度,真实性,风格化,还是对于操作的易用性,都有了很大的提升。并且如今有众多的绘画工具可选择。今天我们主要来聊聊基于stable diffusion的comfyUI! comfyU...
-
无需服务器!浏览器上直接运行近 700 个 AI 模型!
本文阿宝哥将介绍 Github 上一个超强的开源项目 —— transformers.js[1]。有了它,你可以直接在浏览器中运行 Transformers,无需服务器! 利用它提供的超能力,你可以在浏览器上直接运行不同的 AI 模型,实现很多非常有用的...
-
AIGC之gradio系列学习教程(二)Components
简述: 让我们继续了解一下 Gradio 的一些主要功能。本指南旨在对构建演示时应注意的各种事项进行高级概述。 Components Gradio 包含 30 多个预构建组件(以及许多用户构建的自定义组件),只需一行代码即可在演示中用...
-
JS 的 AI 时代来了!
JS-Torch 简介 JS-Torch[1] 是一个从零开始构建的深度学习 JavaScript 库,其语法与 PyTorch[2] 非常接近。它包含一个功能齐全的张量对象(可跟踪梯度)、深度学习层和函数,以及一个自动微分引擎。 图片 PyTorch...
-
AIGC查重高怎么降?七招助你轻松应对
大家好,小发猫降重今天来聊聊AIGC查重高怎么降?七招助你轻松应对,希望能给大家提供一点参考。 以下是针对论文重复率高的情况,提供一些修改建议和技巧,可以借助此类工具: AIGC查重高怎么降?七招助你轻松应对 在学术研究和内容创作中,AIGC(人...
-
攻陷短视频后,Sora将需要72万块H100 GPU
OpenAI 推出的 Sora 模型能够在各种场景下生成极其逼真的视频,吸引了全世界的目光。 近日,投资机构 factorial funds 发表了一篇博文,深入探讨了 Sora 背后的一些技术细节,并对这些视频模型可能产生影响进行了探讨。 最后,文中还...
-
ai人工智能写作是什么
AI人工智能写作是指利用人工智能技术和算法来生成文本内容的过程和方法。它结合了自然语言处理、机器学习和深度学习等技术,使得计算机能够模仿人类的写作风格和创造力,生成各种类型的文章、故事、新闻、评论等内容。 AI人工智能写作可以通过训练模型来学习大量的文本...
-
CVPR 2024满分论文,英伟达开源BOP排行榜6D物体姿态第一名方法
想了解更多AIGC的内容, 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 物体姿态估计对于各种应用至关重要,例如机器人操纵和混合现实。实例级方法通常需要纹理 CAD 模型来生成训练数据,并且不能应用于测试时未...
-
斯坦福团队新作:喊话就能指导机器人,任务成功率暴增,网友:特斯拉搞快点
斯坦福的ALOHA家务机器人团队,发布了最新研究成果—— 项目名为Yell At Your Robot(简称YAY),有了它,机器人的“翻车”动作,只要喊句话就能纠正了! 而且机器人可以随着人类的喊话动态提升动作水平、即时调整策略,并根据反馈持续自我改进...
-
人工智能将缩小网络安全技能差距
随着我们开始超越GenAI所能实现的范围,大量切实的机会正在涌现,有助于解决困扰网络安全的一系列长期问题,尤其是技能短缺和不安全的人类行为。今年的热门预测范围显然不在于技术,因为人为因素继续受到更多关注。任何希望建立有效且可持续的网络安全计划的CISO都...
-
【AIGC】如何在Windows/Linux上部署stable diffusion
文章目录 整体安装步骤 windows10安装stable diffusion 环境要求 安装步骤 注意事项 参考博客 其他事项 安装显卡驱动 安装cuda 卸载cuda 安装对应版本pytorch 安装git上的python包 Q&...
-
到2028年,移动控制机器人市场将达到190亿美元
在机器人技术的动态格局中,移动控制机器人将重新定义跨行业的效率、多功能性和创新。移动控制机器人市场规模预计将从2023年的101.7亿美元增长到2028年的198.1亿美元,预测期内复合年增长率为14.26%。这种快速增长轨迹是由推动移动控制机器人的采用...
-
AI大模型对神秘学易经有什么用?
Mistral Trismegistus-7B 是一款由AI驱动的神秘学专用模型,专为那些对神秘学、玄学和灵性感兴趣的人设计,可提供从古代智慧到现代塔罗牌占卜等各种神秘主题的见解。 Mistral Trismegistus-7B 名字来源于Hermes...
-
国内如何购买midjourney?midjourney购买教程?midjourney注册方式
2. Midjourney介绍 Midjourney 是AI 生图工具,输入文字就可以生成精美的图像,从风景到人物,从抽象到具象,应有尽有。你也可以对生成的图片进行放大、变形或重新生成,创造出更多的可能性。 它可以通过输入文字描述,自动生成精美的图像...
-
太全了!多模态深度学习的综述!
1.介绍 我们对世界的体验是多模态的 —— 我们看到物体,听到声音,感觉到质地,闻到气味,尝到味道。模态是指某件事发生或经历的方式,当一个研究问题包含多个模态时,它就具有多模态的特征。为了让人工智能在理解我们周围的世界方面取得进展,它需要能够同时解释这些...
-
stable-diffusion-webui踩坑指南
过年刷资讯AI的信息铺天盖地,准备研究研究。最后选择从AI绘画的stable diffusion入手。本地安装了最新的Python(13.12.2)然后直接克隆GitHub - Stability-AI/stablediffusion: High-Reso...
-
值得你花时间看的扩散模型教程,来自普渡大学
想了解更多AIGC的内容: 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 扩散模型(Diffusion Model)是图像生成模型的一种。有别于此前 AI 领域大名鼎鼎的 GAN、VAE 等算法,扩散模型另辟...
-
九.pandas绘图基础
目录 九.pandas绘图基础 1-柱状图 --参数stacked=True堆积 --参数figsize=(宽,高 --自定义横坐标 --设置字体&显示负号 2.箱型图 3. 折线图 九.pandas绘图基础 Pa...
-
从300亿分子中筛出6款,结构新且易合成,斯坦福抗生素设计AI模型登Nature子刊
想了解更多AIGC的内容, 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 全球每年有近 500 万人死于抗生素耐药性,因此迫切需要新的方法来对抗耐药菌株。 AI 方法可以发现新的抗生素,但现有方法有明显的局限...
-
这个AI绘画神器-----SD插件处理服装太给力了!
在上一篇文章中,我为大家详细介绍了Stable Diffusion中一个非常有用的插件,名为ADetailer。 这个插件主要用于修复面部问题并为面部和手增加细节。目前,ADetailer包含了14个不同的模型,每个模型都有其独特的用途。我已经对其中大部...
-
10万美元训出Llama-2级大模型!全华人打造新型MoE,贾扬清SD前CEO围观
想了解更多AIGC的内容: https://www.51cto.com/aigc/ “只需”10万美元,训练Llama-2级别的大模型。 尺寸更小但性能不减的MoE模型来了: 它叫JetMoE,来自MIT、普林斯顿等研究机构。 性能妥妥超过同等规模的Ll...
-
AIGC查重高怎么降:七大策略助你攻克学术诚信挑战
大家好,小发猫降重今天来聊聊AIGC查重高怎么降:七大策略助你攻克学术诚信挑战,希望能给大家提供一点参考。 以下是针对论文重复率高的情况,提供一些修改建议和技巧,可以借助此类工具: AIGC查重高怎么降:七大策略助你攻克学术诚信挑战 在学术研究和...
-
ICLR 2024 | 联邦学习后门攻击的模型关键层
想了解更多AIGC的内容, 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 联邦学习使多个参与方可以在数据隐私得到保护的情况下训练机器学习模型。但是由于服务器无法监控参与者在本地进行的训练过程,参与者可以篡改本...
-
拒绝白人与亚洲人同框,Meta图像生成器的「歧视」,被人挖出来了
想了解更多AIGC的内容, 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 在人工智能构筑的世界中,AI 有时会像人一样存在着某种偏见或倾向性。比如对于大语言模型而言,由于训练数据的影响会不可避免地存在性别偏见...
-
OpenAI发布新的AI微调工具:“绝大多数组织将开发定制模型”
OpenAI宣布了对其微调API的重大增强,以及其定制模型程序的扩展。这些更新将赋予开发者前所未有的控制权,以微调AI模型,并为构建特定业务需求的定制模型提供新途径。自2023年8月推出以来,GPT-3.5的微调API已经成为组织精细化AI模型以执行特定...
-
stable diffusion webui ubuntu 安装和教程
0.环境: cuda:11.8 gpu:p40 torch:2.2.0+cu118 python:3.10.12 1.git clone 下来 GitHub - AUTOMATIC1111/stable-diffusion-webui: St...