-
腾讯 2023 年ESG报告出炉:发展负责任的AI,以数字技术推进可持续发展目标
4月8日,腾讯发布2023年ESG(即“环境、社会及管治”)报告。值得关注的是,2023年标普全球可持续发展评估提高了腾讯控股(00700.HK 的ESG评分,使其业内排名超过谷歌、Meta,位列行业全球前五。 “数字科技和人工智能是腾讯实现可持续发展的核...
-
阿里7B多模态文档理解大模型拿下新SOTA
多模态文档理解能力新SOTA! 阿里mPLUG团队发布最新开源工作mPLUG-DocOwl 1.5,针对高分辨率图片文字识别、通用文档结构理解、指令遵循、外部知识引入四大挑战,提出了一系列解决方案。 话不多说,先来看效果。 复杂结构的图表一键识别转换为M...
-
52个AIGC视频生成算法模型介绍
基于Diffusion模型的AIGC生成算法日益火热,其中文生图,图生图等图像生成技术普遍成熟,很多算法从业者开始从事视频生成算法的研究和开发,原因是视频生成领域相对空白。 AIGC视频算法发展现状 从2023年开始,AIG...
-
苹果研发多模态AI,这是研究人员迄今发现的结果
译者 | 布加迪 审校 | 重楼 如果我告诉你,在最近热议的多模态AI背后,苹果正在悄然酝酿一场革命,你会作何感想?苹果的一群研究人员一直在系统地研究如何构建功能最强大的多模态模型,揭露了质疑传统智慧的重要见解。现在他们让我们有机会一窥底层的细节。 他...
-
继电动汽车之后,下一次汽车转型是否已经发生?
随着从内燃机汽车向电动汽车的转变从未消失,停在街边的汽车连接充电线如何迅速成为一种常见景象。而且似乎一些汽车制造商已经度过了过渡阶段。汽车数字化和计算机化是另一个重大转变,它拥有约1亿行代码和1,000多个半导体芯片,而且这一趋势还在持续增长。据估计,...
-
通用文档理解新SOTA,多模态大模型TextMonkey来了
最近,华中科技大学和金山的研究人员在多模态大模型 Monkey [1](Li et al., CVPR2024)工作的基础上提出 TextMonkey。在多个场景文本和文档的测试基准中,TextMonkey 处于国际领先地位,有潜力带来办公自动化、智慧教...
-
Image-Manga Translator官网体验入口 AI漫画图像翻译工具免费在线使用地址
Image-Manga Translator是一款能够将漫画或图片中的文字进行多语言翻译和图像处理的工具。它具有文本检测、光学字符识别(OCR 、机器翻译和图像修补等功能,支持多种语言如日语、中文、英语和韩语等,能够实现近乎完美的翻译效果。主要面向漫画爱好...
-
帝国CMS采集插件的应用与优化探索
在网络信息高度发达的今天,内容管理系统(CMS)已成为众多网站建设的核心基石,其中帝国CMS作为国内一款知名度较高的CMS系统,受到广泛关注与应用。为了让帝国CMS在使用过程中更为高效地进行内容的获取和发布,“帝国CMS采集插件”这一扩展功能,就在用户的需...
-
利用Discuz插件实现优酷视频高效采集与管理
随着互联网信息的日益增长和视频内容的广泛应用,如何为社区论坛高效地采集和管理视频内容已成为网站运营者所面临的问题之一。而在国内的视频分享领域中,优酷视频无疑是重要的代表。将优酷视频集成到自己的社区论坛,如基于Discuz建设的网站中,能够有效地提升内容丰富...
-
基于Discuz论坛的帖子采集与爬虫自创建账号策略
随着网络信息的爆炸式增长,数据采集技术日益受到重视。论坛作为互联网上的重要信息交流平台,蕴含了大量有价值的数据。Discuz作为一款广受欢迎的论坛软件,其数据采集对于研究者、企业乃至个人而言都具有重要意义。然而,在进行数据采集时,往往会遇到反爬虫机制、登录...
-
零一万物大模型开放平台体验入口 01-ai API接口使用地址
零一万物大模型开放平台是一个通过API调用获取高品质Yi系列大模型的平台。Yi系列模型基于零一万物的前沿科研成果和高品质数据训练而成,曾在多个权威榜单中获得SOTA表现。 主要产品包括yi-34b-chat-0205、yi-34b-chat-200k和y...
-
ImagenATexto官网体验入口 AI图像转换为可编辑文本工具
ImagenATexto是一个在线工具,可以将图像转换为可编辑的文本。它使用先进的OCR技术,确保准确提取图像中的文本。用户只需上传图像,工具会自动识别并提取文本。适用于转换文件、书籍、引用等。它支持多种图像格式,界面简单易用。 点击前往ImagenAT...
-
MIT创世纪核聚变刷新世界记录!高温超导磁体解锁恒星能量,人造太阳即将诞生?
清洁能源的圣杯,被攻下了? 「一夜之间,MIT团队将聚变反应堆的每瓦特成本几乎降低到了1/40,让核聚变技术在商用成为了可能」! 最近,MIT等离子体科学与核聚变中心以及英联邦聚变系统(CFS)发表了一篇综合报告。 这份报告援引在「IEEE应用超导会刊...
-
基于Discuz打造高效内容采集站点的全方位解析
在网络信息爆炸的今天,如何从海量数据中获取有价值的信息成为内容创造者的重要任务之一。作为拥有庞大会员基数的知名社区软件平台,Discuz具备着内容聚合、用户交互以及良好的拓展性等多种功能特性。基于Discuz的灵活性与高扩展性,许多站长和网站管理者将视线转...
-
Magi官网体验入口 AI漫画生成文本处理工具免费使用方法指南教程
Magi是一个用于自动为漫画生成文本记录的模型,它能够检测漫画中的角色、文本块和面板,并将它们按照正确的顺序排列。此外,该模型还能够聚类角色,将文本与其对应的说话者匹配,并执行OCR以提取文本。 点击前往Magi官网体验入口 谁可以从Magi中受益? M...
-
基于“采集discuz论坛隐藏内容”的技术分析与探讨
随着互联网的深入发展,论坛作为信息交流和共享的平台,承载着大量的知识和数据。Discuz作为一款广泛使用的论坛系统,其灵活性和扩展性受到了众多站长的青睐。然而,在Discuz论坛中,出于保护版权、限制访问或增加用户粘性等目的,部分内容可能被设置为隐藏,仅对...
-
谷歌发布最新「读屏」AI!PaLM 2-S自动生成数据,多项理解任务刷新SOTA
【新智元导读】谷歌在语言和声控计算机界面的漫长道路上又迈出了重要一步。最新ScreenAI视觉语言模型,能够完成各种屏幕QA问答、总结摘要等任务。 每个人想要的大模型,是真·智能的那种...... 这不,谷歌团队就做出来了一个强大的「读屏」AI。 研究人员...
-
给AI Agent完整的一生!港大NYU谢赛宁等最新智能体研究:虚拟即现实
【新智元导读】近日,来自香港大学的Jihan Yang和纽约大学的谢赛宁等人发表了新的成果,将真实世界的地图、街景等各种信息融入Agent所在的虚拟世界,为智能体的未来赋予了无限可能。 怎样能构建更强大的AI Agent? 答案是给他们一个完整而真实的世界...
-
Windows、Office直接上手,大模型智能体操作电脑太6了
当我们谈到 AI 助手的未来,很难不想起《钢铁侠》系列中那个令人炫目的 AI 助手贾维斯。贾维斯不仅是托尼・斯塔克的得力助手,更是他与先进科技的沟通者。如今,大模型的出现颠覆了人类使用工具的方式,我们或许离这样的科幻场景又近了一步。想象一下,如果一个多模...
-
AIGC音视频工具分析和未来创新机会思考
编者按:相较于前两年,2023年音视频行业的使用量增长缓慢,整个音视频行业遇到瓶颈。音视频的行业从业者面临着相互竞争、不得不“卷”的状态。我们需要进行怎样的创新,才能从这种“卷”的状态中脱离出来?LiveVideoStack 2023上海站邀请到了P...
-
AIGC内容分享(六十五):AIGC是如何让1688主图焕发新春的 | 更换产品背景
目录 前言 一、整体方案 二、品质主图生产 三、品质主图投放 四、一些数据和线上case 五、立足当下 六、展望未来 更换产品背景 Step 01 Step 02 Step 03 Step 04 Step 05 前言 本...
-
每周AI新闻(2024年第3周)Meta研发Llama 3 | 苹果Vision Pro预售 | 智谱AI发布GLM-4
我是陌小北,一个正在研究硅基生命的、有趣儿的碳基生命。每周日20:00,准时解读每周AI大事件。 大厂动向 【1】Meta研发Llama 3,构建开源AGI Meta公司CEO马克·扎克伯格(Mark Zuckerberg)=宣布公司将对两个关键A...
-
吉他摇滚、电子音乐都能搞定,Meta开源音频生成新模型MAGNeT,非自回归7倍提速
在文本生成音频(或音乐)这个 AIGC 赛道,Meta 最近又有了新研究成果,而且开源了。 前几日,在论文《Masked Audio Generation using a Single Non-Autoregressive Transformer》中,...
-
AI破译2000年前「上古卷轴」登Nature头版!21岁计算机天才,谷歌华人工程师共获大奖
2000年前碳化的古卷轴,如今成功被AI破译!背后三人团队还拿下70万美元大奖! AI在考古领域的重大进步,甚至登上了今天Nature的头版。 要说这件事的起源,还得追溯到公元79年一次火山爆发, 直接将一座珍藏古老的纸莎草卷轴——Herculaneu...
-
机器人和人工智能如何实现供应链的自动化
自动化技术如今正在进入各个行业领域,这在供应链中尤为明显。事实上,正如人们所知,自动化技术的未来进步可能会重塑整个供应链和供应链管理软件。 有远见的供应链参与者已经在为新形势做好准备。首席信息官应该带头为他们的组织带来最好的结果,但首先了解供应链中机器...
-
【Python爬虫学习】总结了八种学习爬虫的常用技巧
此篇内容小结: 1)基本网页获取 2)爬虫ip被封的6个解决方法 3)爬虫绕过登录 4)Cookies处理 5)应对反爬的小招 6)验证码处理 7)gzip 压缩 8)爬虫中文乱码问题 基本网页获取 首先向一个 Url 地址发送请求,随后远端...
-
「我在淘天做技术」2024 年看 AIGC 是如何让 1688 主图焕发新春的
作者:姬无 我在这里想向大家介绍 1688 严选和商品品质化之旅。 去年,我们推出了 1688 严选,面临的挑战是如何让买家相信我们的商品真的经过了严格的筛选。为了解决这个问题,我们定义了“严选”标准,并运用 AIGC 技术规模化生产和投...
-
【AIGC-图片生成视频系列-3】AI视频随心而动:MotionCtrl的相机运动控制和物体运动控制
目录 一. 项目简介 二. 主要贡献 三. 摘要 四. 实现方法和管线 五. 基于 LVDM [1] / VideoCrafter1 [2]的结果 (A 相机运动控制 (B 物体运动控制 (C 相机+物体运动控制 (D 与Vide...
-
关于AIGC的学习问题,你想要知道的都在这里
AIGC前沿|今日推荐 - 关于AIGC学习的16个问题 - 转眼间,2024年第一个月已经快过去了。去年,随着AI的爆发,各行各业纷纷“AI+”。AI绘画也在不断地发展与进步。最近也参加了许多关于AI绘画的讲座/分享会,顺便将一些学习/咨询AI绘...
-
GPT-4V只能排第二!华科大等发布多模态大模型新基准:五大任务14个模型全面测评
近期,多模态大模型(LMMs)在视觉语言任务方面展示了令人印象深刻的能力。然而,由于多模态大模型的回答具有开放性,如何准确评估多模态大模型各个方面的性能成为一个迫切需要解决的问题。 目前,一些方法采用GPT对答案进行评分,但存在着不准确和主观性的问题。另...
-
华科大发布多模态大模型新基准 覆盖五大任务
近期,华中科技大学等机构发布了一项关于多模态大模型(LMMs)的全面评估新基准,旨在解决多模态大模型性能评估的问题。这项研究涉及了14个主流多模态大模型,包括谷歌Gemini、OpenAI GPT-4V等,覆盖了五大任务、27个数据集。然而,由于多模态大模...
-
赶超Gemini Pro,提升推理、OCR能力的LLaVA-1.6太强了
去年 4 月,威斯康星大学麦迪逊分校、微软研究院和哥伦比亚大学研究者共同发布了 LLaVA(Large Language and Vision Assistant)。尽管 LLaVA 是用一个小的多模态指令数据集训练的,却在一些样本上展示了与 GPT-4...
-
百度交了份“大”作业:文心一言用户破1亿,累计37亿字文本创作,能力再升32%!...
金磊 发自 凹非寺量子位 | 公众号 QbitAI 今年国产大模型的最后一声枪响,属于百度: 发布仅2个月,文心大模型4.0,能力又提升了32%。 文心一言用户规模超过1个亿! 这便是在深度学习“春晚”——WAV...
-
讯飞推出“智慧黑板”:从板书工具跃迁为教师AI助手
快科技1月30日消息,今天下午讯飞星火大模型3.5正式发布。 会上,科大讯飞推出了星火智慧黑板”,号称让黑板从板书工具跃迁为教师AI助手。 据了解,星火智慧黑板具备四大特色: 1、多模态理解与推荐,让知识的讲解更直观、更生动 2、全自然交互,让老师授课更便...
-
年轻人的第一个多模态大模型:1080Ti轻松运行,已开源在线可玩
一款名为Vary-toy的“年轻人的第一个多模态大模型”来了! 模型大小不到2B,消费级显卡可训练,GTX1080ti 8G的老显卡轻松运行。 想将一份文档图片转换成Markdown格式?以往需要文本识别、布局检测和排序、公式表格处理、文本清洗等多个步骤...
-
更适合中文LMM体质的基准CMMMU来了:超过30个细分学科,12K专家级题目
近期,随着多模态大模型(LMM) 的能力不断进步,评估 LMM 性能的需求也日益增长。与此同时,在中文环境下评估 LMM 的高级知识和推理能力的重要性更加突出。 在这一背景下,M-A-P 开源社区、港科大、滑铁卢大学、零一万物等联合推出了面向中文大规模多...
-
中文性能反超VLM顶流GPT-4V,阿里Qwen-VL超大杯限免!看图秒写编程视觉难题一眼辨出
【新智元导读】多模态大模型将是AI下一个爆点。最近,通义千问VLM模型换新升级,超大杯性能堪比GPT-4V。最最重要的是,还能限时免费用。 最近,通义千问实火。 前段时间被网友玩疯的全民舞王,让「AI科目三」频频登上热搜。 让甄嬛、慈禧、马斯克、猫主子和兵...
-
Windows Copilot 功能介绍和使用教程
目录 Windows Copilot 最新更新 Windows Copilot 功能介绍 Windows Copilot 使用教程 使用 Windows Copilot Windows Copilot 最新更新 Windows Co...
-
Pika、Gen-2、ModelScope、SEINE……AI视频生成哪家强?这个框架一测便知
AI 视频生成,是最近最热门的领域之一。各个高校实验室、互联网巨头 AI Lab、创业公司纷纷加入了 AI 视频生成的赛道。Pika、Gen-2、Show-1、VideoCrafter、ModelScope、SEINE、LaVie、VideoLDM 等视...
-
【AI接口】语音版、文心一言大模型和AI绘图、图片检测API
文章目录 一、语音版大模型AI 1、接口 2、请求参数 3、请求参数示例 4、接口返回示例 二、AI图片鉴黄合规检测API 1、接口 2、请求参数 3、请求参数示例 4、接口返回示例 5、报错说明 6、代码开源 三、人工智能AI绘画AP...
-
stable-diffusion打造自己的lora模型(使用lora-scripts)
1、训练图片收集 比如要训练一个自己头像的模型,就可以拍一些自己的照片(20-50张,最少15张),要求画质清晰,脸部轮廓清楚,背景较为简单的照片。 2、使用stable_diffusion的预处理功能进行图片的预处理 这里可以根据自己的情况设置...
-
VideoCrafter2官网体验入口 视频生成AI模型在线使用方法
VideoCrafter2 官网体验入口是一款强大的视频生成AI模型,能够根据您提供的文本描述生成高质量、流畅的视频作品。无需复杂的视频编辑技能,只需简单的文本描述,VideoCrafter2 就能帮助您创作出剧本级别的视频。在本文中,我们将详细介绍如何使...
-
AI视野:百度推视频生成模型UniVG;下一代大模型Llama3正在训练;腾讯推视频模型VideoCrafter2;TikTok测试AI作曲功能
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 🤖📱💼AI应用 1、百度推出视频生...
-
微软Windows 11 Paint新增AI生成图像功能(附使用教程)
各种人工智能图像生成器将根据您的描述创建图像。但最贴近家庭的一个是微软自己的画图程序。借助 Windows11版本的 Paint,Windows11用户可以使用名为 Cocreator 的 AI 驱动工具来生成图像。 除了描述您想要的内容之外,还可以选择特...
-
大型语言模型检索增强生成利器——向量搜索引擎
译者 | 朱先忠 审校 | 重楼 简介 随着大型语言模型(LLM)席卷全球,向量搜索引擎也紧随其后。同时,向量数据库也构成大型语言模型长期记忆系统的基础。 通过有效的算法找到相关信息并使其作为上下文传递给语言模型,向量搜索引擎可以提供超出训练截止值的最...
-
肯睿中国Cloudera:数据与AI如何帮助企业“反脆弱”?
2023年,无论是个人还是企业,“脆弱“几乎是一种普遍的状态。 在全球经济经历诸多重大动荡的今天,越来越多个人和企业意识到“反脆弱“的重要性。“反脆弱“这一概念由作家尼古拉斯 · 塔勒布提出,是一个比复原力、强韧性更高阶的概念。简单来讲,反脆弱指的是在混...
-
连可怜的记事本都没躲过微软的 AI 魔爪
从一个 Windows Insider 用户发布的截图来看,Windows 记事本将成为微软人工智能关注的下一个对象。 虽然在当前的任何 Windows Insider 版本中都无法直接使用该功能,但精明的用户总能找到方法深入系统,将那些未经公开预览的...
-
WAIC2023| AIGC究竟在向善还是向恶而行?
目录 一、常见图像篡改技术 二、传统篡改图像检测方法 2.1、基于光源和噪声的拼接图像篡改检测方法 2.2、基于马尔科夫特征的检测方法 三、基于深度学习的图像篡改检测方法 3.1、基于Fisher编码和SVM模型的方法 3.2、 基于...
-
AI视野:阿里推ReplaceAnything框架;OpenAI取消军用禁令;Pika推视频画面扩充功能;SD推图生视频插件I2V-Adapter
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 👨💻💡🎯聚焦开发者 阿里推Rep...
-
2023年AIGC发展回顾与展望
2023年是人工智能内容生成(AIGC)技术飞速发展的一年。从年初ChatGPT一炮打响,大家纷纷加入到大模型研究之中。期间Midjourney和Stable Diffusion AI绘画技术持续火热,基于AIGC类的应用也如雨后春笋般遍地...