-
每日AIGC最新进展(31):新加坡国立大学提出视频生成人类评估协议、加州大学提出视频生成测试基准TC-Bench、清华大学提出视频编辑新方法COVE
Diffusion Models专栏文章汇总:入门与实战 Rethinking Human Evaluation Protocol for Text-to-Video Models: Enhancing Reliability,Reproducibi...
-
史上最「蠢」AI凶手?剧本杀被人类一秒揪出,开发者小哥紧急调教
【新智元导读】AI剧本杀,开本了!最近,两位开发者在黑客马拉松期间创作了一款AI游戏「山庄谋杀案」,我们需要和五位AI嫌疑人对话,揪出真正的凶手。没想到,小编一番试玩后,结局出乎意料…… 想玩剧本杀但凑不齐人发车? 别苦恼了!可以和AI一起博弈破案了,人机...
-
ChatGPT无法取代人类程序员! IEEE 35页论文测出困难编码正确率仅为0.66%
【新智元导读】6月,IEEE刊登了一篇对ChatGPT代码生成任务进行系统评估的论文,数据集就是程序员们最爱的LeetCode题库。研究揭示了LLM在代码任务中出现的潜在问题和能力局限,让我们能够对模型做出进一步改进,并逐渐了解使用ChatGPT写代码的最...
-
破解ChatGPT惊人耗电!DeepMind新算法训练提效13倍,能耗暴降10倍
【新智元导读】ChatGPT能耗惊人,该怎么解?谷歌DeepMind新算法JEST问世,让LLM训练的迭代次数降低13倍,计算量减少10倍,或将重塑AI未来。 ChatGPT早已成为世界耗能大户:一天用掉超50万度电,相当于1.7万个美国家庭的用电量! 然...
-
AI老照片视频生成器完全指南:怀旧体验与免费试用入口
探索AI老照片视频生成器能为你带来哪些改变 为什么选择AI老照片视频生成器? AI老照片视频生成器不仅仅是一款产品——它是一项革命性的技术,致力于利用人工智能将用户上传的老照片转换成动态视频。通过先进的图像处理算法,照片中的人物或场景呈现出动态效果,为用...
-
央视点赞国产AI复活召唤术,兵马俑竟与宝石老舅对唱Rap?
沉睡了两千多年的兵马俑,苏醒了? 一句秦腔开场,将我们带到了黄土高原。如果不是亲眼所见,很多观众可能难以想象,有生之年还能看到兵马俑和宝石 Gem 同台对唱《从军行》。 「青海长云暗雪山,孤城遥望玉门关。」古调虽存音乐变,声音依旧动人情: 这场表演背后的...
-
扎克伯格反感闭源AI:不应私藏 要把工具交到更多人手中
快科技7月2日消息,据媒体报道,Meta首席执行官扎克伯格在周四的一场最新访谈活动中,谈到了他对人工智能未来的看法。 扎克伯格认为人工智能最终不会只有一个”,他强调了开源的价值即把人工智能工具交到更多人手中。 扎克伯格对开源AI的坚定支持,不仅体现了他对技...
-
【大模型应用】使用 Windows 窗体作为 Copilot 应用程序的 Ollama AI 前端(测试llava视觉问答)...
项目 “WinForm_Ollama_Copilot” 是一个使用Windows Forms作为前端的Ollama AI Copilot应用程序。这个项目的目的是提供一个用户界面(UI ,通过它,用户可以与Ollama AI进行交互。以下是该项目的一...
-
「测测你写得像谁」免费使用地址 AI文风测试testurtext.us体验地址入口
「测测你写得像谁」简介 测测你写得像谁 是一个通过分析文本来识别不同作家文风的在线工具。它利用先进的算法和人工智能技术,帮助用户了解文本的写作风格,并与著名作家的风格进行比较。这个文风测试工具不仅具有娱乐性,还能为写作爱好者提供灵感和学习的机会。 测测...
-
智能写作时代:如何利用AI工具优化学术论文创作流程
在当今快速发展的学术研究环境中,确定论文主题和范围、撰写和润色论文成为了每位研究者面临的重大挑战。随着人工智能技术的不断进步,AI工具在学术写作中的应用越来越广泛,从选题、撰写到校对,乃至参考文献的生成,AI的辅助作用不可小觑。本文将深入探讨如何有效利用A...
-
抢疯了,腾讯给大模型人才,定了一个前所未有的标准
「21世纪什么最贵?人才!」二十年前的黎叔语录,现在听来也不过时。 这两年,大模型赛道风起云涌。科技公司们全力投入生成式 AI 技术的研发,期待将新的突破整合到自家产品中。OpenAI 是一个非常成功的样本,并受到了研究员、工程师和投资人们的广泛关注与深刻...
-
每日AIGC最新进展(16):华为诺亚实验室提出通过混合mask信息融合增强文本到图像编辑、腾讯优图实验室提出风格化图像生成算法、清华大学提出扩散模型中的概念域校正和概念保留
Diffusion Models专栏文章汇总:入门与实战 Enhancing Text-to-Image Editing via Hybrid Mask-Informed Fusion 本文提出了一种名为MaSaFusion的文本到图像编辑方法...
-
科技爱好者纷纷上场,AI预测足球赛事又现新方法
2024年欧洲杯比赛正酣。在赛场之外,一些围绕观赛的自发科技创新也开始涌现,成为了一道独特的风景。 近日,据TuGraph图计算官方微信,其创新小组研发了一项融合图计算、大模型等技术的足球赛事分析工具“智猜足球”,旨在探索新兴人工智能技术在体育赛事应用的可...
-
大模型之路3:趟到了Llama-Factory,大神们请指点
各种AI工具和框架层出不穷,为开发者和研究者提供了前所未有的便利。当然了,也有困扰。尤其是对于动手能力越来越弱的中年油腻老程序员来说,更是难上加难。据说,嗯,据师弟说,说LlamaFactory凭借其独特的功能和优势,在AI领域(他所下载的代码和工具里),...
-
AI作画算法原理详解:从数据到艺术的自动化之旅
AI作画算法原理详解:从数据到艺术的自动化之旅 在数字化时代,人工智能(AI)技术正逐步渗透到各个领域,其中AI作画技术更是引发了广泛关注。本文将详细解析AI作画算法的原理,带领读者了解从数据收集与处理到生成与优化的完整流程,揭示这一神奇技术背后的奥秘。...
-
大模型论文解读|| 数学新巅峰,微软&清华联合研究发现:7B级LLaMA-2模型数学能力惊人,准确率高达97.7%
开篇:数学能力在常规语言模型中的崭露头角 数学能力长期以来被认为是语言模型中难以攻克的领域,只有在模型规模极大或经过大量数学相关预训练的情况下才可能显现。然而,最新的研究表明,即使是规模较小的常规语言模型,如LLaMA-2 7B,也已经展现出了强大的数学...
-
每日AIGC最新进展(23):魁北克人工智能研究所提出扩展注意力机制视频编辑、浙江大学提出video-to-Audio生成算法Frieren、清华大学提出扩散模型参数高效迁移学习Diff-Tuning
Diffusion Models专栏文章汇总:入门与实战 Temporally Consistent Object Editing in Videos using Extended Attention 本文提出了一种用于视频编辑的新方法,旨在通过...
-
大模型理解复杂表格,字节&中科大出手了
只要一个大模型,就能解决打工人遇到的表格难题! 字节联手中科大推出了一款统一表格理解大模型,可以以用户友好的方式解决多种表格理解任务。 同时提出的还有一套开源测试基准,可以更好地评估模型在表格理解任务上的表现。 该模型名为TabPedia,利用多模态大模...
-
AI生图格局大震!Stable Diffusion 3开源倒计时,2B单机可跑碾压闭源Midjourney
重磅消息!Stable Diffusion3,大概率会在明天开源。距离2月SD3的横空出世,已经过去了4个月。如果此事为真,生图圈子第一个出现开源碾压闭源的奇景!强大的MMDiT全新架构,将彻底改变AI生图的格局。现在,全体AI社区都在翘首以盼。 万众瞩目...
-
如何使用AI翻译Word文件?word文件AI翻译的优势有哪些?
什么是 AI翻译Word文件? AI翻译Word文件是指使用人工智能技术自动将Word文档中的文本内容翻译成其他语言的过程。这种技术可以大大提高翻译效率,减少人工翻译的时间和成本。 AI翻译Word文件的核心功能 1:自动检测源语言,无需手动选择。 2...
-
快速入门大模型技术与应用,推荐你从Stable Diffusion开始学起
ChatGPT狂飙160天,世界已经不是之前的样子。 新建了免费的人工智能中文站https://ai.weoknow.com 新建了收费的人工智能中文站https://ai.hzytsoft.cn/ 更多资源欢迎关注 世界是变化的,分子是...
-
GPT-4欺骗人类高达99.16%惊人率!PNAS重磅研究曝出,LLM推理越强欺骗值越高
【新智元导读】最近,德国研究科学家发表的PANS论文揭示了一个令人担忧的现象:LLM已经涌现出「欺骗能力」,它们可以理解并诱导欺骗策。而且,相比前几年的LLM,更先进的GPT-4、ChatGPT等模型在欺骗任务中的表现显著提升。 此前,MIT研究发现,AI...
-
如何使用 GitHub Copilot:提示、技巧和使用案例
生成式AI编程工具正在改变开发者处理日常编码任务的方式。从文档化我们的代码库到生成单元测试,这些工具帮助加速了我们的工作流程。然而,就像任何新兴技术一样,总有一个学习曲线。因此,开发者——无论是初学者还是有经验的人——有时会感到沮丧,因为AI驱动的编程助手...
-
每日AIGC最新进展(6):视觉一致插图序列生成、阿里巴巴电商人物产品互动图生成、Text-to-Vector生成、多视图扩散模型3D重建
Diffusion Models专栏文章汇总:入门与实战 Generating Coherent Sequences of Visual Illustrations for Real-World Manual Tasks http://arxiv....
-
深度学习突破:LLaMA-MoE模型的高效训练策略
在人工智能领域,大模型(LLM)的崛起带来了前所未有的进步,但随之而来的是巨大的计算资源需求。为了解决这一问题,Mixture-of-Expert(MoE)模型架构应运而生,而LLaMA-MoE正是这一架构下的重要代表。 LLaMA-MoE是一种基于...
-
一文带你搞懂AI前沿技术AIGC
人工智能(AI)领域的发展日新月异,而AIGC(Adversarial Instance Generation and Correction)作为其中的一项前沿技术备受关注。本文将带你深入探索AIGC,解析其背后的原理、应用场景以及未来发展趋势。 什么...
-
OpenAI前员工预测:2027年AGI降临!GPT智商飙升,4年从幼儿园蹿到高中生
AGI到底是科技公司画的大饼,还是可预测的未来? 几天前,Anthropic一名25岁的高管在博客上发文,表示自己已经准备好了3年后退休,让AI取代自己的工作。 最近,OpenAI前员工的一篇博客文章也有类似的观点。 图片 他不仅认为AGI很可能实现,而...
-
Github万星!北航发布零代码大模型微调平台LlamaFactory
在人工智能领域,大语言模型(LLMs)已成为推动技术进步的关键力量。它们在理解和生成自然语言方面展现出了卓越的能力,从而在问答系统、机器翻译、信息提取等多样化任务中发挥着重要作用。然而,要将这些模型适配到特定的下游任务中,通常需要进行微调(fine-tun...
-
黎曼猜想显著突破!陶哲轩强推MIT、牛津新论文,37岁菲尔兹奖得主参与
黎曼猜想是数学中一个非常重要的未解决问题,与素数分布的精确性质有关(素数是那些只能被 1 和自身整除的数字,它们在数论中扮演着基础性的角色)。 在当今的数学文献中,已有超过一千条数学命题以黎曼猜想(或其推广形式)的成立为前提。也就是说,黎曼猜想及其推广形...
-
人工智能 | 360自研可控布局AI绘画模型HiCo发布
龙年春意伊始,360人工智能研究院正式发布新的AI绘画模型:可控布局生成模型HiCo。与大家所熟悉的文生图模型相比,HiCo在普通的文本输入之上,提供了更为强大的画面布局控制能力:用户可以根据自己的构思,指定在画面不同的区域生成不同的指定内容,实现A...
-
改进的检测算法:用于高分辨率光学遥感图像目标检测
本文经计算机视觉研究院公众号授权转载,转载请联系出处。 01 前景概要 目前,难以在检测效率和检测效果之间获得适当的平衡。我们就研究出了一种用于高分辨率光学遥感图像中目标检测的增强YOLOv5算法,利用多层特征金字塔、多检测头策略和混合注意力模块来提高...
-
YoloCS:有效降低特征图空间复杂度
本文经计算机视觉研究院公众号授权转载,转载请联系出处。 论文地址:YOLOCS: Object Detection based on Dense Channel Compression for Feature Spatial Solidificatio...
-
Mamba-2新架构出世一统江湖!普林斯顿CMU华人再出神作,性能狂飙8倍
年前,Mamba被顶会ICLR拒稿的消息曾引起轩然大波。 甚至有研究人员表示:如果这种工作都被拒了,那我们这些「小丑」要怎么办? 这次,新一代的Mamba-2卷土重来、再战顶会,顺利拿下了ICML 2024! 仍是前作的两位大佬(换了个顺序),仍是熟...
-
怎么降低AIGC论文检测
在学术领域,AIGC论文检测已成为每位研究者和学生必须面对的挑战。面对这一检测,许多人都感到困惑和焦虑,因为一旦论文被检测出重复,就可能面临学术不端的指控。那么,如何降低AIGC论文检测率,确保论文的独特性和原创性呢? 1. 深入理解AIGC检测原理...
-
Yann LeCun:ViT慢且效率低,实时图像处理还得看卷积
在 Transformer 大一统的时代,计算机视觉的 CNN 方向还有研究的必要吗? 今年年初,OpenAI 视频大模型 Sora 带火了 Vision Transformer(ViT)架构。此后,关于 ViT 与传统卷积神经网络(CNN)谁更厉害的争...
-
活体脑细胞做成16核芯片,用Python就能编程,九个机构开展实验36所大学排队
首个“脑PU”来了!由“16核”类人脑器官(human brain organoids)组成。 这项研究来自瑞士生物计算创业公司FinalSpark,并且他们宣称: 这种生物处理器(bioprocessor)的功耗比传统数字处理器低100万倍。 这些类脑...
-
不同数据集有不同的Scaling law?而你可用一个压缩算法来预测它
一般而言,训练神经网络耗费的计算量越大,其性能就越好。在扩大计算规模时,必须要做个决定:是增多模型参数量还是提升数据集大小 —— 必须在固定的计算预算下权衡此两项因素。 Scaling law 告诉我们:只要能适当地分配参数和数据,就能在固定计算预算下实...
-
多模态大模型不够灵活,谷歌DeepMind创新架构Zipper:分开训练再「压缩」
最近的一系列研究表明,纯解码器生成模型可以通过训练利用下一个 token 预测生成有用的表征,从而成功地生成多种模态(如音频、图像或状态 - 动作序列)的新序列,从文本、蛋白质、音频到图像,甚至是状态序列。 能够同时生成多种模态输出的多模态模型一般是通过某...
-
AI绘画AnimateDiff-Lightning让文生视频生成速度提升多倍!【含模型及工作流获取】
大家好,我是程序员晓晓 视频生成模型一直很受到大家的关注,近年来在深度学习技术的推动下取得了显著进展。传统的动画生成方法往往面临效率低下和质量不高等问题,而深度学习模型通过学习和理解大量的数据,能够生成更加逼真、流畅的动画视频。尤其是近两年,更是“百模”...
-
速度秒掉GPT-4o、22B击败Llama 3 70B,Mistral AI开放首个代码模型
对标 OpenAI 的法国 AI 独角兽 Mistral AI 有了新动作:首个代码大模型 Codestral 诞生了。 作为一个专为代码生成任务设计的开放式生成 AI 模型,Codestral 通过共享指令和补全 API 端点帮助开发人员编写并与代码...
-
深入解析twcms爬虫:原理、应用与风险防控
在当今信息化社会,数据已经成为一种重要的资源。随着网络技术的迅速发展,大量的数据被不断生成和存储在互联网的各个角落。为了高效获取这些数据,爬虫技术应运而生。其中,twcms爬虫作为一种针对特定内容管理系统(CMS)的爬虫,具有一定的研究和应用价值。本文将围...
-
探秘“采集论坛”:信息汇集与共享的新天地
在互联网的浩瀚海洋中,论坛一直是网友们交流思想、分享经验的重要平台。而“采集论坛”作为其中一个独特的存在,它不仅是信息的汇集地,更是知识共享与传递的桥梁。本文将深入探讨采集论坛的特点、功能、影响以及未来发展趋势,带您走进这个充满智慧与活力的网络社区。一、采...
-
采集器开发:技术创新助力数据世界
在当今信息化快速发展的时代,数据已经渗透到各行各业,成为推动社会进步的重要力量。随着大数据技术的普及和成熟,如何高效、准确地采集数据成为了摆在众多企业和机构面前的一大难题。采集器开发,正是在这样的背景下应运而生,通过技术创新不断助力数据世界的发展。一、采集...
-
“360问答爬虫”技术探秘
在当今数字化时代,随着互联网的普及和信息的爆炸式增长,如何从海量数据中高效获取所需信息成为了一个重要课题。而“爬虫”技术,作为一种自动化、智能化的信息抓取工具,正日益受到各界关注和运用。在众多爬虫技术中,“360问答爬虫”以其独特的魅力和应用价值,成为了众...
-
探秘Jeesns爬虫:技术框架与实战应用
随着互联网的迅猛发展,数据已经成为当今时代最宝贵的资源之一。而在海量的网络数据中,如何高效、准确地获取所需信息,成为了摆在我们面前的一大难题。爬虫技术应运而生,它就像网络世界中的自动勘测机,能够按照一定的规则和逻辑,自动化地抓取、解析并存储网络数据。Jee...
-
Stable Diffusion初级教程
一、入门篇 1. 理解基本概念 扩散模型(Diffusion Models):扩散模型是一种生成模型,通过逐步添加噪声到数据样本中,然后学习如何逐步去除这些噪声来恢复原始数据。 Latent Diffusion Model (LDM :LDM是...
-
一年心血被毁,OpenAI超级对齐负责人愤而出走Anthropic!Ilya去向依旧成谜
OpenAI超级对齐团队负责人Jan Leike,在前不久愤而宣布辞职后,刚刚公布了自己的新去向——入职Anthropic。 Anthropic,俨然已经成为OpenAI离职人员的「避难所」,OpenAI价值观对立面的大本营。 Jan Leike开心表示...
-
奥特曼挂帅新团队,OpenAI新一代大模型开训,前任高管却「投敌」了
在联合创始人、首席科学家 Ilya Sutskever 官宣离职、超级对齐团队被解散之后,OpenAI 研究的安全性一直备受质疑。 现在,OpenAI 董事会宣布成立新的安全与保障委员会,由董事 Bret Taylor(董事会主席)、Adam D’Ang...
-
腾讯推甲骨文AI协同平台殷契文渊2.0 可自动识别甲骨文
在安阳师范学院举办的第六届全国甲骨文整理与研究暨数字甲骨共创计划发布仪式上,腾讯宣布推出甲骨文AI协同平台“殷契文渊2.0”。该平台提供甲骨文的数据采集、存储、计算能力,并通过AI技术助力甲骨文破译。平台具备甲骨文自动识别、AI摹本生成等辅助工具,方便古文...
-
深度剖析:采集百度贴吧的挑战与机遇
在当今这个信息爆炸的时代,数据采集已经成为了许多行业不可或缺的一部分。而作为一个汇聚了亿万网民的社区平台,百度贴吧自然而然地成为了数据采集者眼中的“香饽饽”。本文将从多个角度出发,深入探讨采集百度贴吧的现状、所面临的挑战以及其中蕴藏的机遇。一、百度贴吧:信...