-
南开&山大&北理工团队开发trRosettaRNA:利用Transformer网络自动预测RNA 3D结构
RNA 3D 结构预测是一个长期存在的挑战。 受最近蛋白质结构预测领域突破的启发,南开大学、山东大学以及北京理工大学的研究团队开发了 trRosettaRNA,这是一种基于深度学习的自动化 RNA 3D 结构预测方法。 trRosettaRNA 流程包括...
-
「GPT-4只是在压缩数据」,马毅团队造出白盒Transformer,可解释的大模型要来了吗?
RNA3D 结构预测是一个长期存在的挑战。 受最近蛋白质结构预测领域突破的启发,南开大学、山东大学以及北京理工大学的研究团队开发了 trRosettaRNA,这是一种基于深度学习的自动化 RNA3D 结构预测方法。 trRosettaRNA 流程包括两个主...
-
13B模型全方位碾压GPT-4?这背后有什么猫腻
一个参数量为 13B 的模型竟然打败了顶流 GPT-4?就像下图所展示的,并且为了确保结果的有效性,这项测试还遵循了 OpenAI 的数据去污方法,更关键的是没有发现数据污染的证据。 如果你细细查看图中的模型,发现只要带有「rephraser」这个单词...
-
Silo AI面向欧洲推新开源语言模型“Poro” 涵盖欧盟24种语言
芬兰赫尔辛基的人工智能初创公司Silo AI本周发布了Poro,这是一个旨在提升欧洲语言多语言人工智能能力的新开源大型语言模型(LLM)。Poro是计划中的首个开源模型,旨在最终涵盖欧盟所有24种官方语言。这些模型由Silo AI的SiloGen生成人工智...
-
GPT-4比你更会问问题:让大模型自主复述,打破与人类对话的壁垒
在最新的人工智能领域动态中,人工生成的提示(prompt)质量对大语言模型(LLM)的响应精度有着决定性影响。OpenAI 提出的建议指出,精确、详细且具体的问题对于这些大语言模型的表现至关重要。然而,普通用户是否能够确保他们的问题对于 LLM 来说足够...
-
大模型走捷径「刷榜」?数据污染问题值得重视
生成式 AI 元年,大家的工作节奏快了一大截。 特别是,今年大家都在努力卷大模型:最近国内外科技巨头、创业公司都在轮番推出大模型,发布会一开,个个都是重大突破,每一家都是刷新了重要 Benchmark 榜单,要么排第一,要么第一梯队。 在兴奋于技术进展速...
-
文生图大型实践:揭秘百度搜索AIGC绘画工具的背后故事!
作者 | Tianbao 导读 2023年以来,AIGC技术已催生了新一轮人工智能浪潮。AI绘画作为大模型最引人瞩目的应用领域之一,近年来也取得了重大突破。AI绘画系统可以根据用户的输入或提示生成各种风格的图像,这为艺术家、设计师和创作者提供...
-
强化学习与多任务推荐
一、短视频推荐两阶段约束强化学习算法 首先介绍的一项快手自研的 WWW 2023 Research Track 工作,主要解决短视频推荐场景下的带约束多目标优化问题。 在短视频推荐单列场景中,用户通过上下滑形式和系统进行交互,观看多个视频。用户对每个...
-
AI「脑补」画面太强了!李飞飞团队新作ZeroNVS,单个视图360度全场景生成
近来,利用3D感知扩散模型训练模型,然后对单个物体进行SDS蒸馏的研究数不胜数。 但是,能够真正做到「场景级」的画面生成,从未实现。 现如今,斯坦福李飞飞和谷歌团队打破了这个记录! 比如,输入一张从某个角度拍摄的客厅图片,整个客厅的样貌就出来了。 再来...
-
大模型落地最后一公里:111页全面综述大模型评测
当前,大模型正凭借其强大的能力和无限的潜力引领着新一轮技术革命,众多科技巨头纷纷围绕大模型进行布局,进一步推动大模型不断向前发展。然而,尽管大模型能够协助我们完成各种任务,改变我们的生产和生活的方式,提高生产力,为我们带来便利,但大模型的发展也伴随着诸多...
-
图模型也要大?清华朱文武团队有这样一些观点
在大模型时代,图机器学习面临什么样的机遇和挑战?是否存在,并该如何发展图的大模型?针对这一问题,清华大学朱文武教授团队首次提出图大模型(Large Graph Model)概念,系统总结并梳理了图大模型相关的概念、挑战和应用;进一步围绕动态性和可解释性,...
-
像搭乐高一样做数学定理证明题,GPT-3.5证明成功率达新SOTA
背景 作为长链条严格推理的典范,数学推理被认为是衡量语言模型推理能力的重要基准,GSM8K 和 MATH 等数学文字问题(math word problem)数据集被广泛应用于语言模型的测评和比较中。事实上,数学作为一项科学研究并不仅仅包括计算具体实例,...
-
转折倒计时:AI服务器距离全面占领市场还要多久?
当超大规模厂商和云服务商考虑自己的基础设施规划问题时,首先会确定整体运行功耗,之后是挑选服务与存储组合以及额定功率下所能提供的总容量。当然,预算也是个大问题,毕竟金钱才是让这个世界维持运转的基本动力。 正所谓我爱容量、速度、插槽和功率,但我更爱金钱,毕...
-
让大模型看图比打字管用!NeurIPS 2023新研究提出多模态查询方法,准确率提升7.8%
大模型“识图”能力都这么强了,为啥还老找错东西? 例如,把长得不太像的蝙蝠和拍子搞混,又或是认不出一些数据集中的稀有鱼类…… 这是因为,我们让大模型“找东西”时,往往输入的是文本。 如果描述有歧义或太偏门,像是“bat”(蝙蝠还是拍子?)或“魔鳉”(Cy...
-
AIGC时代的视频扩散模型,复旦等团队发布领域首篇综述
AI 生成内容已经成为当前人工智能领域的最热门话题之一,也代表着该领域的前沿技术。近年来,随着 Stable Diffusion、DALL-E3、ControlNet 等新技术的发布,AI 图像生成和编辑领域实现了令人惊艳的视觉效果,并且在学术界和工业界...
-
DeepMind:大模型又曝重大缺陷,无法自我纠正推理,除非提前得知正确答案
大语言模型又一项重大缺陷被DeepMind曝光! LLM无法纠正自己推理中的错误。 「Self-Correction」作为一种让模型修正自己回答的技术,在很多类型的任务中都能明显改进模型的输出质量。 但是最近,谷歌DeepMind和UIUC的研究人员却发...