-
腾讯混元、北大发现Scaling law「浪涌现象」,解决学习率调参难题
过去十年间,基于随机梯度下降(SGD)的深度学习模型在许多领域都取得了极大的成功。与此同时各式各样的 SGD 替代品也如雨后春笋般涌现。在这些众多替代品中,Adam 及其变种最受追捧。无论是 SGD,还是 Adam,亦或是其他优化器,最核心的超参数非 L...
-
黎曼猜想显著突破!陶哲轩强推MIT、牛津新论文,37岁菲尔兹奖得主参与
黎曼猜想是数学中一个非常重要的未解决问题,与素数分布的精确性质有关(素数是那些只能被 1 和自身整除的数字,它们在数论中扮演着基础性的角色)。 在当今的数学文献中,已有超过一千条数学命题以黎曼猜想(或其推广形式)的成立为前提。也就是说,黎曼猜想及其推广形...
-
AIGC论文阅读——[Visual Speech-Aware Perceptual 3D Facial Expression Reconstruction from Videos]
AIGC论文阅读——[Visual Speech-Aware Perceptual 3D Facial Expression Reconstruction from Videos] 论文地址:https://arxiv.org/abs/2207.110...
-
AI产品经理与AIGC产品经理:我该怎么选
前言 在AI和AIGC行业的浪潮下,产品经理们面临着新的机遇和挑战。那么,AI产品经理和AIGC产品经理之间到底有什么区别呢?让我们一起来了解一下。 AI产品经理 AI产品经理的工作更为复杂,需要了解AI技术,如机器学习、自然语言处理等。 他们...
-
豆包桌面 AI 助手有哪些功能免费吗?豆包电脑版怎么使用方法详细教程指南
豆包桌面 AI 助手 是什么? 豆包桌面 AI 助手是一款集成了多种 AI 功能的桌面应用程序,旨在提升用户的工作和学习效率。它通过 AI 划词翻译、搜索、AI 伴读 PDF 等功能,帮助用户快速获取信息,节省时间,提高生产力。产品由北京春田知韵科技有限公...
-
豆包桌面AI助手完全指南:电脑版豆包使用方法教程与免费下载地址入口
探索豆包桌面 AI助手能为你带来哪些改变。 为什么选择豆包桌面AI助手? 豆包桌面 AI助手不仅仅是一款产品——它是一项革命性的技术,致力于提升用户的工作和学习效率。它通过多种AI功能,如AI划词翻译、搜索、AI伴读PDF等,帮助用户快速获取信息,节省时间...
-
豆包桌面AI助手功能介绍及免费使用指南 豆包电脑版体验地址入口
豆包桌面 AI 助手简介 豆包桌面 AI 助手是一款集成了多种 AI 功能的桌面应用程序,旨在提升用户的工作和学习效率。它通过 AI 划词翻译、搜索、AI 伴读 PDF 等功能,帮助用户快速获取信息,节省时间,提高生产力。产品由北京春田知韵科技有限公司开发...
-
LeCun新作:分层世界模型,数据驱动的人型机器人控制
有了大模型作为智能上的加持,人型机器人已然成为新的风口。 科幻电影中「安能辨我不是人」的机器人似乎已经越来越近了。 不过,要想像人类一样思考和行动,对于机器人,特别是人型机器人来说,仍是个艰巨的工程问题。 就拿简单的学走路来说,利用强化学习来训练可能会演...
-
Midjourney绘画V6版等AI绘画模型免费体验,更多玩法等你来探索!
聚力AI经过几个月的研发、测试,今天我们正式推出了聚力AI国际版,我们集百家之长于一身,用聚力AI创造无限可能! 限时注册免费使用!国际版上线活动,所有套餐均已限时开启8折优惠,更多超值套餐可以查看文末哦~ 聚力AI国际版介绍 简单介绍一下,因为中国...
-
快速学会一个算法,xLSTM
今天给大家分享一个超强的算法模型,xLSTM。 xLSTM(Extended Long Short-Term Memory)是对传统 LSTM(Long Short-Term Memory)模型的扩展和改进,旨在提升其在处理时间序列数据和序列预测任务中的...
-
【AI绘画】Stable Diffusion魔法修习—“画风“自由切换(stable diffusion模型下载与使用技巧)
stable diffusion模型文件指AI学习了大量指定风格图片后,存储了这些学习信息的文件,可以用来绘制特定风格的图片。 大模型chickpoint(检查点 :可以理解为保存指定节点的模型文件。训练模型特别耗算力,保存到指定节点之后,可以方便下次继...
-
字节跳动旗下 AI 助手豆包推出PC客户端、浏览器插件版本
近日,字节跳动旗下 AI 助手豆包正式推出了PC客户端下载,包括了Windows / MAC版本,同时,还推出了浏览器插件版本。 据悉,豆包PC客户端版本支持快捷划词翻译、AI 搜索、一键常驻桌面等功能。而插件版则提供一键总结网页与视频、写作和文本修改等...
-
开发arXiv论文引擎机器人程序:基于RAG+LangChain+Chainlit+ChromaDB
译者 | 朱先忠 审校 | 重楼 简介 在本文中,我将演示如何使用检索增强生成(RAG 技术构建语义研究论文引擎。具体地说,我将使用LangChain(https://www.langchain.com/ 作为构建语义引擎的主要框架,以及OpenAI公...
-
昆仑万维宣布开源 2 千亿稀疏大模型 Skywork-MoE
2024年6月3日,昆仑万维宣布开源了一个性能强劲的2千亿稀疏大模型,名为 Skywork-MoE。这个模型是在之前开源的 Skywork-13B 模型的基础上扩展而来的,是首个完整应用并落地 MoE Upcycling 技术的开源千亿级 MoE 大模型。...
-
7B?13B?175B?解读大模型的参数
大模型也是有大有小的,它们的大小靠参数数量来度量。GPT-3就有1750亿个参数,而Grok-1更是不得了,有3140亿个参数。当然,也有像Llama这样身材苗条一点的,参数数量在70亿到700亿之间。 这里说的70B可不是指训练数据的数量,而是指模型中...
-
Stable Diffusion扩散模型【详解】小白也能看懂!!
文章目录 1、Diffusion的整体过程 2、加噪过程 2.1 加噪的具体细节 2.2 加噪过程的公式推导 3、去噪过程 3.1 图像概率分布 4、损失函数 5、 伪代码过程 此文涉及公式推导,需要参考这篇文章: Stable...
-
whisper-v3模型部署环境执行
1. 安装whisperV3 github git clone https://github.com/openai/whisper.git pip install -U openai-whisper pip install setuptools-ru...
-
多模态大模型不够灵活,谷歌DeepMind创新架构Zipper:分开训练再「压缩」
最近的一系列研究表明,纯解码器生成模型可以通过训练利用下一个 token 预测生成有用的表征,从而成功地生成多种模态(如音频、图像或状态 - 动作序列)的新序列,从文本、蛋白质、音频到图像,甚至是状态序列。 能够同时生成多种模态输出的多模态模型一般是通过某...
-
LLM的「母语」是什么?
大语言模型的「母语」是什么? 我们的第一反应很可能是:英语。 但事实果真如此吗?尤其是对于能够听说读写多种语言的LLM来说。 对此,来自EPFL(洛桑联邦理工学院)的研究人员发表了下面这篇工作来一探究竟: 图片 论文地址:https://arxiv.or...
-
基于 Llama-Index、Llama 3 和 Qdrant,构建一个 RAG 问答系统!
构建一个使用Llama-Index、Llama 3和Qdrant的高级重排-RAG系统 尽管大型语言模型(LLMs)有能力生成有意义且语法正确的文本,但它们面临的一个挑战是幻觉。 在LLMs中,幻觉指的是它们倾向于自信地生成错误答案,制造出看似令人信...
-
真实对比kimi、通义千问、文心一言的写代码能力,到底谁强?
?AI改变生活:最近都在说月之暗面的kimi的各项能力吊打国内其他大模型,今天我们真实感受下 kimi、通义千问、文心一言的根据需求写代码的能力。 测评结果让人震惊! kimi kimi编程过程 我们先看一下热捧的月之暗面的kimi模型。...
-
基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (一)
基于LlaMA 3 + LangGraph 在windows本地部署大模型 (一) RAG 是未来人工智能应用的基石。大家并不是在寻求仅仅产生无意义反应的人工智能。而目标是人工智能能够从特定文档集中检索答案,理解查询的上下文,指导自己搜索其嵌入内容...
-
Hinton奥特曼重磅出席联合国AI大会,代表中国AI登台的竟是一位「癌患者」?
【新智元导读】达摩院医疗AI,又达新里程碑!国际顶刊《自然·医学》直接将其评价为,开启「医疗影像AI的黄金时代」。就在昨天,世卫组织亦宣布与达摩院合作,向发展中国家推广这项来自中国的AI多癌早筛技术。 5月30日,在日内瓦举行的AI for Good全球峰...
-
告别手动复制!Jina AI Reader可一键从网页抓取PDF
Jina AI 宣布其 Reader 工具现在能够从任意 URL 读取 PDF 文件,并快速解析成文本,供下游的语言模型(LLM)使用。以下是关于 Jina AI Reader 工具的详细介绍: Jina AI Reader 功能亮点: 任意 URL 读...
-
LLMs之RAG:只需四步骤—基于Ollama后端框架(配置phi3/LLaMA-3模型)结合Dify前端框架(设置知识库文件+向量化存储+应用发布)创建包括实现本地知识库问答/翻译助手等多个应用
LLMs之RAG:基于Ollama后端框架(配置phi3/LLaMA-3模型 结合Dify前端框架(设置知识库文件+向量化存储+应用发布 创建包括实现本地知识库问答/翻译助手等多个应用 目录 基于Ollama后端框架(配置phi3/LLaMA-...
-
Stable Diffusion新手完整入门指南
一:什么是Stable Diffusion Stable Diffusion 是一种基于扩散过程的图像生成模型,可以生成高质量、高分辨率的图像。它通过模拟扩散过程,将噪声图像逐渐转化为目标图像。这种模型具有较强的稳定性和可控性,可以生成具有多样化效果和...
-
腾讯元宝功能介绍及免费使用指南 腾讯AI智能助手体验地址入口
腾讯元宝简介 腾讯元宝是一款集成了AI搜索、文档总结、网页总结、AI作图等多种功能的智能助手APP。它通过人工智能技术,为用户提供便捷的信息获取和内容创作服务,旨在提高工作效率,丰富用户的生活体验。 腾讯元宝功能亮点 AI搜索:快速获取信息,如英伟...
-
【记录】LangChain|Ollama结合LangChain使用的速通版(包含代码以及切换各种模型的方式)
官方教程非常长,我看了很认可,但是看完了之后呢就需要一些整理得当的笔记让我自己能更快地找到需求。所以有了这篇文章。【写给自己看的,里面半句废话的解释都没有,如果看不懂的话直接看官方教程再看我的】 ollama是个平台,里面一大堆开源模型,llama...
-
腾讯元宝有哪些功能免费吗?AI智能助手怎么使用方法详细教程指南
腾讯元宝 是什么? 腾讯元宝是一款集成了AI搜索、文档总结、网页总结、AI作图等多种功能的智能助手APP。它通过人工智能技术,为用户提供便捷的信息获取和内容创作服务,旨在提高工作效率,丰富用户的生活体验。 腾讯元宝 有哪些功能? AI搜索:快速获取...
-
AI神器腾讯元宝APP上线 基于腾讯混元大模型开发打造
站长之家(ChinaZ.com)5月30日 消息:今日,基于腾讯混元大模型开发的AI产品——“腾讯元宝”正式上线。这款App与先前的混元小程序版本相比,更加聚焦于AI技术的深度应用,为用户提供了包括AI搜索、AI总结、AI写作在内的核心功能,展现了其全面的...
-
Khoj:一个开源的个人化AI助手 轻松连接本地与在线文档
Khoj 是一个功能丰富、开源的个人化AI助手,旨在帮助用户管理和检索各种信息源,同时提供多种智能功能以提升工作效率。 以下是Khoj的主要特点、功能及应用场景: 主要特点 多源信息获取:能够连接本地和在线文档,包括PDF、Markdown文件、Git...
-
马斯克烧60亿美元难题,国内大厂有解?开源MoE模算效率黑马登场,3.7B参数单挑Llama 3-70B
如今,想训个SOTA的大模型,不仅缺数据和算力,甚至连电都不够用了。 最近马斯克就公开表示,因为苦于买不到足够的芯片,xAI只能推迟Gork 2的训练和发布。 Grok 3及更高版本,甚至需要10万个H100,按每台H100售价3万美元来算,仅芯片就要花...
-
MIT最新力作:用GPT-3.5解决时间序列异常检测问题
今天给大家介绍一篇MIT上周发表的文章,使用GPT-3.5-turbo解决时间序列异常检测问题,初步验证了LLM在时间序列异常检测中的有效性。整个过程没有进行finetune,直接使用GPT-3.5-turbo进行异常检测,文中的核心是如何将时间序列转换...
-
基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (二)
基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (二) #Options local_llm = 'llama3' llm = ChatOllama(model=local_llm, format="json", tempe...
-
Kimi+扣子(coze) 王炸组合,我想造个GPT-4o
大家好,我是老渡。 在国产大模型中,Kimi 的表现是很不错的。正好,扣子(coze 平台支持了Kimi大模型。 扣子是搭建Agent智能体的平台,今天我们就试试用 Kimi + 扣子,做一个 GPT-4o 效果的智能体。 首先在扣子首页,点击“创建Bo...
-
【含win+Mac整合包】本地部署Stable Diffusion,超详细(AI 绘画保姆级教程,100%成功部署)
什么是stable diffusion? stable diffusion是在2022年发布的基于扩散模型的文本到图像生成模型,起初它只有一堆api供开发者使用,可以说非常难上手,随着2023年5月由AUTOMATIC1111大佬基于SD API开发的...
-
【AIGC大模型】跑通wonder3D (windows)
这两天看了AI大神李某舟被封杀,课程被下架的新闻,TU商 认为:现在这种玩概念、徒具高大上外表却无实质内容的东西太多了,已经形成一种趋势和风潮,各行各业各圈层都在做大做强这种势,对了,这种行为的学名叫宣传,俗名叫营销,花名叫忽悠,真名叫骗人。老老实实做事...
-
OPPO Reno12 Pro AI功能领先同档!售价2699元起
近年来,人工智能技术飞速发展,已经成为人们生活中不可或缺的重要组成部分。而智能手机也逐渐融入了AI功能,给用户带来更加智能便捷的体验。OPPO最新发布的旗舰手机Reno12 Pro在AI功能方面表现领先同档,为用户带来更智能化、便捷化的生活方式。 Ren...
-
ChatGPT4.0知识问答、DALL-E生成AI图片、Code Copilot辅助编程,打开新世界的大门
目录 1、DALL-E 文字转图片 + 在线AI修改 2、Write For Me 3、Code Copilot 目前最强的AI编程大模型 4、Diagrams: Show Me 5、Instant Website [Multipage] 网站...
-
PVTransformer: 可扩展3D检测的点到体素Transformer
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:PVTransformer: Point-to-Voxel Transformer for Scalable 3D Object Detection 论文链接:https://arxiv.org...
-
ChatGPT 4.0 直接用 !!!Code Copilot编程大模型、DALL-E AI绘图、绘制流程图、上传文件
嗨,你好呀,我是哪吒。 这一年最让人揪心的热点,就是各种层出不穷的AI技术。 原以为它只是短暂霸屏,但现实却赤裸裸展示了,什么叫AI抢走你的饭碗,连招呼都不打一声! 什么策划方案、公众号文案、营销卖点、宣传海报,打工人辛辛苦苦掌握到手的技能,却被AI...
-
腾讯AI实验室开发新型智能体框架TRANSAGENTS 专用于处理超长文学内容的翻译工作
腾讯AI实验室开发的"TRANSAGENTS"是一个创新的多智能体框架,专门设计用于处理超长文学内容的翻译工作。这个系统通过创建一个虚拟的翻译出版公司来模拟真实的翻译流程,其中包含多个具有不同职责和专业技能的虚拟角色。 以下是TRANSAGENTS系统的...
-
开创性CVM算法解开40多年计数难题!计算机科学家掷硬币算出「哈姆雷特」独特单词
计数,听起来简单,却在实际执行很有难度。 想象一下,你被送到一片原始热带雨林,进行野生动物普查。每当看到一只动物,拍一张照片。 数码相机只是记录追踪动物总数,但你对独特动物的数量感兴趣,却没有统计。 那么,若想获取这一独特动物数量,最好的方法是什么?...
-
开创性CVM算法破解40多年计数难题!计算机科学家掷硬币算出「哈姆雷特」独特单词
计数,听起来简单,却在实际执行很有难度。 想象一下,你被送到一片原始热带雨林,进行野生动物普查。每当看到一只动物,拍一张照片。 数码相机只是记录追踪动物总数,但你对独特动物的数量感兴趣,却没有统计。 那么,若想获取这一独特动物数量,最好的方法是什么? 这...
-
拯救被「掰弯」的GPT-4!西交微软北大联合提出IN2训练治疗LLM「中间迷失」
【新智元导读】近日,西交微软北大联合提出信息密集型训练大法,使用纯数据驱动的方式,矫正LLM训练过程产生的偏见,在一定程度上治疗了大语言模型丢失中间信息的问题。 辛辛苦苦给大语言模型输入了一大堆提示,它却只记住了开头和结尾? 这个现象叫做LLM的中间迷失(...
-
Meta发布类GPT-4o多模态模型Chameleon
Meta最近发布了一个名为Chameleon的多模态模型,它在多模态模型发展中设立了新的标杆。Chameleon是一个早期融合的基于token的混合模态模型家族,能够理解并生成任意顺序的图像和文本。它通过一个统一的Transformer架构,使用文本、图像...
-
KubeAI大模型推理加速实践|得物技术
除了上面提到的技术外,提高大模型推理速度的还有大模型的量化技术等,这里先不探讨,后面有机会,我们会单独发文章来介绍。 二、大模型发展面临的挑战 未来大模型的参数量肯定会越来越大,这也是大模型的发展趋势,对推理加速的要求会越来越高。 OpenAI在其论...
-
微软发布AI工具 Recall,帮助你找到那些找不到的文件
微软全力投入 AI PC 竞赛。在 Build 大会上,微软宣布了一些令人兴奋的消息,例如推出 C o p i l o t+ PC 系列以及即将到来的 C o p i l o t的人工智能更新。该公司还宣布了 Recall AI,这是微软描述为电脑的 “照...
-
复旦团队重大突破登Cell,破纪录复活「冰封」18个月人脑!三体云天明计划成真?
就在刚刚,科学家们成功地复活了冷冻的人类大脑! 这项技术,是低温技术领域的重大突破,为改进神经系统疾病的研究方法铺平了道路。 本月,复旦大学邵志成博士团队的这篇工作,也正式登上了Cell子刊。 论文地址:https://www.cell.com/cel...
-
数据更多更好还是质量更高更好?这项研究能帮你做出选择
对基础模型进行 scaling 是指使用更多数据、计算和参数进行预训练,简单来说就是「规模扩展」。 虽然直接扩展模型规模看起来简单粗暴,但也确实为机器学习社区带来了不少表现卓越的模型。之前不少研究都认可扩大神经模型规模的做法,所谓量变引起质变,这种观点也...