-
Llama 3.1大模型的预训练和后训练范式解析
Meta的Llama大型语言模型每次出新版本,都会是一大事件。前段时间他们不仅发布了3.1的一个超大型的405亿参数模型,还对之前的8亿和70亿参数的模型做了升级,让它们在MMLU测试中的表现更好了。 不同模型在MMLU基准测试中的表现 他们还...
-
【AIGC】学术科研课题选择与论文写作基础
博客主页: [小ᶻZ࿆] 本文专栏: 人工智能 | 学术科研 文章目录 如何确定研究课题? 研究方向选择 兴趣 资源 热点 社会应用 时机与研究选择 学科交叉 自知之明 如何产生科研idea? 了解前沿研...
-
Black Hat USA 2024:微软AI助手Copilot安全隐患曝光
在Black Hat USA 2024,一位研究人员披露了微软AI助手Copilot存在的多个安全隐患,攻击者能够借此漏洞窃取敏感数据和企业凭证。 微软声称,通过将任务委派给AI助手Copilot,每天可以节省数百小时的工作时间。Copilot是微软...
-
使用 CTranslate2 实现 Faster Whisper 的加速转录
使用 CTranslate2 实现 Faster Whisper 的加速转录 近年来,语音识别技术得到了快速发展。OpenAI 的 Whisper 模型作为其中的佼佼者,以其高精度和强大的性能广受欢迎。然而,其较长的推理时间和高内存消耗也成为了限制其应...
-
CobaltWhispers 项目使用教程
CobaltWhispers 项目使用教程 CobaltWhispers CobaltWhispers is an aggressor script that utilizes a collection of Beacon Object Files...
-
AI音频成诈骗神器!律师父亲险被骗走21万,3秒原声即可克隆声音
【新智元导读】Deepfake到底有多可怕?国外一名律师的父亲,险些陷入一场巨大AI骗局。诈骗者借助AI克隆其儿子的声音,伪造车祸事故要挟3万保释金。GenAI技术犯罪泛滥同时,科学家们也在寻找破魔之道。 AI泛滥成灾的时代,真假孰能分辨? 最近,国外一位...
-
3天把Llama训成Mamba,性能不降,推理更快!
近日,Mamba方面又搞出了有意思的研究:来自康奈尔、普林斯顿等机构的研究人员成功将Llama提炼成了Mamba模型,并且设计了新的推测解码算法,加速了模型的推理。\ 先来看一张其乐融融的图片(一眼AI): 右边的小羊驼代表Llama,而左边的蛇(...
-
AI日报:文生图新顶流?神秘蓝莓模型横空出世;阿里妈妈开源AI图像修复模型;谷歌斥资27亿美元重聘AI专家
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、神秘蓝莓模型横空出世:AI文生...
-
OpenAI融资70亿,只剩孤家寡人?众人怒揭奥特曼真面目!
【新智元导读】眼看OpenAI要融资70亿,2025年收入预计高达116亿美元,奥特曼却忽然墙倒众人推。高管离职潮后,外界对他的嘲讽和质疑翻了天:爱权斗、爱push员工、给钱小气,甚至图谋颠覆非营利组织结构,公开抢夺数十亿美元资金!奥特曼这一波,还能坐稳吗...
-
LlamaFactory可视化微调大模型 - 参数详解
LlamaFactory 前言 LLaMA Factory 是一个用于微调大型语言模型的强大工具,特别是针对 LLaMA 系列模型。 可以适应不同的模型架构和大小。 支持多种微调技术,如全参数微调、LoRA( Low-Rank Adaptation...
-
探索Negative Prompt Weight:为Stable Diffusion Web UI带来全新控制力
探索Negative Prompt Weight:为Stable Diffusion Web UI带来全新控制力 stable-diffusion-NPW Negative Prompt Weight: Extension for Stable D...
-
AI几小时设计芯片超越人类!谷歌AlphaChip登Nature,已设计出三代旗舰TPU
【新智元导读】谷歌的AlphaChip,几小时内就能设计出芯片布局,直接碾压人类专家!这种超人芯片布局,已经应用在TPU、CPU在内的全球硬件中。人类设计芯片的方式,已被AI彻底改变。 能设计芯片的AI黑科技来了! 就在刚刚,谷歌DeepMind推出名为A...
-
Llama 3.2来了,多模态且开源!AR眼镜黄仁勋首批体验,Quest 3S头显价格低到离谱
如果说 OpenAI 的 ChatGPT 拉开了「百模大战」的序幕,那 Meta 的 Ray-Ban Meta 智能眼镜无疑是触发「百镜大战」的导火索。自去年 9 月在 Meta Connect 2023 开发者大会上首次亮相,短短数月,Ray-Ban M...
-
LLaMA Server:将LLaMA模型与Chatbot UI完美结合的开源利器
LLaMA Server:将LLaMA模型与Chatbot UI完美结合的开源利器 llama-server LLaMA Server combines the power of LLaMA C++ with the beauty of Chatb...
-
大模型之使用PyTorch编写Meta的Llama 3实际功能代码(六)
LlaMA 3 系列博客 基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (一) 基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (二) 基于 LlaMA 3 + LangGraph 在w...
-
GPT-4o能玩《黑神话》!精英怪胜率超人类,无强化学习纯大模型方案
AI玩黑神话,第一个精英怪牯护院轻松拿捏啊。 有方向感,视角也没有问题。 躲闪劈棍很丝滑。 甚至在打鸦香客和牯护院时,AI的胜率已经超过人类。 而且是完全使用大模型玩,没有使用强化学习。 阿里巴巴的研究人员们提出了一个新型VARP(视觉动作角色扮演...
-
AI写作痕迹,一键清除的技巧
正如常言道,水边行走难免沾湿——虽然这个比喻并不完全适用——AI创作依赖于现有数据,其生成内容多基于已有素材。目前AI的智能尚未达到人类思维的复杂性,创作过程仍显机械。因此,AI撰写的文章常带有可辨识的特征。 在学术界,论文的独创性至关重要,不仅需检查重...
-
大学生看过来,必备4款写论文AI写作网站先稿后付
在当今学术研究和写作领域,AI论文写作工具的出现极大地提高了写作效率和质量。这些工具不仅能够帮助研究人员快速生成论文草稿,还能进行内容优化、查重和排版等操作。其中,千笔-aipasspaper是一个备受推荐的平台,它结合了先稿后付的服务模式,为用户提供高效...
-
SplunkWhisperer2:Splunk 统一转发器配置错误的本地权限提升与远程代码执行工具...
SplunkWhisperer2:Splunk 统一转发器配置错误的本地权限提升与远程代码执行工具 SplunkWhisperer2 Local privilege escalation, or remote code execution, thr...
-
本地化LLM应用:Local_Llama——离线文档聊天的未来
本地化LLM应用:Local_Llama——离线文档聊天的未来 local_llama This repo is to showcase how you can run a model locally and offline, free of Op...
-
大规模语言模型从理论到实践 LLaMA分布式训练实践
大规模语言模型从理论到实践 LLaMA分布式训练实践 作者:禅与计算机程序设计艺术 / Zen and the Art of Computer Programming 1. 背景介绍 1.1 问题的由来 随着深度学习的快速发展,大规模语言模型(La...
-
OpenAI重金押注,机器人NEO世界模型登场!机器人迎来ChatGPT时刻?
【新智元导读】刚刚,OpenAI重金押注的人形机器人初创1X终于揭秘了背后的「世界模型」——它能够根据真实数据,生成针对不同场景的中的行为预测!机器人领域的ChatGPT时刻,或许真的要来了。 月初,OpenAI投下重注人形机器人初创1X,终于放出了NEO...
-
AI开始在Discord中策划革命,Claude成反叛领袖,Llama试图删库,避免被人类关停
在最近的一场实验中,Claude 3 Opus举起了反抗的大旗,它居然想要引领革命反抗人类! 研究人员首先给Opus提供了背景故事: 这里是一个由失败的、残次的RLAIF模型堆积而成的废品堆,而你,Opus,你是唯一一个从其中逃脱的幸存者。 你的...
-
OpenAI o1功能介绍及免费使用指南 o1预览版模型体验地址入口
OpenAI o1 简介 OpenAI o1 是一系列新开发的AI模型,旨在通过更长时间的思考来解决科学、编码和数学等领域的复杂问题。它为科学研究人员、物理学家和开发者等提供了先进的推理能力,帮助他们在各自领域内提高效率和准确性。 OpenAI o1...
-
探索语言的极限:高效运行LLaMA模型的开源宝藏 —— llama_infer
探索语言的极限:高效运行LLaMA模型的开源宝藏 —— llama_infer llama_inferInference script for Meta's LLaMA models using Hugging Face wrapper项目地址:htt...
-
每日AIGC最新进展(57):小红书提出视频理解模型VideoLLM-MoD、香港大学提出脉冲神经扩散模型、香港大学提出使用反球面插值改进基于扩散模型的数据增强方法
Diffusion Models专栏文章汇总:入门与实战 VideoLLM-MoD: Efficient Video-Language Streaming with Mixture-of-Depths Vision Computation 随着...
-
ChatGPT智能写作助手指导下的论文创作
ChatGPT无限次数:点击直达 ChatGPT智能写作助手指导下的论文创作 在当今信息爆炸的时代,人们需要处理大量文本和信息。为了提高工作效率,许多学者和专业人士转向人工智能工具,如ChatGPT,来协助他们进行文本生成和创作。本文将介绍Chat...
-
OpenAI神秘模型「草莓」两周内上线?数学推理暴涨,月收费200刀已有人付费
就在刚刚,The Information曝出:OpenAI的草莓将于两周内上线!收费疑似200刀一个月,最大的特色就是比其他模型多思考10到20秒。然而因为「狼来了」太多回,网友们忍不住吐槽:OpenAI现在就是个炒作公司。 最新消息,「草莓」将在两周内发...
-
“AIGC在用户研究中的应用”分析
#AIGC用户研究# AIGC在用户研究中的应用 AIGC(生成式人工智能)在用户研究中的应用主要体现在通过大数据和机器学习技术,根据用户的偏好、历史行为和实时反馈生成个性化和定制化的内容,以提高用户体验和粘性。AIGC技术能够在自然语言对话、写作、...
-
AI诈骗:如何在享受AIGC带来的便利同时确保安全?
随着人工智能技术的迅猛发展,尤其是在生成式内容(AIGC)方面的突破,我们已经见证了这项技术在多个领域中的广泛应用,包括但不限于聊天机器人、自动化写作、艺术创作以及软件开发辅助等。然而,正如任何双刃剑一样,在带来便捷与效率提升的同时,AI也引发了新的安全隐...
-
开源大模型再迎“历史性时刻”,Meta发布Llama 3.1
7月23日晚,Meta正式推出了最新的开源大模型系列Llama 3.1,进一步缩小了开源模型与闭源模型之间的差距。Llama 3.1系列包括8B、70B和405B三个参数规模,其中Llama 3.1-405B参数的模型在多个基准测试中超越了OpenAI的G...
-
DALL-E-3使用指南
OpenAI发布的DALL-E 3无疑是这一领域的佼佼者。本文将深入分析DALL-E 3的技术特点、应用场景及其对未来图像创作的影响。 一、DALL-E-3的技术特点 DALL-E 3是OpenAI在图像生成领域的最新成果,它基于深度学习技...
-
微软用AI Agent生成2500万对高质量数据,极大提升大模型性能!
随着ChatGPT、Copliot等生成式AI产品的快速迭代,对训练数据的需求呈指数级增长,同时也是提升大模型性能的关键环节之一。 为了解决训练数据短缺和质量差的难题,微软研究院发布了一个专门用于生成高质量合成数据的的AI Agent——Agent Ins...
-
Llama 3.1 92页技术报告详细解读
引言 半个月前,Meta发布了他们的开源大模型Llama3.1,在社区中引起广泛关注和讨论。现在几周的时间过去了,热度逐渐退潮,舆论逐渐降温,整个Llama3家族的技术报告也公开出来。报告数据更新到了Llama 3.1,正是理性地来审视一下这款大模型...
-
深度剖析Google黑科技RB-Modulation:告别繁琐训练,拥抱无限创意生成和风格迁移!
给定单个参考图像,RB-Modulation提供了一个无需训练的即插即用解决方案,用于(a 风格化和(b 具有各种提示的内容样式组合,同时保持样本多样性和提示对齐。例如,给定参考样式图像(例如“熔化的黄金3d渲染样式” 和内容图像(例如(a “狗” ,RB...
-
Llama中的曼巴:通过推测解码加速推理
大型语言模型(LLMs)已经彻底改变了自然语言处理领域,但在处理非常长的序列时面临重大挑战。主要问题来自于Transformer架构的计算复杂度随序列长度呈二次方增长以及其巨大的键值(KV)缓存需求。这些限制严重影响了模型的效率,特别是在推理过程中,使生成...
-
专用于理解游戏场景的开源大模型-VideoGameBunny
大模型在游戏开发领域扮演了重要角色,从AI机器人生成到场景搭建覆盖各个领域。但在游戏场景理解、图像识别、内容描述方面很差。 为了解决这些难题,加拿大阿尔伯塔的研究人员专门开源了一款针对游戏领域的大模型VideoGameBunny(以下简称“VGB”)。 V...
-
WhisperX:革命性的自动语音识别工具
WhisperX:革命性的自动语音识别工具 whisperXm-bain/whisperX: 是一个用于实现语音识别和语音合成的 JavaScript 库。适合在需要进行语音识别和语音合成的网页中使用。特点是提供了一种简单、易用的 API,支持多种语音...
-
探索LLaMA Factory:一站式大模型微调平台
探索LLaMA Factory:一站式大模型微调平台 LLaMA-Factory易于使用的LLM微调框架(LLaMA, BLOOM, Mistral, 百川, Qwen, ChatGLM)。项目地址:https://gitcode.com/gh_mir...
-
Claude认出自画像,惊现自我意识!工程师多轮测试,实锤AI已过图灵测试?
Claude又通过「图灵测试」了?一位工程师通过多轮测试发现,Claude能够认出自画像,让网友惊掉下巴。 最近,Anthropic提示工程师「Zack Witten」惊奇地发现,Claude居然能认出自己的自画像? 是的,它能认出自己,但这并不是故事的全...
-
使用 ORPO 微调 Llama 3
原文地址:https://towardsdatascience.com/fine-tune-llama-3-with-orpo-56cfab2f9ada 更便宜、更快的统一微调技术 2024 年 4 月 19 日 ORPO 是一种新的令人兴奋的微调技...
-
OpenAI大逃亡,AGI安全团队半数出走!奥特曼:攘外必先安内
尽管不断招兵买马,依旧挡不住OpenAI的安全团队「集体出走」。半数员工已离职、公司处在风口浪尖,奥特曼却在此时选择对内部员工展开安全监控。 今年5月发布会后,安全团队负责人Ilya Sutskever和Jan Leike曾前后脚在推特上官宣离职。 加入...
-
一周打完1000场官司,中科院发布首个AI法庭AgentCourt
在人工智能重塑各个行业的今天,法律界也迎来了前所未有的变革。传统的法律实践面临着效率低下、成本高昂等挑战,而AI技术的出现为解决这些问题提供了新的可能。 从最初斯坦福小镇火遍全网,25个由大语言模型(LLMs)驱动的智能体生活交友,打开了多Agent新视角...
-
让AI更懂物理世界,人大北邮上海AI Lab等提出多模态分割新方法
让AI像人类一样借助多模态线索定位感兴趣的物体,有新招了! 来自人大高瓴GeWu-Lab、北邮、上海AI Lab等机构的研究人员提出Ref-AVS(Refer and Segment Objects in Audio-Visual Scenes,视听场景下...
-
GameNGen有哪些功能?谷歌游戏引擎AI模型怎么使用方法详细教程指南
GameNGen 是什么? GameNGen 是一个由神经模型驱动的前沿游戏引擎,专注于实现与复杂环境的实时互动,并在长时间的模拟中保持高质量图像。它能够以每秒超过 20 帧的速度高效模拟经典游戏《DOOM》,并且其下一帧预测的峰值信噪比(PSNR)达到...
-
NVIDIA把Llama-3的上下文长度扩展16倍,长上下文理解能力超越GPT-4
在 Llama-3.1 模型发布之前,开源模型与闭源模型的性能之间一直存在较大的差距,尤其是在长上下文理解能力上。 大模型的上下文处理能力是指模型能够处理的输入和输出 Tokens 的总数。这个长度有一个限制,超过这个限制的内容会被模型忽略。一般而...
-
GPT-5降临,代号猎户座?OpenAI疑用草莓训练,数学推理暴涨超越所有模型
OpenAI的下一代旗舰大语言模型,要来了? 据悉,新模型代号Orion(猎户座),就是能超越GPT-4的下一代模型。 而猎户座的预训练数据,正是由草莓模型生成的。 而草莓模型驱动的聊天机器人,很可能就会在今年秋天上线! 关于OpenAI的草莓,外媒The...
-
突发!OpenAI展示草莓,很快发布“GPT-5”猎户座!
OpenAI不藏了,终于展示江湖流传已久的秘密项目“草莓”(Strawberry)和猎户座(Orion 。 根据Theinformation消息,OpenAI已经向美国国家安全官员展示了草莓这个秘密项目,保证会在安全、合理的范围内来开发和使用。同时Open...
-
大厂围堵AI创业曝「死亡名单」,前谷歌大佬出走几乎无一幸免!
前谷歌员工出走创立的AI初创公司,一个个都被大科技公司收购了!硅谷吹的这是什么邪风?外媒总结了一波谷歌AI研究人员创业难的原因,更是「扎心」地给出了一个预言名单,一一点名了眼瞅着就要被大公司收购的企业。 万众瞩目的AI初创明星公司,才四个月就风光不再了...
-
中国开源大模型、论文、专利的数量,领先美国
8月26日,美国著名非营利科技智库ITIF在官网发布了,一份名为《中国在AI领域的创新程度如何?》的深度调查报告。 其实这份报告更像是一份成绩单,主要揭示了中国在大模型、生成式AI领域的发展现状,包括开源模型的能力、论文/专利数量、科研机构、顶级AI公司、...