-
探索Llama 3.1:深入理解其多语言与长上下文处理能力
摘要 Llama 3.1,一款先进的语言模型,以其庞大的参数量和卓越的性能而闻名。本文将分析Llama 3.1在不同规模版本中—405B、70B和8B—的多语言处理能力和长上下文理解能力,探讨其在人工智能领域的应用潜力。 引言 随着人工智能技术的飞速...
-
【史上最强的AIGC的使用场景和具体案例分析】
AIGC(Artificial Intelligence in Game Creation)是一种利用人工智能技术辅助游戏开发的方法。它可以用于游戏中的各个方面,包括游戏设计、关卡设计、角色设计、AI行为设计等。 以下是一些AIGC的使用场景和具体案例...
-
AI日报:百度“橙篇”APP上线;知网状告秘塔AI搜索;Midjourney推全新图像编辑器;清华大学推万字AI系统LongWriter
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、百度AI原生应用“橙篇”APP...
-
Nature曝惊人内幕:论文被天价卖出喂AI!出版商狂赚上亿,作者0收入
Nature的一篇文章透露:你发过的paper,很可能已经被拿去训练模型了!有的出版商靠卖数据,已经狂赚2300万美元。然而辛辛苦苦码论文的作者们,却拿不到一分钱,这合理吗? 全球数据告急,怎么办? 论文来凑! 最近,Nature的一篇文章向我们揭露了这样...
-
AI领域的《猫鼠游戏》,盘点那些打假“AI内容”的强大产品,这款检测器已经突破400万用户
莱昂纳多扮演的小弗兰克在《猫鼠游戏》中凭借着高超的假币伪造技术骗过了一众警察。现实中,AI领域的《猫鼠游戏》正在上演,一场有关人工制作内容和 AI 生成内容的判定成为越来越重要的议题。 Human or AI,这是一个问题。 本文介绍了 GPTZero 这...
-
一步步带你解锁 Stable Diffusion:精准控制物体颜色
小伙伴们平时有么有遇到过描述人物或者物体的时候,如果有太多的描述,会发现怎么出来的效果图的颜色文不对题呢,这个主要是 SD 在绘画的过程中,如果描述的颜色过多,颜色之间会相互污染,导致最终的出图效果你符合预期。 一般这种时候我们就只能靠抽卡来解决了。...
-
AI模型提早5年预警乳腺癌,MIT研究登Science获LeCun转发
【新智元导读】科学家正在通过AI的力量,改变乳腺癌的现状。 在全球范围内,每年有超过60万名女性因乳腺癌而无法存活。 美国有八分之一的女性一生中会被诊断出患有乳腺癌。 这些数字听起来很可怕,但并非毫无希望。 当处于最早的局部阶段时,5年相对生存率为99%...
-
比OpenAI的Whisper快50%,最新开源语音模型
生成式AI初创公司aiOla在官网开源了最新语音模型Whisper-Medusa,推理效率比OpenAI开源的Whisper快50%。 aiOla在Whisper的架构之上进行了修改采用了“多头注意力”机制的并行计算方法,允许模型在每个推理步骤中预测多个t...
-
Stable Diffusion 保姆级实战教程!学不会来打我!
前言 本教程没有难懂的理论,全是实操的截图,非常通俗易懂。 能够帮你在最短的时间里,掌握Stable Diffusion的核心操作方法。真正有效地提高工作的效率。 教程主要是讲我们在工作中高频使用的4个功能模块:文生图、图生图、后期处理和标签器。如...
-
开源大模型杀疯了!Mistral新模型三分之一参数卷爆Llama 3.1,“新趋势已显而易见”...
克雷西 西风 发自 凹非寺量子位 | 公众号 QbitAI Llama 3.1 405B“最强模型”宝座还没捂热乎,就被砸场子了—— Mistral AI发布最新模型Mistral Large 2,参数123B,用不到三分之一的参数量性能比肩...
-
OpenAI模型年化收入10亿美元,百度发布文心一言新模型、比尔·盖茨:不要“过分担心”AI 用电
ChatGPT狂飙160天,世界已经不是之前的样子。 更多资源欢迎关注 1、OpenAI AI模型销量超越微软同类产品!年化收入达10亿美元 在2019年与微软建立合作伙伴关系后,AI初创公司OpenAI显示出了惊人的销售能力,根据最新两家...
-
实战解读:Llama Guard 3 & Prompt Guard
前序研究:实战解读:Llama 3 安全性对抗分析 近日,腾讯朱雀实验室又针对 Llama 3.1 安全性做了进一步解读。 2024年7月23日晚,随着Llama3.1的发布,Meta正式提出了“Llama系统”的概念,通过系统级的安全...
-
python系列&deep_study系列:实战whisper第三天:fast whisper 语音识别服务器部署,可远程访问,可商业化部署(全部代码和详细部署步骤)
实战whisper第三天:fast whisper 语音识别服务器部署,可远程访问,可商业化部署(全部代码和详细部署步骤) 实战whisper第三天:fast whisper 语音识别服务器部署,可远程访问,可商业化部署(全部代码和详细部署步骤...
-
长上下文能力只是吹牛?最强GPT-4o正确率仅55.8%,开源模型不如瞎蒙
【新智元导读】当今的LLM已经号称能够支持百万级别的上下文长度,这对于模型的能力来说,意义重大。但近日的两项独立研究表明,它们可能只是在吹牛,LLM实际上并不能理解这么长的内容。 大数字一向吸引眼球。 千亿参数、万卡集群,——还有各大厂商一直在卷的超长上下...
-
OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源
【新智元导读】小模型时代来了?OpenAI带着GPT-4o mini首次入局小模型战场,Mistral AI、HuggingFace本周接连发布了小模型。如今,苹果也发布了70亿参数小模型DCLM,性能碾压Mistral-7B。 小模型的战场,打起来了!...
-
【八股文】算法岗位八股文、深度学习、AIGC八股文面试经验(一)
1. 请解释一下Batch Normalization的原理及其在训练深度神经网络中的作用。 Batch Normalization(批归一化)是一种在训练深度神经网络时常用的技术,旨在提高训练速度、稳定性和性能。 2. 在图像预处理过程中,如何选择合适...
-
(5-5-01)金融市场情绪分析:使用Llama 2 大模型实现财经信息的情感分析微调(1)
5.5 使用Llama 2 大模型实现财经信息的情感分析微调 情感分析在金融和经济领域具有重要意义,可以帮助企业从市场洞察、风险管理和投资决策等方面获得有价值的信息。然而,在金融和经济文本方面的标注数据相对稀缺,因此需要使用自然语言处理技术和预训练模型...
-
OpenAI发布PVG:用小模型验证大模型输出,解决“黑盒”难题
7月18日凌晨,OpenAI在官网发布了最新技术研究——Prover-Verifier-Games。 随着ChatGPT在法律、金融、营销等领域的广泛使用,确保模型的安全、准确输出同时被很好理解变得非常重要。但由于神经网络的复杂和多变性,我们根本无法验证其...
-
麦当劳决定炒掉AI员工,用AI点餐这件事不靠谱
从游戏公司的画师到电销公司的客服,被AI影响到工作的人在2023年可谓是一茬接着一茬,甚至“第一批因AI而失业的人出现”更是成为了去年部分媒体最有兴趣的话题。事实上,AI技术的快速发展确实已经开始对人类社会造成影响,但过高估计当下AI的能力也大可不必,因为...
-
浅谈数学模型在UGC/AIGC游戏数值调参中的应用(AI智能体)
浅谈数学模型在UGC/AIGC游戏数值调参中的应用 ygluu 卢益贵 关键词:UGC、AIGC、AI智能体、大模型、数学模型、游戏数值调参、游戏策划 一、前言 在策划大大群提出《游戏工厂:AI(AIGC/ChatGPT)与流程式游戏开发》讨论之后...
-
基于MindSpore实现BERT对话情绪识别
本文分享自华为云社区《【昇思25天学习打卡营打卡指南-第二十四天】基于 MindSpore 实现 BERT 对话情绪识别》,作者:JeffDing。 模型简介 BERT全称是来自变换器的双向编码器表征量(Bidirectional Encoder...
-
新研究:AI测谎能力比人类更强 但需谨慎使用
快科技7月15日消息,据媒体报道,德国维尔茨堡大学当地时间12日公布的最新研究显示,在假新闻、政治家的可疑言论和被操纵的视频日益泛滥的时代,人工智能在测谎方面的表现比人类更佳。 这项发表在《iScience》期刊上的研究,精心设计了一场实验:参与者被要求撰...
-
【AIGC调研系列】InternVL开源多模态模型与GPT-4V的性能对比
InternVL和GPT-4V都是多模态模型,但它们在性能、参数量以及应用领域上有所不同。 InternVL是一个开源的多模态模型,其参数量为60亿,覆盖了图像/视频分类、检索等关键任务,并在32个视觉-语言基准测试中展现了卓越性能[2]。InternV...
-
6700万参数比肩万亿巨兽GPT-4!微软MIT等联手破解Transformer推理密码
「因果推理」绝对是当前GenAI热潮下的小众领域,但是它有一个大佬级的坚定支持者——Yann LeCun。 他在推特上的日常操作之一,就是炮轰Sora等生成模型,并为自己坚信的因果推理领域摇旗呐喊。 甚至,早在2019年VentureBeat的采访中,他...
-
搭建本地whisper语音识别
目录 代码仓库 编辑 选择模型 环境配置 语音识别测试 Whisper是一个通用的语音识别模型。它是在不同音频的大型数据集上训练的,也是一个多任务模型,可以执行多语言语音识别、语音翻译和语言识别。 代码仓库 GitHub - ope...
-
如何使用Whisper语音识别模型
Whisper 是一个通用语音识别模型,由 OpenAI 开发。它可以识别多种语言的语音,并将其转换为文本。Whisper 模型采用了深度学习技术,具有高准确性和鲁棒性。 1、技术原理及架构 Whisper 的工作原理:音频被分割成...
-
探索大模型:袋鼠云在 Text To SQL 上的实践与优化
Text To SQL 指的是将自然语言转化为能够在关系型数据库中执行的结构化查询语言(简称 SQL)。近年来,伴随人工智能大模型技术的不断进步,Text To SQL 任务的成功率显著提升,这得益于大模型的推理、理解以及指令遵循等能力。 对于大数据平台...
-
AI自学超越人工标注训练,蚂蚁数科2篇自监督学习论文入选国际顶会
近日,蚂蚁数科2项研究成果分别入选“欧洲计算机视觉会议(ECCV)”和“国际机器学习大会(ICML ”,可实现无需人工打标数据的情况下,通过自监督学习、强化学习等方法训练模型输出可信结果。据悉,两项成果将被应用于视频版权保护和智能问答领域。作为人工智能领域...
-
文心一言对GPT-4o的评价与分析
在人工智能的浪潮中,大型语言模型(LLM)的发展日新月异,为自然语言处理(NLP)领域带来了诸多突破。GPT系列模型作为其中的佼佼者,其每一次更新都牵动着业界的目光。近日,GPT-4o的发布更是引发了广泛的讨论。本文将从文心一言的视角出发,对GPT-4o进...
-
理财AI勇闯「无人区」:理解专家、成为专家
用十年时间成为全球在线服务数亿用户的财富管理平台后,摆在蚂蚁财富面前的是一段少有人走过的路: 这5亿活跃用户第一次动动手就能接触到各类普惠的理财产品,但真正理财行为成熟的仅占两成。而放眼中国7.2亿基金投资者里,每3600人才能分到1位传统理财顾问来服务。...
-
破解ChatGPT惊人耗电!DeepMind新算法训练提效13倍,能耗暴降10倍
【新智元导读】ChatGPT能耗惊人,该怎么解?谷歌DeepMind新算法JEST问世,让LLM训练的迭代次数降低13倍,计算量减少10倍,或将重塑AI未来。 ChatGPT早已成为世界耗能大户:一天用掉超50万度电,相当于1.7万个美国家庭的用电量! 然...
-
外滩大会举办全球deepfake攻防挑战赛,百万奖金悬赏“AI打假”专家
近日,外滩大会·全球Deepfake攻防挑战赛正式启动报名。该赛事提供百万级的数据集,针对“AI换脸”的欺诈风险进行攻防实战演练,并设立100万元人民币的奖金池,鼓励推动AI向善的技术人才。 大赛由蚂蚁集团主办、蚂蚁数科承办,ATEC前沿科技探索社区、蚂...
-
【产品经理修炼之道】-AI 产品经理和 AIGC 产品经理有什么区别
AI 和 AIGC 行业两个行业带动了产品经理的的能力提升,那AI产品经理与AIGC产品经理两者中间有什么区别的呢?下面一起来看一下,之间的不同之处吧! 目前很火的 AI 和 AIGC 行业,也带动了产品经理能力的升级和迭代。我们可以从各大招聘平台看到,...
-
上海一医院用AI自动生成病历 效率提升30倍
快科技6月30日消息,对于眼科医生而言,工作节奏快、强度高,除了要进行日常手术和诊疗工作外,还需要处理大量繁琐却相似的病史书写工作。 为此,上海市第一人民医院引入蚂蚁大模型能力进行提高病史书写效率的创新应用。 通过关键信息的给定、语音输入等多种形式结合自动...
-
AI文本生成识别新突破!西湖大学推出Fast-DetectGPT
快科技6月28日消息,西湖大学工学院张岳教授领导的文本智能实验室开发了一种名为Fast-DetectGPT的新文本检测方法。 据悉,该方法能高效识别AI生成的文本,并且Fast-DetectGPT无需训练,即可准确检测包括ChatGPT、GPT-4在内的多...
-
AI日报:谷歌发布最强开源语言模型Gemma2;讯飞星火V4炸场;Glif作者创建meme梗图生成器风靡推特
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、谷歌发布最强开源语言模型Gem...
-
Stable Diffusion 3: Research Paper
Stable Diffusion 3: Research Paper 1. 核心理念 扩展模型 (Stable Diffusion 在與 DALL·E 3、Midjourney v6 和 Ideogram v1这些图像生成系统相比,在书写效果以及...
-
AI日报:GPTs靠边站!Claude推全新功能Projects;Figma大更新!AI设计几秒成稿;阿里Qwen-2稳夺全球开源大模型榜首
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、Claude推类GPTs功能P...
-
AIGC“人才工厂“:助力B端企业的AI+转型和电商宣传
元壤教育:我们专注于培养AIGC新质人才,免费为3000万大学生和待业人群提供专业教育和职业发展机会,同时为企业定制AIGC人才工厂服务,助力构建高效人才梯队并解决营销、销售和推广难题。 引言: 先说一下目前的AI发展状况:人工智能(AI)的迅猛发展,...
-
哈啰集团全面接入通义灵码,AI 生成代码占比 20%,研发提效 12%
6月21日,在阿里云 AI 智领者峰会上海站,哈啰集团算法总监贾立宣布,哈啰集团已全面接入阿里云通义灵码专属版,不仅提升了内部研发效率,实现 AI 代码采用率超过20%,还将灵码接入了哈啰自研C o pilot“海螺机器人”共同帮助用户实现智能代码补全、进...
-
(5-5-02)金融市场情绪分析:使用Llama 2 大模型实现财经信息的情感分析微调(2)
5.5.4 Llama-2语言模型操作 编写下面的代码,功能是加载、配置 Llama-2 语言模型以及其对应的分词器,准备好模型为后续的对话生成任务做好准备。 model_name = "../input/llama-2/pytorch/7b-h...
-
Whisper开源免费的语音识别:OpenAI如何用AI改变字幕制作与语音理解的未来!
OpenAI的Whisper语音识别系统的用途广泛且强大,主要包括但不限于以下几点: 会议和讲座记录转写:Whisper可以帮助学生和职场人士快速将会议、讲座或课堂的录音转换成文字稿,便于复习、整理笔记或分享内容。 视频字幕生成:对于电影和电视节...
-
Kimi创始人套现4000万美元疑云|「商汤」大模型一体机可节约80%推理成本,完成云端边全栈布局|中国AI活化石,熬成AIGC第一股| 谁在制造小米汽车?
Kimi创始人套现4000万美元疑云 「商汤」大模型一体机可节约80%推理成本,完成云端边全栈布局 苹果卷开源大模型,公开代码、权重、数据集、训练全过程,OpenELM亮相 特斯拉的反围剿战术还剩下啥? 腾讯出手,投了家创新药公司 谁在制造小米汽车? 估值...
-
基于Llama 3的最强开源医疗AI模型OpenBioLLM-Llama3,刷新榜单
项目概述 OpenBioLLM-70B是一款先进的开源生物医学大型语言模型,由Saama AI实验室基于Llama 3技术精心开发并微调。此模型专为生物医学领域设计,利用尖端技术,在多种生物医学任务中实现了最先进的性能表现。 背景: Saam...
-
GPT-4o攻破ARC-AGI无法被挑战的神话!71%准确率成新SOTA
【新智元导读】号称不可能轻易被击败的AGI基准ARC-AGI被GPT-4o撼动,GPT-4o以在公共测试集50%、在训练集71%的准确率成为了新的SOTA! ARC-AGI是唯一可以用来衡量通用人工智能进展的基准,创造者François Chollets曾...
-
高考志愿服务,一张AI搜索的现实考卷
随着最后一笔落下,承载着高考考生们的知识考卷就此完成。另一张更为复杂的现实考卷——志愿填报,悄然摆在了家长和考生们的面前。 2024是多个省份进入新高考的第一年,新高考为考生带来了更大的选择空间和自由度,一些地区的考生需要填报的志愿数量达到几十、上百个。...
-
科技爱好者纷纷上场,AI预测足球赛事又现新方法
2024年欧洲杯比赛正酣。在赛场之外,一些围绕观赛的自发科技创新也开始涌现,成为了一道独特的风景。 近日,据TuGraph图计算官方微信,其创新小组研发了一项融合图计算、大模型等技术的足球赛事分析工具“智猜足球”,旨在探索新兴人工智能技术在体育赛事应用的可...
-
Gemini视频推理遥遥领先GPT-4o,Jeff Dean连续转发三次,首个视频多模态基准Video-MME来了
OpenAI和谷歌接连两场发布会,把AI视频推理卷到新高度。 但业界还缺少可以全面评估大模型视频推理能力的基准。 终于,多模态大模型视频分析综合评估基准Video-MME,全面评估多模态大模型的综合视频理解能力,填补了这一领域的空白。 Gemini1.5P...
-
硬核解读KubeEdge基于大模型边云协同的机器人语义分割算法
本文分享自华为云社区《KubeEdge:基于大模型边云协同的机器人语义分割算法》,作者:云容器大未来。 近年来快速发展的视觉大模型(例如 SAM 在促进高精度的智能感知方面具有很大的潜力。然而,边缘环境中的资源限制往往会限制这种视觉大模型在本地部署,从...
-
大模型论文解读|| 数学新巅峰,微软&清华联合研究发现:7B级LLaMA-2模型数学能力惊人,准确率高达97.7%
开篇:数学能力在常规语言模型中的崭露头角 数学能力长期以来被认为是语言模型中难以攻克的领域,只有在模型规模极大或经过大量数学相关预训练的情况下才可能显现。然而,最新的研究表明,即使是规模较小的常规语言模型,如LLaMA-2 7B,也已经展现出了强大的数学...