-
【Llama3.1-8B-Instruct】Llama Factory 等部署实战
一、模型介绍 Meta Llama 3.1 系列是一个多语言大型语言模型 (LLM 集合,包括 8B、70B 和 405B 三种尺寸(文本输入/文本输出)。Llama 3.1 的指令调优版本(8B、70B、405B)针对多语言对话用例进行了优化,并在常...
-
沈义人谈iPhone 16:标准版升级明显 最重要的AI无法使用有些尴尬
快科技9月12日消息,今日晚间,沈义人发微博谈iPhone 16系列。 他说,iPhone 16标准版升级明显,Pro系列产品线又重回去了,这代最重要的AI无法使用有些尴尬,窄边框的视觉感受提升明显。 据了解,今年的iPhone 16、iPhone 16...
-
一年拿下4500万用户,西语用户自己的“ChatGPT”
前些日子出炉的2024上半年 a16z Top50AI App 榜单中,有一个有点陌生的产品 Luzia,排在了第25位,压过了字节的豆包、Perplexity 等多个知名产品。 按 MAU 排名的 AI App 榜单中 Luzia 排名第25|图片来源...
-
iPhone 16系列AI明年才有中文!卢伟冰:小米15不用等明年 更懂中国用户
快科技9月10日消息,今年iPhone 16系列依然没有太大升级,最大的亮点就是加入了Apple Intelligence,但目前却还未正式公开。 据苹果介绍,Apple Intelligence功能将于10月随iOS 18.1系统推出,进入测试阶段,将以...
-
Mistral联合英伟达开源12B小模型:碾压Llama 3,单张4090可跑
小模型,成为本周的AI爆点。 与动辄上千亿参数的大模型相比,小模型的优势是显而易见的:它们不仅计算成本更低,训练和部署也更为便捷,可以满足计算资源受限、数据安全级别较高的各类场景。因此,在大笔投入大模型训练之余,像 OpenAI、谷歌等科技巨头也在积极训...
-
本地部署,Whisper: 开源语音识别模型
目录 简介 特点 应用 使用方法 总结 GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak SupervisionRobust Speech Reco...
-
探索Llama 3.1:深入理解其多语言与长上下文处理能力
摘要 Llama 3.1,一款先进的语言模型,以其庞大的参数量和卓越的性能而闻名。本文将分析Llama 3.1在不同规模版本中—405B、70B和8B—的多语言处理能力和长上下文理解能力,探讨其在人工智能领域的应用潜力。 引言 随着人工智能技术的飞速...
-
Llama 3.1要来啦?!测试性能战胜GPT-4o
哎呀,Meta声称将于今晚发布的Llama 3.1,数小时前就在Hugging Face上泄露出来了?泄露的人很有可能是Meta员工? 还是先来看泄露出来的llama3.1吧。新的Llama 3.1模型包括8B、70B、405B三个版本。 而经...
-
终于来了,OpenAI测试GPT-4o高级语音模式!
OpenAI宣布开始向小部分ChatGPT Plus用户,测试GPT-4o的高级语音模式。 本次测试将主要搜集安全、功能方面的反馈,OpenAI会在8月初分享一份全面的GPT-4o评估报告。随后,还会发布视频和屏幕共享新功能。 获取测试权限的用户会收到O...
-
Llama-3.1-70B有哪些功能?Meta AI最新模型怎么使用方法详细教程指南
Meta-Llama-3.1-70B 是什么? Meta-Llama-3.1-70B是Meta公司推出的大型语言模型,拥有 70 亿个参数,支持 8 种语言的文本生成。该模型采用优化的Transformer架构,并通过监督式微调和人类反馈强化学习进一步优化...
-
python系列&deep_study系列:找不到字幕?Whisper 让不懂外语的你也能看懂日剧,支持99种语言
找不到字幕?Whisper 让不懂外语的你也能看懂日剧,支持99种语言 找不到字幕?Whisper 让不懂外语的你也能看懂日剧,支持99种语言 音视频转录 字幕翻译 Whisper 进阶命令 task language model 幻听参数...
-
首个超越GPT4o级开源模型!Llama 3.1泄密:4050亿参数,下载链接、模型卡都有了
Llama3.1终于现身了,不过出处却不是 Meta 官方。 今日,Reddit 上新版 Llama 大模型泄露的消息遭到了疯传,除了基础模型,还包括8B、70B 和最大参数的405B 的基准测试结果。 下图为 Llama3.1各版本与 OpenAI G...
-
估值5亿美元了,抓住日韩,AI语言学习产品跻身赛道Top3
上周,AI 语言学习产品 Speak 又融资了,完成了2000万美金 B-3轮融资,由 Buckley Ventures 领投,之前领投了2700万美金轮次的 OpenAI Startup Fund 这次也跟投了。完成本轮融资之后,Speak 的总融资额达...
-
估值5亿美元了,抓住日韩,AI语言学习产品跻身赛道Top3(上)
上周,AI 语言学习产品 Speak 又融资了,完成了2000万美金 B-3轮融资,由 Buckley Ventures 领投,之前领投了2700万美金轮次的 OpenAI Startup Fund 这次也跟投了。完成本轮融资之后,Speak 的总融资额达...
-
提示词工程入门-使用文心一言4.0-通义千问-GPT4-Claude3通用提示技巧测试
提示词工程基础🚀 在了解完了大语模型的基本知识,例如API的使用多轮对话,流式输出,微调,知识向量库等知识之后,接下来需要进一步补足的一个大块就是提示词工程,学习和了解提示词工程除了基本的提示词类型之外,不同的大模型对于提示词工程润色之后...
-
微软欲将Windows打造成AI操作系统,推出Copilot+电脑
微软希望将生成式AI带到Windows及其运行的电脑的前沿。 在本周年度Build开发者大会的两场主题演讲中,该公司发布了一系列名为Copilot+的Windows新机型,以及如Recall等生成式AI功能,帮助用户查找过去浏览过的应用、文件和其他内容。...
-
羊驼系列大模型LLaMa、Alpaca、Vicuna
羊驼系列大模型:大模型的安卓系统 GPT系列:类比ios系统,不开源 LLaMa让大模型平民化 LLaMa优势 用到的数据:大部分英语、西班牙语,少中文 模型下载地址 https://huggingface.co/meta-llama...
-
从46款AI教育产品,看全球八大市场用户学习偏好
Question AI 助力作业帮上市的传闻、字节跳动旗下 Gauth 超越多邻国登顶美国教育总榜、Answer.AI 凭借个位数成员的小团队成为北美 AI 教育第一梯队产品,让市场看到了 AI 教育的机会。 为了进一步了解 AI 教育赛道的发展情况,我们...
-
利用 NVIDIA Riva 快速部署企业级中文语音 AI 服务并进行优化加速
一、Riva 概览 1. Overview Riva 是 NVIDIA 推出的一款 SDK,用于实时的 Speech AI 服务。它是一个高度可定制的工具,并且使用 GPU 进行加速。NGC 上提供了很多预训练好的模型,这些模型开箱即用,可以直接使用...
-
盘点GPT-4o十大创意玩法!挑水果、看牙片、全自动化炒股,看完格局瞬间打开
自从OpenAI发布GPT-4o以来,“头号AI玩家”每天的状态be like:新语音模式上线了吗? 是的,还没有,但应该快了。 不过,毕竟GPT-4o已经上线半个月多,虽然新语音模式迟迟未来,但这不影响网友们用它整活儿。本期,“头号AI玩家”全方位盘点...
-
27岁华裔天才少年对打UC伯克利,首发SEAL大模型排行榜!Claude 3 Opus数学封神
前段时间,由27岁的华裔创始人Alexandr Wang领导的Scale AI刚刚因为融资圈了一波关注。 今天,他又在推特上官宣推出全新LLM排行榜——SEAL,对前沿模型开展专业评估。 SEAL排行榜主打三个特色: - 私有数据 Scale AI的专...
-
阿里开源截止目前为止参数规模最大的Qwen1.5-110B模型:MMLU评测接近Llama-3-70B,略超Mixtral-8×22B!
本文原文来自DataLearnerAI官方网站:阿里开源截止目前为止参数规模最大的Qwen1.5-110B模型:MMLU评测接近Llama-3-70B,略超Mixtral-8×22B! | 数据学习者官方网站(Datalearner https://www...
-
Spotify推出西语版AI DJ“DJ Livi” 开启个性化音乐体验新纪元
Spotify正加速向人工智能转型,为用户提供更个性化的音乐体验。最新消息显示,该公司正在开发一款全新的西语版AI DJ"DJ Livi",这是其现有英语版"DJ X"的首个语言扩展。 知名逆向工程师Chris Messina在Spotify应用程序代码中...
-
微软Edge将使用AI实时翻译你观看的YouTube视频内容
微软在其 Build 大会上宣布,微软 Edge 浏览器将很快推出新的功能,允许用户在观看 YouTube 等视频时进行实时翻译。这项新的 AI 功能将支持多种语言,并适用于 YouTube、Reuters、CNBC News、Bloomberg、Mone...
-
微软宣布 GPT-4o 模型在 Azure OpenAI 上使用
日前,微软宣布OpenAI 最新发布的多模态模型 GPT-4o 现已可以在 Azure OpenAI 云服务中使用。 GPT-4o 是一款支持跨文本、视频、音频多模态推理的先进模型,其强大多模态解读和输出能力使其在各个领域都展现出巨大的潜力。例如,在教育...
-
OpenAI发布最新旗舰大模型GPT-4o:免费试用 价格五折速度提高一倍
GPT-4o具体特性一览: 站长之家(ChinaZ.com)5月14日 消息:今日凌晨,OpenAI发布了最新旗舰大模型GPT-4o。这款全能AI不仅免费可用,而且具备横跨听图片、看图片、说图片的多项能力,为用户带来如视频电话般丝滑流畅的交流体验。 O...
-
刚刚,Mistral AI最新磁力链放出!8x22B MoE模型,281GB解禁
【新智元导读】初创团队Mistral AI再次放出一条磁力链,281GB文件解禁了最新的8x22B MoE模型。 一条磁力链,Mistral AI又来闷声不响搞事情。 281.24GB文件中,竟是全新8x22B MOE模型! 全新MoE模型共有56层,...
-
GPT-5史诗级更新之前,OpenAI的“新东西”来了,曝定价百万字符15美元,语音克隆引擎让老外说“有口音的”中文
撰稿 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto) OpenAI的新动作来了!此前Altman在采访中透露,在GPT-5史诗级的升级发布之前,OpenAI将在未来几个月发布许多“很酷的新东西”。 今天,OpenAI语音引擎首次亮...
-
谷歌发布“Vlogger”模型:单张图片生成10秒视频
谷歌发布了一个新的视频框架: 只需要一张你的头像、一段讲话录音,就能得到一个本人栩栩如生的演讲视频。 视频时长可变,目前看到的示例最高为10s。 可以看到,无论是口型还是面部表情,它都非常自然。 如果输入图像囊括整个上半身,它也能配合丰富的手势: 网友...
-
医生们正在将医疗GenAI变成一个蓬勃发展的行业
对于医生来说,最热门的新技术有望重新带来一种古老的医疗实践:与患者进行面对面的对话。 本周,在佛罗里达州奥兰多举行的HIMSS会议上,3万多名卫生和技术专业人士聚集在棕榈树旁,环境中的临床文档成为展厅的话题。 这项技术允许医生自愿记录他们与患者的就诊情...
-
Hello8官网体验入口 AI视频翻译工具免费在线使用地址
Hello8是一款视频翻译工具,能够将视频内容快速翻译成 29 种以上语言,以便触达全球受众。使用Hello8 可以帮助内容创作者、营销人员、代理商和在线教师将视频内容本地化并扩大影响力。该工具采用全自动AI翻译技术,一键即可完成视频翻译,节省大量翻译时间...
-
OpenAI 与多家出版商合作 可能会给竞争对手带来麻烦
近期,OpenAI宣布与法国Le Monde和西班牙Prisa Media签署合同,将这些出版商的新闻内容引入OpenAI的ChatGPT聊天机器人,以扩大训练数据量。这一合作将为ChatGPT用户呈现有意义的法语和西班牙语新闻内容,并为OpenAI的长期...
-
央视首部AI译制英文版系列微纪录片《来龙去脉》今日开播:讲解龙之起源
快科技3月12日消息,今年是中国农历龙年,龙是中华民族的图腾,具有刚健威武的雄姿、勇猛无畏的气概、福泽四海的情怀、强大无比的力量。 央视专门制作了一部《来龙去脉》系列微纪录片中文版由总台影视剧纪录片中心制作,已于春节期间在央视综合频道、纪录频道播出。 近日...
-
Apollo开源轻量级多语言医疗 LLM:助力将医疗 AI 民主化推广至60亿人口
医疗人工智能(AI)技术正在迅速发展,旨在利用大型语言模型(LLMs 的巨大潜力彻底改变医疗保健交付方式。这些技术进步承诺提高诊断准确性,个性化治疗方案,并解锁全面医学知识的获取,从根本上改变患者护理。将 AI 整合到医疗保健中旨在提高医疗服务的效率和精确...
-
Claude3给GPT4上了一课!Open AI最强对手深夜炸弹,附全图解析!
出品 | 51CTO技术栈(微信号:blog51cto) 深夜,OpenAI最强对手Anthropic一口气发布了三个SOTA新品,其中包括:Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus。业界惊呼:Clau...
-
MyShell AI开发高质量语音合成工具MeloTTS 支持中英混合发音
MeloTTS是由MyShell AI开发的一个高质量的多语言文本到语音(TTS)库。这个库支持英语、西班牙语、法语、中文、日语和韩语等多种语言,使其在全球范围内具有广泛的应用价值。 项目地址:https://top.aibase.com/tool/me...
-
Mistral AI新模型对标GPT-4,不开源且与微软合作,网友:忘了初心
生成式 AI 领域,又有重量级产品出现。 周一晚间,Mistral AI 正式发布了「旗舰级」大模型 Mistral Large。与此前的一系列模型不同,这次 Mistral AI 发布的版本性能更强,体量更大,直接对标 OpenAI 的 GPT-4。而...
-
意外!明星公司 Jasper 裁员;SD进阶教程之混合语法;2份LLM进展必读报告;谷歌Bard支持中文且免费 | ShowMeAI日报
👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦! 🤖 AIGC 领域的当红炸子鸡 Jasper 裁员,转头聚焦AI营销 Jasper是一家美国人工智能公司,乘着 AIGC 的东风迅速崛起,成为AI助手...
-
打通谷歌办公软件 Bard与ChatGPT走差异化道路
时隔半年,曾被ChatGPT吊打的Bard发布重磅更新,打通了Gmail、Docs等谷歌办公应用全家桶的数据,支持一键转存AIGC内容至谷歌系的邮箱、文档、表格等应用程序中,还在对话页面加入“Google it”自核实功能,避免对话机器人的幻觉Bug。...
-
OpenAI为ChatGPT推出多语言功能Alpha版灰度测试;微软Copilot网页端和App更新了GPTs和购买Copilot Pro功能
OpenAI为ChatGPT推出多语言功能灰度测试。 微软Copilot网页端和App更新了GPTs和购买Copilot Pro功能 关于ChatGPT的详细介绍请看我这篇文章;关于Copilot Pro的详细介绍请看我这篇文章。 Open...
-
玩LLM和StableDiffusion常说的LoRA到底是什么
论文地址:LoRA: Low-Rank Adaptation of Large Language Models LoRA是一种用于adapters和大模型迁移的技术,全称为Low-Rank Adaptation of Large Language M...
-
又一AI独角兽!文生音频ElevenLabs融资5亿美元,估值超10亿美元
成立仅两年的AI音频公司ElevenLabs近日宣布B轮成功融资8000万美元,估值超过10亿美元,成功晋升为独角兽公司。 这轮融资由Andreessen Horowitz、Nat Friedman、Daniel Gross联合领投,红杉资本、Smash...
-
可口可乐旗下体育饮料品牌BodyArmor在超级碗广告中使用AI生成的图像
可口可乐旗下体育饮料品牌BodyArmor正在其区域性超级碗广告系列中采用人工智能生成的图像,广告名为"Field of Fake"。 该广告呈现了由AI生成的超现实体育亮点,伴随着机器音响。与竞争对手形成对比的是,BodyArmor强调其产品不含人工甜...
-
标题:智能对话新纪元:ChatGPT与文心一言的全面比较
标题:智能对话新纪元:ChatGPT与文心一言的全面比较 引言: 在这个由数据驱动的时代,人工智能语言模型已成为技术创新的前沿。特别是OpenAI的ChatGPT和百度的文心一言(ERNIE Bot),它们不仅代表了人工智能的最新成就,也在我们的日常生...
-
Jasper ai: 智能AI写作文章内容生成助手工具
Jasper.ai是一款使用了人工智能技术的AI文章写作助手工具,可以帮助你快速生成各种类型的文案和内容。无论你是想要写营销广告、博客文章、电子邮件、社交媒体帖子,还是想要创作诗歌、故事、歌词等,都可以为你提供灵感和支持。 限时优惠:点此访问并注册Jas...
-
英伟达Jim Fan最新TED演讲上线:AI下一个前沿是「基础智能体」!
「AI的下一个前沿将是『基础智能体』(Foundation Agent)——一个掌握广泛技能,控制许多身体,并能够泛化到多个环境中的单一算法」。 等了三个月,英伟达高级科学家Jim Fan在TED AI 2023上的演讲视频终于上线了。 视频中,Jim...
-
画个圈就能搜索,谷歌Gemini Pro植入旗舰,开启手机AI大战
近日,三星在加利福尼亚州圣何塞隆重发布了最新的Galaxy S24系列手机,AI要素拉满!网友一片热情,纷纷实测 AI要素满满三星新旗舰,竟被抱怨一半功能都不太好用! 近日,在加利福尼亚州圣何塞举行的Galaxy Unpacked活动中,三星推出了最新的G...
-
Stability AI杀回来了:视频生成新Demo效果惊人,网友:一致性超群
Stable Diffusion要王者归来了? Stability AI CEO Emad Mostaque最新推文,四段视频引人无数遐想。 不少网友怀疑,这是Stable Video Diffusion新版本的演示Demo。 因为从效果上看,不管是...
-
请查收使用OpenAI的Whisper进行语音识别的攻略
Whisper是一种令人激动的新型语言模型,采用了全新的语音识别方法,即使是低质量的音频,Whisper也能产生高质量的结果,并且对各种声音和语言的适应性极强,无需进行微调。 Whisper是开源的,有一系列可用的模型尺寸,可以作为众多语音转文字应用的有...
-
从GPT-4、文心一言再到Copilot,AIGC的长期价值被逐渐确立
@数科星球原创 作者丨苑晶 编辑丨十里香 动荡和富有戏剧性的一周行将结束,在本周,百度发布文心一言、OpenAI发布GPT-4、微软发布Microsoft 365 Copilot。围绕科技圈,人们的话题从赞叹GPT-4的强大、百度的股价再...