多语言第4页 - AIGC资讯

LLM的「母语」是什么？

大语言模型的「母语」是什么？我们的第一反应很可能是：英语。但事实果真如此吗？尤其是对于能够听说读写多种语言的LLM来说。对此，来自EPFL（洛桑联邦理工学院）的研究人员发表了下面这篇工作来一探究竟：图片论文地址：https://arxiv.or...

生成式AI 2024-06-03 人工智能

839阅读

【独家】万字长文带你梳理Llama开源家族：从Llama-1到Llama-3

Datawhale干货作者：张帆，陈安东，Datawhale成员引言在AI领域，大模型的发展正以前所未有的速度推进技术的边界。北京时间4月19日凌晨，Meta在官网上官宣了Llama-3，作为继Llama-1、Llama-...

AIGC 2024-06-02 人工智能

1038阅读

Datawhale |【独家】万字长文带你梳理Llama开源家族：从Llama-1到Llama-3

本文来源公众号“Datawhale”，仅用于学术分享，侵权删，干货满满。原文链接：【独家】万字长文带你梳理Llama开源家族：从Llama-1到Llama-3 0. 引言在AI领域，大模型的发展正以前所未有的速度推进技术的边界。北京时间4月1...

人工智能 2024-06-01 人工智能

1014阅读

【AIGC调研系列】llama 3与GPT4相比的优劣点

Llama 3与GPT-4相比，各有其优劣点。以下是基于我搜索到的资料的详细分析： Llama 3的优点：更大的数据集和参数规模：Llama 3基于超过15T token的训练，这相当于Llama 2数据集的7倍还多[1][3]。此外，它拥有40...

AIGC 2024-05-31 人工智能

1203阅读

Khoj：一个开源的个人化AI助手轻松连接本地与在线文档

Khoj 是一个功能丰富、开源的个人化AI助手，旨在帮助用户管理和检索各种信息源，同时提供多种智能功能以提升工作效率。以下是Khoj的主要特点、功能及应用场景: 主要特点多源信息获取:能够连接本地和在线文档，包括PDF、Markdown文件、Git...

AIGC 2024-05-29 人工智能

938阅读

实战whisper语音识别第一天，部署服务器，可远程访问，实时语音转文字（全部代码和详细部署步骤）

Whisper是OpenAI于2022年发布的一个开源深度学习模型，专门用于语音识别任务。它能够将音频转换成文字，支持多种语言的识别，包括但不限于英语、中文、西班牙语等。Whisper模型的特点是它在多种不同的音频条件下（如不同的背景噪声水平、说话者的口音...

人工智能 2024-05-28 人工智能

1224阅读

AI邮件回复工具如何提高工作效率？人工智能回邮件软件有哪些推荐？

什么是 AI邮件回复工具？ AI邮件回复工具是一种利用人工智能技术自动回复电子邮件的工具。它通过分析邮件内容，理解邮件意图，并生成合适的回复，从而帮助用户节省时间，提高工作效率。 AI邮件回复工具的核心功能 1：智能邮件分类，自动将邮件分类为重要、紧急...

人工智能 2024-05-28 人工智能

944阅读

文字生成手语视频大模型SignLLM 帮助听障人群实现无障碍沟通

站长之家（ChinaZ.com）5月28日消息近日，一款名为SignLLM的多语言手语模型引起了广泛关注。据称，这是第一个可以从输入文本生成手语手势的模型。 SignLLM利用了丰富的"Prompt2Sign"多语言手语数据集，确保生成的手语视频动作自...

AIGC 2024-05-28 人工智能

771阅读

AI可以生成手语手势视频了！SignLLM通过文字描述即可生成手语视频

SignLLM是一个创新的多语言手语模型，它具有通过文字描述生成手语视频的能力。这项技术对于听力障碍者来说是一个巨大的进步，因为它能够提供一种新的沟通方式。以下是SignLLM的一些关键特点: 文本到手语视频的转换:SignLLM模型能够将输入的文本或...

人工智能 2024-05-28 人工智能

930阅读

AI日报：确认！iOS18将用上ChatGPT；Suno又将推王炸级功能；谷歌AI搜索遭遇滑铁卢；Stable Assistant 可用SD3生成图片；

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、苹果已与 OpenAI 正式达...

生成式AI 2024-05-27 人工智能

969阅读

ai智能德法文对话软件哪个更好用？AI对话app使用体验优缺点对比

AI智能德法文对话：探索不同AI翻译工具的对话能力随着全球化的加深，德语和法语之间的沟通需求日益增长，AI智能德法文对话工具应运而生。不同的AI翻译平台提供了各自独特的对话翻译功能。以下是几个流行的AI翻译工具的比较： Google翻译主要特...

大数据 2024-05-27 人工智能

1034阅读

阿里开源截止目前为止参数规模最大的Qwen1.5-110B模型：MMLU评测接近Llama-3-70B，略超Mixtral-8×22B！

本文原文来自DataLearnerAI官方网站：阿里开源截止目前为止参数规模最大的Qwen1.5-110B模型：MMLU评测接近Llama-3-70B，略超Mixtral-8×22B！ | 数据学习者官方网站(Datalearner https://www...

AIGC 2024-05-26 人工智能

966阅读

深入解析“国际CMS爬虫”技术与应用

随着互联网技术的迅猛发展，内容管理系统（CMS）已成为众多网站搭建的基石，而与此同时，针对CMS的爬虫技术也应运而生，不断演进。本文将深入探讨“国际CMS爬虫”的技术原理、应用场景及其面临的挑战，旨在为读者提供全面的了解和参考。一、国际CMS爬虫概述国际C...

AIGC 2024-05-24 大数据

824阅读

如何用AI写论文？下面两个方法教你一秒上手

在大语言模型发布后，人工智能（AI）技术已经渗透到各个领域，特别是在学术界。而AI工具的涌现极大地提升了研究和写作的效率。这篇文章将向你介绍2款强大的AI工具，它们能够帮助研究人员和学生迅速产出高质量的学术论文，让论文写作变得既轻松又高效。随着毕业季的临...

人工智能 2024-05-24 人工智能

973阅读

微软Edge将使用AI实时翻译你观看的YouTube视频内容

微软在其 Build 大会上宣布，微软 Edge 浏览器将很快推出新的功能，允许用户在观看 YouTube 等视频时进行实时翻译。这项新的 AI 功能将支持多种语言，并适用于 YouTube、Reuters、CNBC News、Bloomberg、Mone...

生成式AI 2024-05-23 人工智能

931阅读

时隔一年Falcon回归！110亿参数5.5万亿token，性能超越Llama 3

这几天，全世界的目光仿佛都被OpenAI发布的GPT-4o所吸引，与此同时，OpenAI的挑战者们也在同步创造历史。就在5月14日，阿布扎比先进技术研究委员会（ATRC）下属的技术创新研究所（TII），发布了新一代的Falcon 2模型。 Falco...

人工智能 2024-05-20 人工智能

821阅读

OpenAI 首次推出 GPT-4o“全能”模型，干翻所有语音助手

OpenAI 在本周一(2024年5月13号推出了一款名为 GPT-4o 的新旗舰级生成式AI模型。这里的“o”代表“全能”，因为这款模型能够处理文本、语音和视频三种不同的输入。在未来几周内，GPT-4o 将逐步应用于公司针对开发者和消费者的各类产品。...

AIGC 2024-05-15 人工智能

865阅读

MIT最新！多模态LLM真的无所不能吗？大模型能解决一切难题吗？

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解本文对自动驾驶领域内多模态大型语言模型（MLLMs）的应用进行了审慎的审视，并对一些常见的假设提出了质疑/验证，重点关注它们通过闭环控制环境中的图像/帧序列推理和解释...

生成式AI 2024-05-15 人工智能

821阅读

微软让MoE长出多个头，大幅提升专家激活率

混合专家（MoE）是个好方法，支持着现在一些非常优秀的大模型，比如谷歌家的 Gemini 1.5 以及备受关注的 Mixtral 8x7B。稀疏混合专家（SMoE）可在不显著增加训练和推理成本的前提下提升模型的能力。比如 Mixtral 8×7B 就是...

人工智能 2024-05-14 人工智能

950阅读

人工客服要被取代？用GPT-4o模拟处理客服事务，100%流畅毫无AI味

OpenAI于2024年5月13日推出了GPT-4o模型，其中的“O”代表全能（Omni），在人机互动的自然度上取得了显著进步。GPT-4o支持多模态输入和输出，包括语音、视频、图像和代码，能够实时与用户进行无缝交流，理解情感，并展现出幽默个性。该模型的...

人工智能 2024-05-14 人工智能

804阅读

通义千问APP更名为通义APP，免费开放通义全栈能力

5月9日，通义大模型品牌升级，“通义千问APP”更名为“通义APP”，集成通义大模型全栈能力，免费为所有用户提供服务。通义APP以性能媲美GPT-4 Turbo的基模为底座，并把通义实验室前沿的文生图、智能编码、文档解析、音视频理解、视觉生成等能力“Al...

生成式AI 2024-05-09 人工智能

763阅读

斯坦福20亿参数端测多模态AI Agent模型大升级，手机汽车机器人都能用

全球首个超小型多模态AI Agent模型Octopus V3，来自斯坦福大学的NEXA AI团队，让Agent更加智能、快速、能耗及成本降低。今年四月份初，NEXA AI推出了备受瞩目的Octopus V2，该模型在函数调用性能上超越了GPT-4，减...

生成式AI 2024-05-07 人工智能

954阅读

手机可跑，3.8B参数量超越GPT-3.5！微软发布Phi-3技术报告：秘密武器是洗干净数据

过去几年，借助Scaling Laws的魔力，预训练的数据集不断增大，使得大模型的参数量也可以越做越大，从五年前的数十亿参数已经成长到今天的万亿级，在各个自然语言处理任务上的性能也越来越好。但Scaling Laws的魔法只能施加在「固定」的数据源上，...

AIGC 2024-05-07 人工智能

807阅读

开源大模型王座再易主，通义千问1100亿参数拿下SOTA，3个月已推出8款模型

开源大模型，已经开启大卷特卷模式。全球范围，太平洋两岸，双雄格局正在呼之欲出。 Llama 3中杯大杯刚惊艳亮相，国内通义千问就直接开源千亿级参数模型Qwen1.5-110B，一把火上Hacker News榜首。不仅相较于自家720亿参数模型性能明...

AIGC 2024-04-30 人工智能

840阅读

AI入侵播客圈！比真人配音还逼真？实测爆火的微软AI语音角色“晓晓”

AI语音再进化，人耳还能听出AI和真人的差别吗? 以上两段音频demo来自微软最近更新的AI语音角色“晓晓”。逼真、情绪到位、语气自然、断句近乎完美，是绝大多数网友听到“晓晓”声音时给出的评价。在播客App小宇宙上，“Hacker News”账号用“晓...

人工智能 2024-04-26 人工智能

1092阅读

微软推出iPhone能跑的ChatGPT级模型，网友：OpenAI得把GPT-3.5淘汰了

Llama 3发布刚几天，微软就出手截胡了？刚刚发布的Phi-3系列小模型技术报告，引起AI圈热议。其中仅3.8B参数的Phi-3-mini在多项基准测试中超过了Llama 3 8B。为了方便开源社区使用，还特意设计成了与Llama系列兼容的结...

AIGC 2024-04-23 人工智能

838阅读

微软发布iPhone可运行的ChatGPT级AI模型Phi-3系列挑战OpenAI地位

近日，微软推出了一款名为Phi-3系列的小型AI模型，该模型在AI领域引起了广泛关注。Phi-3系列中的Phi-3-mini模型，仅拥有3.8B参数，却在多项基准测试中超越了拥有8B参数的Llama3模型。微软特别强调，经过4bit量化处理的Phi-3-...

AIGC 2024-04-23 人工智能

831阅读

开源模型打败GPT-4！LLM竞技场最新战报，Cohere Command R+上线

GPT-4又又又被超越了！近日，LLM竞技场更新了战报，人们震惊地发现：居然有一个开源模型干掉了GPT-4！这就是Cohere在一周多前才发布的Command R+。排行榜地址：https://huggingface.co/spaces/lmsy...

人工智能 2024-04-22 人工智能

904阅读

GPT-4 Turbo重回王座，ChatGPT免费升级！数学暴涨10%/上下文全面碾压

今天起，最新版的GPT-4 Turbo，正式向ChatGPT Plus用户开放了！图片有了GPT-4 Turbo加持后，ChatGPT写作、数学、逻辑推理和编码的能力得到提升。小编小试，果然ChatGPT最新数据已经更新到了4月。图片根据基准测...

生成式AI 2024-04-12 人工智能

1037阅读

InternLM2官网体验入口中文AI聊天机器人模型使用地址

InternLM2是一个面向中文和英文的大型多语言预训练语言模型。它具有语言理解、自然语言生成、多模式推理、代码理解等强大的能力。模型采用Transformer架构并进行海量数据的预训练，在长文本理解、对话、数学运算等多个方向上都达到了业界领先水平。该系列...

AIGC 2024-04-12 人工智能

890阅读

AI音乐生成器Udio地址多少 Udio怎么用详细使用教程

Udio是一款引起广泛关注的AI音乐生成工具，用户可以通过简单的文字描述轻松创作带有歌词的音乐作品。这款工具支持多种音乐类型和风格，如EDM、钢琴爵士、新灵魂乐等，满足不同用户的需求。同时，用户还可以根据个人喜好...

AIGC 2024-04-11 人工智能

956阅读

AI音乐生成器Udio怎么用？Udio怎么生成音乐详细使用教程（附使用地址）

产品简介: AI音乐生成工具Udio正式发布，用户可以通过简单的文字描述创作带有歌词的音乐作品。这一新工具极大地降低了音乐创作的门槛。Udio支持广泛的音乐类型和风格，包括EDM、钢琴爵士、新灵魂乐、极端金属等，...

生成式AI 2024-04-11 人工智能

1276阅读

探索ChatGLM-LLaMA-chinese：新一代AI聊天机器人与多语言建模的创新实践

探索ChatGLM-LLaMA-chinese：新一代AI聊天机器人与多语言建模的创新实践项目地址:https://gitcode.com/27182812/ChatGLM-LLaMA-chinese-insturct 在人工智能领域，语言模型的...

人工智能 2024-04-11 人工智能

1082阅读

刚刚，Mistral AI最新磁力链放出！8x22B MoE模型，281GB解禁

【新智元导读】初创团队Mistral AI再次放出一条磁力链，281GB文件解禁了最新的8x22B MoE模型。一条磁力链，Mistral AI又来闷声不响搞事情。 281.24GB文件中，竟是全新8x22B MOE模型! 全新MoE模型共有56层，...

生成式AI 2024-04-10 人工智能

957阅读

120亿Stable LM 2上线即开源！2万亿token训练，碾压Llama 2 70B

继16亿轻量级Stable LM 2推出之后，12B参数的版本在今天亮相了。见状，不少网友纷纷喊话：干的漂亮！但，Stable Diffusion 3啥时候出啊？总得来说，Stable LM 2 12B参数更多，性能更强。 120亿参数版本包含了...

AIGC 2024-04-09 人工智能

810阅读

Midreal.ai官网体验入口 AI文本冒险游戏免费使用地址

Midreal.ai是什么？ Midreal.ai是一个基于先进人工智能技术的文本冒险游戏平台。它拥有强大的长篇叙事能力和近乎无限的记忆能力，可以根据玩家的选择来生成一个连贯、沉浸式的故事剧情。点击前往Midreal.ai官网体验入口 Midreal....

人工智能 2024-04-08 人工智能

1202阅读

通义千问开源Qwen1.5-32B 模型系列

通义千问团队最新发布了 Qwen1.5-32B 模型系列，其中包括 Qwen1.5-32B 和 Qwen1.5-32B-Chat。这些模型在模型架构上与之前的 Qwen1.5系列基本相同，但参数量减少至32B，旨在提供更高效、更经济实惠的解决方案。Qw...

人工智能 2024-04-07 人工智能

1015阅读

通义千问开源新Qwen1.5-32B模型推理速度更快，成本更低

通义千问近期开源了新的Qwen1.5-32B模型，该模型在语言理解、支持多语言、编程和数学能力方面表现出色。 Qwen1.5-32B模型不仅支持多语言，还融合了GQA（Generalized Question Answering）技术，使得模型在推理方面的...

生成式AI 2024-04-07 人工智能

863阅读

AI语音识别工具Universal-1：38秒可以处理60分钟音频比fast Whisper更快

AssemblyAI 最新研究成果展示了他们的 Universal-1模型在多语言环境中的表现，该模型在准确性和鲁棒性方面均取得了行业领先地位。先说结果，Universal-1比Whisper Large-v3更准确，比fast Whisper更快，38秒...

生成式AI 2024-04-07 人工智能

1077阅读

谷歌DeepMind发布Gecko：专攻检索，与大7倍模型相抗衡

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 文本嵌入模型在自然语言处理中扮演着重要角色，为各种文本相关任务提供了强大的语义表示和计算能力。在语义表示上，文本嵌入模型将文本转换为高...

生成式AI 2024-04-07 人工智能

771阅读

【AIGC调研系列】kimi与其他AI助手相比的优势和劣势是什么

Kimi与其他AI助手相比，具有以下优势和劣势：优势：服务稳定性：Kimi的服务在境内，使用稳定[2]。多客户端支持：支持网页、APP、小程序等多个客户端，提高了用户的使用便捷性[2][4]。中文处理能力：Kimi在中文处理方面表现出色...

大数据 2024-04-07 人工智能

5764阅读

Cohere推出大模型Command R+ 优化高级检索增强生成功能

Cohere推出了专为企业级工作负载设计的大型语言模型Command R+，该模型优化了高级检索增强生成（RAG）功能，以减少错误生成，并支持10种关键语言的多语言覆盖。公告地址：https://top.aibase.com/tool/command-...

AIGC 2024-04-07 人工智能

861阅读

ACE Studio官网体验入口 AI歌手音乐制作人声合成工具软件下载链接

ACE Studio是一个先进的AI人声合成引擎，旨在制作听起来像真人一样自然和充满感情的歌声。其功能包括AI唱歌合成引擎、支持多语言的AI歌手、商业用途的免费使用权、多维AI情感参数、简化声乐制作流程、创造独特音色和唱法。用户可以利用ACE Studio...

AIGC 2024-04-02 人工智能

2018阅读

AI人声合成引擎ACE Studio 可修改Suno生成的音乐甚至替换歌手的声音

ACE Studio是一款尖端的AI人声合成引擎，其设计理念是创造出既自然又富有感情的类真人歌声。这款引擎运用了最前沿的AI技术，将人工智能融入声音生成的每一个环节，力求让合成出来的声音尽可能地接近真实人声的表现力和情感深度。产品入口：https://...

AIGC 2024-04-02 人工智能

1201阅读

微软升级Azure AI语音服务推出9种更真实的AI语音

微软近期对其Azure AI语音服务进行了重大升级，推出了9种新的更真实的AI语音，旨在为用户带来更加自然和沉浸式的对话体验。这次升级的核心是引入了零样本学习（Zero-shot）的文本到语音(TTS 模型，这些模型在提高合成语音自然度的同时，更好地模仿了...

人工智能 2024-04-02 人工智能

947阅读

孟子3-13B大模型正式开源

澜舟科技近日宣布，其研发的孟子3-13B大模型正式开源，并向学术研究领域全面开放，同时支持免费商用。这一轻量化大模型在多项基准测试中展现了优异的性能，特别是在参数量20B以内的模型中，其中英文语言能力尤为突出，数学和编程能力也位于行业前列。孟子3-13B...

生成式AI 2024-04-01 人工智能

856阅读

0门槛免费商用！孟子3-13B大模型正式开源，万亿token数据训练

澜舟科技官宣：孟子3-13B大模型正式开源！这一主打高性价比的轻量化大模型，面向学术研究完全开放，并支持免费商用。在MMLU、GSM8K、HUMAN-EVAL等各项基准测评估中，孟子3-13B都表现出了不错的性能。尤其在参数量20B以内的轻量化大模...

生成式AI 2024-04-01 人工智能

748阅读

【AIGC调研系列】AIGC企业级模型Command-R介绍

Command-R与其他大语言模型的主要区别在于其专为企业级应用设计，特别是在检索增强生成（RAG）和工具使用方面。Command-R是一个350亿参数的高性能生成模型，具有开放式权重，能够支持多种用例，包括推理、摘要和问答[2]。它特别针对大规模生产工作...

大数据 2024-03-28 人工智能

1297阅读

到2028年，人工智能文本生成器市场将达到10亿美元

流程自动化需求: 在不断追求效率的时代，各行各业的企业越来越多地转向人工智能文本生成器来简化运营。这些系统提供的自动化功能不仅可以节省时间和资源，还可以降低人为错误的风险。特别是在内容生成不断的电子商务中，人工智能文本生成器是无价的资产，可以毫...

人工智能 2024-03-28 人工智能

789阅读

Suno v3怎么生成音乐？Suno AI注册登录制作音乐Prompt提示词使用方法详细教程

Suno，这家致力于推动人工智能前沿研究的公司，擅长开发创新的生成式 AI 模型，为全球的创意人士提供强大的创作工具。他们的旗舰产品 Chirp 模型，就是一款能够根据简单的文字描述，生成包括配乐、人声和各种音效...

大数据 2024-03-25 人工智能

1067阅读