准确率第7页 - AIGC资讯

不依赖token，字节级模型来了！直接处理二进制数据

最新GPT，不预测token了。微软亚研院等发布bGPT，仍旧基于Transformer，但是模型预测的是下一个字节（byte）。通过直接处理原生二进制数据，bGPT将所有输入内容都视为字节序列，从而可以不受限于任何特定的格式或任务。能预测CPU...

大数据 2024-03-11 人工智能

735阅读

不依赖Token，字节级模型来了！直接处理二进制数据

最新GPT，不预测token了。微软亚研院等发布bGPT，仍旧基于Transformer，但是模型预测的是下一个字节（byte）。通过直接处理原生二进制数据，bGPT将所有输入内容都视为字节序列，从而可以不受限于任何特定的格式或任务。能预测CPU...

大数据 2024-03-11 人工智能

738阅读

当prompt策略遇上分治算法，南加大、微软让大模型炼成「火眼金睛」

近年来，大语言模型（LLMs）由于其通用的问题处理能力而引起了大量的关注。现有研究表明，适当的提示设计（prompt enginerring），例如思维链（Chain-of-Thoughts），可以解锁 LLM 在不同领域的强大能力。然而，在处理涉及重...

AIGC 2024-03-11 人工智能

902阅读

告别繁琐的手动调参，Optuna助您轻松实现超参数优化！

在机器学习和深度学习领域，超参数优化是一个至关重要的任务。通过调整模型的超参数，我们可以提高模型的性能和泛化能力。然而，手动调整超参数是一项繁琐且耗时的任务，因此自动化超参数优化成为了一种常见的解决方案。在Python中，Optuna是一个流行的超参...

生成式AI 2024-03-11 人工智能

961阅读

大模型在复杂推理任务上潜力如何？多智能体互动框架ThinkThrice玩转剧本杀

剧本杀是一种广受欢迎的多角色扮演侦探游戏，要求玩家扮演不同的角色。通过阅读角色文本、理解各自的故事、搜集线索、以及逻辑推理，玩家们共同努力揭开谜团。游戏角色通常被分为平民和凶手两大类：平民的目标是找出隐藏在他们中间的凶手，而凶手则尽力隐藏自己的身份，避免...

人工智能 2024-03-11 人工智能

900阅读

基于Discuz的一点资讯采集策略与应用解析

在互联网高速发展的时代，信息的传播与采集成为了各个领域都极为关注的热点。特别是对于内容丰富的社区论坛平台，如Discuz，其内部蕴藏着海量的用户生成内容，这些信息既有价值也充满变数。与此同时，一点资讯作为国内领先的新闻资讯平台，一直致力于提供个性化的推荐内...

生成式AI 2024-03-11 大数据

771阅读

基于织梦内容管理系统的采集插件应用与分析

引言：随着互联网信息的爆炸式增长，如何高效、准确地获取并整合网站所需内容成为了众多内容管理系统（CMS）用户关注的焦点。织梦内容管理系统（DedeCMS）作为一款在国内广泛应用的开源CMS系统，其强大的内容管理和定制功能得到了用户的一致好评。本文将对织梦内...

人工智能 2024-03-09 大数据

862阅读

Python爬虫：网络数据的采集与解析

在数字化时代，数据已经成为了一种极其重要的资源。无论是商业分析、学术研究，还是个人兴趣，获取特定数据往往对项目的成功至关重要。网络爬虫，作为一种自动化获取网页数据的技术，近年来受到了广泛关注。Python，以其简洁的语法和丰富的库支持，成为了编写爬虫的首选...

人工智能 2024-03-08 大数据

871阅读

全面超越ViT，美团、浙大等提出视觉任务统一架构VisionLLAMA

半年多来，Meta 开源的 LLaMA 架构在 LLM 中经受了考验并大获成功（训练稳定、容易做 scaling）。沿袭 ViT 的研究思路，我们能否借助创新性的 LLaMA 架构，真正实现语言和图像的架构统一？在这一命题上，最近的一项研究 Visi...

生成式AI 2024-03-07 人工智能

824阅读

基于Discuz的火车头采集问题及解决方案探讨

在当今互联网时代，数据的采集与处理已经变得愈发重要，无论是大型门户网站还是个人博客，都需要对海量的网络信息进行有效筛选与整合。在这个过程中，各类内容管理系统（CMS）扮演着重要的角色。作为中国最为知名的开源社区论坛软件系统之一，Discuz以其强大的功能与...

AIGC 2024-03-07 大数据

896阅读

画像标签体系构建与应用实践

一、画像标签体系去哪儿在每个业务发展过程中构建了独立的画像标签体系。随着公司的不断壮大，需将各个业务的画像标签体系进行整合。从技术角度看，整合的过程相对简单，但业务层面的整合则较为复杂。因为各个标签在不同业务中的定义存在差异，这增加了整合的难度。为了确...

AIGC 2024-03-07 人工智能

1002阅读

使用纹理对比度检测检测AI生成的图像

在本篇文章中我们将介绍如何开发一个深度学习模型来检测人工智能生成的图像。大多数用于检测人工智能生成图像的深度学习方法取决于生成图像的方法，或者取决于图像的性质/语义，其中模型只能检测人工智能生成的人、脸、汽车等特定对象。但是这篇论文“Rich an...

大数据 2024-03-06 人工智能

945阅读

对话中关村科金张杰：让大模型落地有“技”可循

嘉宾 | 张杰采访 | 张晓楠编辑 | 徐杰承出品 | 51CTO技术栈（微信号：blog51cto） “2018年，随着Transformer预训练模型的兴起，自然语言处理（NLP）学术圈中形成了一个主流观点——NLP领域的不同技术方向，如文本...

大数据 2024-03-06 人工智能

871阅读

小红书博主吐槽自家猫被AI换脸百万网友围观

近日，小红书博主“grapelu”称自己养的猫被AI换脸，引发了百万网友的关注。从对比图可以看出，AI生成的图像与真实图像存在许多相似之处，但也有一些不合理的局部细节，透露出浓浓的AI感。在目前的法律体系中，肖像权通常是指保护个人形象不被未经授权地使用。...

大数据 2024-03-06 人工智能

968阅读

GPT-4时代已过？全球网友实测Claude 3，只有震撼

大模型的纯文本方向，已经卷到头了？昨晚，OpenAI 最大的竞争对手 Anthropic 发布了新一代 AI 大模型系列 ——Claude 3。该系列包含三个模型，按能力由弱到强排列分别是 Claude 3 Haiku、Claude 3 Sonnet...

AIGC 2024-03-05 人工智能

933阅读

全球最强大模型一夜易主，GPT-4时代终结！Claude 3提前狙击GPT-5，3秒读懂万字论文理解力接近人类

卷疯了卷疯了，大模型又变天了。就在刚刚，全球最强AI模型一夜易主，GPT-4被拉下神坛。 Anthropic发布了最新的Claude 3系列模型，一句话评价：真·全面碾压GPT-4！多模态和语言能力指标上，Claude 3都赢麻了。用Anthrop...

大数据 2024-03-05 人工智能

831阅读

全球最强大模型易主 GPT-4被超越：Claude 3系列模型发布

Anthropic 发布的 Claude3系列模型超越了 GPT-4，在多模态和语言能力上表现出色。Claude3系列模型包括 Opus、Sonnet 和 Haiku，能力依次从低到高，可以根据需求选择合适的模型。 Opus 是最先进的模型，在多项评估标准...

生成式AI 2024-03-05 人工智能

792阅读

全面超越GPT-4，Claude 3终于来了，有大学生智商，支持百万token

大模型的纯文本方向，已经卷到头了? 刚刚，OpenAI 最大的竞争对手 Anthropic 发布了新一代 AI 大模型系列 ——Claude3。该系列包含三个模型，按能力由弱到强排列分别是 Claude3Haiku、Claude3Sonnet 和 Cla...

大数据 2024-03-05 人工智能

1132阅读

RNN效率媲美Transformer，谷歌新架构两连发：同等规模强于Mamba

这一次，谷歌 DeepMind 在基础模型方面又有了新动作。我们知道，循环神经网络（RNN）在深度学习和自然语言处理研究的早期发挥了核心作用，并在许多应用中取得了实功，包括谷歌第一个端到端机器翻译系统。不过近年来，深度学习和 NLP 都以 Transf...

生成式AI 2024-03-05 人工智能

941阅读

【MacOS】openai 语音识别模型 whisper 本地部署教程（cpu+mps方案）

目录 1. whisper 安装 openai-whisper 参考视频链接与安装过程安装homebrew 安装Python （不要超过3.10）安装Pytorch 安装ffmpeg 安装rust 安装whisper 注意事项可...

人工智能 2024-03-04 人工智能

3038阅读

华为云盘古大模型通过金融大模型标准符合性验证

据华为官方消息，2023年12月，在中国信通院组织的可信AI大模型标准符合性验证中，华为云盘古大模型成功完成了金融大模型的验证，并获得了优秀级（4+级）评分。这一成绩不仅突显了华为云盘古大模型在金融领域的卓越性能，还使其成为首批通过金融大模型及行业大模型标...

AIGC 2024-03-04 人工智能

862阅读

7B模型超越GPT4-V！港科大等发布「图推理问答」数据集GITQA：视觉图可提升推理能力

图神经网络（GNNs）擅长利用图的结构信息进行推理，但它们通常需要特定于领域的调优才能达到峰值性能，这阻碍了它们在不同任务之间的泛化性。相比之下，基于大型语言模型（LLM）的图推理具有更强的跨任务和泛化能力，但它们在特定任务上的性能往往逊色于专用的图...

大数据 2024-03-04 人工智能

873阅读

论文降重怎么降的 ai写作

大家好，小发猫降重今天来聊聊论文降重怎么降的 ai写作，希望能给大家提供一点参考。以下是针对论文重复率高的情况，提供一些修改建议和技巧，可以借助此类工具：标题：论文降重，一篇文章带你了解全过程在学术界，论文降重是许多学者必须面对的一道难题。...

人工智能 2024-03-04 人工智能

983阅读

今日AI：英伟达大模型Nemotron-4登场；ai贴纸Face to sticker火了；KOALA AI 模型问世；Hugging Face发现100个恶意模型

欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ ???AI应用英伟达最强通用大...

生成式AI 2024-03-02 人工智能

883阅读

VPR 2024 满分论文！Meta提出EfficientSAM：快速分割一切！

本文经自动驾驶之心公众号授权转载，转载请联系出处。 EfficientSAM 这篇工作以5/5/5满分收录于CVPR 2024！作者在某社交媒体上分享了该结果，如下图所示： LeCun 图灵奖得主也强烈推荐了该工作！在最近的一项研究中，Meta...

生成式AI 2024-03-02 人工智能

894阅读

对抗「概念飘逸」难题！谷歌发布全新时间感知框架：图像识别准确率提升15%

在机器学习领域，概念漂移（concept drift）问题长期困扰着研究者，即数据分布随时间发生变化，使得模型难以持续有效。一个显著的例子是CLEAR非稳态学习基准的图像展示，它揭示了物体视觉特征在十年间发生的显著变化。这种现象被称为「缓慢的概念漂移...

大数据 2024-03-01 人工智能

892阅读

一文搞懂：AI、机器学习与深度学习的联系与区别

在当今科技日新月异的浪潮中，人工智能（Artificial Intelligence, AI）、机器学习（Machine Learning, ML）与深度学习（Deep Learning, DL）如同璀璨星辰，引领着信息技术的新浪潮。这三个词汇频繁出现在...

AIGC 2024-03-01 人工智能

1054阅读

ChatGPT编程时代来啦，GitHub Copilot Enterprise正式发布！

2月28日，全球最大开源平台之一GitHub在官网宣布——GitHub Copilot Enterprise正式全面发布。 GitHub Copilot Enterprise核心模块之一GitHub Copilot，是一款基于OpenAI的GPT-4模型，...

人工智能 2024-02-28 人工智能

842阅读

谷歌开源大模型Gemma带来了什么，原来“中国制造”的机会早已到来

谷歌罕见open的AI，给开源大模型到底带来了什么？ Gemma从发布到现在已经时过四日，谷歌久违的这次开源，可谓是给全球科技圈投下了一枚重磅炸弹。在最初发布之际，不论是从谷歌官方还是Jeff Dean的发文来看，都强调的是Gemma 7B已经全面超越...

生成式AI 2024-02-28 人工智能

802阅读

端侧最强，Meta田渊栋等人卷10亿以下参数小模型，LeCun：小技巧启动

「在移动设备上运行 LLM？可能需要 Meta 的一些技巧。」刚刚，图灵奖得主 Yann LeCun 在个人社交平台表示。他所宣传的这项研究来自 Meta 最新论文《 MobileLLM: Optimizing Sub-billion Paramet...

大数据 2024-02-27 人工智能

810阅读

重要的医学AI应用：使用多模态 CNN-DDI预测药物间相互作用事件

生病时，医生往往给我们开了多种药物，这些药物在同时服下时是否因为药物间相互作用产生对身体不良的效果，这引起我们的怀疑和担心。其实医生所开的药方的药品已经经过了药物间相互作用的实验和临床测试，我们不应对此产生疑虑。药物间相互作用（DDI）是指当一个患者同...

人工智能 2024-02-27 人工智能

891阅读

逻辑推理大翻车！GPT-4、Gemini被曝重大缺陷，LLM严重降智

近期，谷歌DeepMind和斯坦福的研究人员发现大型语言模型在处理逻辑推理任务时，前提信息的呈现顺序对其表现具有决定性影响。在逻辑推理和数学问题中，前提按照逻辑自然顺序排列时，模型表现更佳。对于大型语言模型，改变前提叙述顺序会导致性能大幅下降，尤其是在添...

AIGC 2024-02-26 人工智能

900阅读

GPT-4、Gemini同时被曝重大缺陷，逻辑推理大翻车！DeepMind上交校友团队发现LLM严重降智

最近，谷歌DeepMind和斯坦福的研究人员发现：大模型在处理逻辑推理任务时，问题中信息呈现的顺序对模型的表现有着决定性的影响。论文地址：https://arxiv.org/abs/2402.08939 具体来说，当信息按照逻辑上的自然顺序排列时，模...

AIGC 2024-02-26 人工智能

895阅读

一种推荐系统中的排序学习的原创算法：斯奇拉姆排序

作者 | 汪昊审校 | 重楼排序学习在推荐系统中的应用在最近数年来非常罕见。经典的算法比如 BPR 和 CLiMF 早在 10 多年前就已经被发明。因此当 2023 年国际会议 AIBT 2023 上有学者提出斯奇拉姆排序时，众多听众眼前一亮。该算...

AIGC 2024-02-26 人工智能

925阅读

AI搜索大变局

AI浪潮愈演愈烈的当下，信息量与应用需求迎来彻底爆发，外加参战厂商们急需寻找大模型落地场景，2024年无疑会成为AI应用场域争夺的“修罗场”。贯览整个战局，仍不断发生着变化，新生力量不断跻身竞技场，传统巨头们也在试图演绎新的打法。而其中，AI搜索似乎成为...

生成式AI 2024-02-22 人工智能

852阅读

【AIGC】Stable Diffusion之模型微调工具

推荐一款好用的模型微调工具，cybertron furnace 是一个lora训练整合包，提供训练 lora 模型的工具集或环境。集成环境包括必要的依赖项和配置文件、预训练脚本，支持人物、二次元、画风、自定义lora的训练，以简化用户训练 lora 模型...

AIGC 2024-02-22 人工智能

1287阅读

大模型幻觉的起因、评估及落地场景下基于知识图谱的缓解策略探索

针对大模型落地应用的问题，当前行业内普遍的做法是利用大模型进行问答，但在实际应用中，这种方法往往效果不佳，很多问题的答案并不具有实际参考价值。作为算法人员，我们需要深入了解问题的来源，对于大模型产生的幻觉问题，我们需要明确其定义，是主观的还是客观的，并探...

生成式AI 2024-02-20 人工智能

1119阅读

AI自动化标注崛起，数据标注员要失业了？

在数据标注行业流行着一句话：“有多少智能，就有多少人工”。由于需要标注的数据规模庞大且成本较高，一些互联网巨头及一些AI公司很少自己设有标注团队，大多交给第三方数据服务公司或者数据标注团队来做。这也衍生出了专为AI而生的人力密集型的数据标注产业链。...

人工智能 2024-02-19 人工智能

1075阅读

ChatGPT论文：大语言模型LLM之战:Dolly、LLaMA 、Vicuna、Guanaco、Bard、ChatGPT--在自然语言转SQL(NL2SQL、Text-to-SQL)的比较（二）

3 评价结果 3.1 Spider 数据集表 2 列出了各种提示策略和模型组合的执行准确性 (EX 和测试套件 (TS 的准确性。我们的主要发现是：开源模型在 Spider 数据集上遇到了困难：尽管参数数量和模型性能之间存在正相关关系...

大数据 2024-02-17 人工智能

1070阅读

科技部出手！科研人员的 AIGC 使用手册来了，学术界开始防范 AI 枪手

篡改实验数据、实验图片造假、论文不当署名、教材编写抄袭……1 月 16 日下午，华中农业大学的 11 名学生「一纸诉状」，以一份 125 页的举报材料实名举报该校黄姓教授存在学术不端行为。一时间，舆论迅速发酵，「赌上前程捍卫学术清白」、「人人都是学术造假受...

AIGC 2024-02-15 人工智能

841阅读

八项指标对比ChatGPT和文心一言

文章目录前言特定指标对比：实际运用对比：一、算力二、训练时间三、算法复杂度四、模型结构五、应用场景六、性能指标七、可解释性八、迁移能力 ✍创作者：全栈弄潮儿 ? 个人主页：全栈弄潮儿的个人主页 ?️ 个人...

人工智能 2024-02-15 人工智能

967阅读

硕士论文复查近五年 ai写作

大家好，今天来聊聊硕士论文复查近五年 ai写作，希望能给大家提供一点参考。以下是针对论文重复率高的情况，提供一些修改建议和技巧，可以借助此类工具：硕士论文复查近五年：必要性与技巧详解一、背景介绍随着学术研究的日益深入，硕士论文的质量控制...

人工智能 2024-02-14 人工智能

946阅读

半年连推7款产品，AI时代字节也能大力出奇迹吗？

在过去一年，字节跳动旗下多个团队接连推出了7款基于 AI 的产品，分布对话、工具、互动剧情等多个类别，字节跳动在 AI 应用赛道再次采多方向试错的策略，积极训练大模型、测试自家模型能力、寻找 AI 应用场景，一次投掷多个靶面。从体量来看，尽管旗下多个产...

AIGC 2024-02-14 人工智能

1342阅读

Whisper

文章目录使后感 Paper Review 个人觉得有趣的 Log Mel spectrogram & STFT Training cross-atte...

AIGC 2024-02-13 人工智能

933阅读

Meta开源Code Llama 70B,缩小与GPT-4之间的技术鸿沟

每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同...

大数据 2024-02-12 人工智能

867阅读

上海人工智能实验室发布LLaMA-Adapter | 如何1小时训练你的多模态大模型用于下游任务

本文首发于微信公众号 CVHub，未经授权不得以任何形式售卖或私自转载到其它平台，违者必究！ Title: LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-...

人工智能 2024-02-11 人工智能

1106阅读

利用python+whisper生成视频字幕文件

文章目录前言 1.本地环境 2.安装所需要的库 3.导入相关库 4.获取指定路径下的所有视频文件 5.导入模型进行音频识别 6.将识别结果转换为srt字幕文件 7.完成代码前言最近在看一些网课，由于没有字幕看着非常费劲，需要...

大数据 2024-02-10 人工智能

1125阅读

llama/llama2论文解读

llama 摘要 llama在约1.4T的token上，训练出参数量7B到65B的模型，其模型规模如下在仅使用开源数据集的情况下，llama-13B在多数benchmarks上与GPT-3效果相当；llama-65B也与最好的模型（Chin...

AIGC 2024-02-09 人工智能

1277阅读

了解AIGC在图像识别和生成中的应用

1.背景介绍在过去的几年里，人工智能(AI 已经成为了我们生活中的一部分，它在图像识别和生成方面的应用也非常广泛。在这篇文章中，我们将探讨一下AI生成式图像识别(AIGC 在图像识别和生成中的应用，以及其背后的核心概念和算法原理。 1. 背...

人工智能 2024-02-07 人工智能

1443阅读

【AIGC】prompt工程从入门到精通

注：本文示例默认“文心大模型3.5”演示，表示为>或w>（wenxin ，有时为了对比也用百川2.0展示b>（baichuan 有时候为了模拟错误输出，会用到m>（mock 表示（因为用的大模型都会给出正确答案）有时候直接贴网络...

AIGC 2024-02-07 人工智能

1038阅读