轻量级第4页 - AIGC资讯

20%的杨幂+80%的泰勒长什么样？小红书风格化AI来了，可兼容SD和ControlNet

不得不说，现在拍写真真是“简单到放肆”了。真人不用出镜，不用费心凹姿势、搞发型，只需一张本人图像，等待几秒钟，就能获得7种完全不同风格：仔细看，造型/pose全都给你整得明明白白，并且原图直出修也不用修了。这搁以前，不得在写真馆耗上至少整整一天，...

生成式AI 2024-01-18 人工智能

549阅读

得帆信息创始人-张桐，受邀出席 BV百度风投AIGC主题论坛

近日，得帆信息创始人兼CEO张桐，作为百度风投被投代表企业创始人受邀出席“向未来，共成长” BV百度风投AIGC主题论坛。与包括上海市徐汇区相关部门领导、百度集团相关事业部负责人及代表，以及来自国寿资本、中网投、麦顿投资的投资人、BV百度风投其...

人工智能 2024-01-18 人工智能

530阅读

200亿「书生·浦语2.0」正式开源！数推性能比肩ChatGPT，200K超长上下文完美召回

就在今天，上海人工智能实验室与商汤科技联合香港中文大学和复旦大学，正式发布新一代大语言模型书⽣·浦语2.0（InternLM2）。 Github：https://github.com/InternLM/InternLM HuggingFace：https...

AIGC 2024-01-17 人工智能

576阅读

【AIGC】IP-Adapter：文本兼容图像提示适配器，用于文本到图像扩散模型

前言 IPAdapter能够通过图像给Stable Diffusion模型以内容提示，让其生成参考该图像画风，可以免去Lora的训练，达到参考画风人物的生成效果。摘要通过文本提示词生成的图像，往往需要设置复杂的提示...

生成式AI 2024-01-17 人工智能

823阅读

AI视野：阿里推ReplaceAnything框架；OpenAI取消军用禁令；Pika推视频画面扩充功能；SD推图生视频插件I2V-Adapter

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ ?‍???聚焦开发者阿里推Rep...

大数据 2024-01-15 人工智能

531阅读

AIGC内容分享(十三)：2023年中国AIGC产业全景报告

目录核心摘要中国AIGC产业之“变”与"新技术变革的原始驱力：大模型层价值传递的实际落位：应用层不可忽视的资源引擎：算力层中国AIGC产业之发展趋势核心摘要古人有云：日就月将，学有缉熙于光明。人类对人工智能学的潜心钻研...

生成式AI 2024-01-15 人工智能

579阅读

即插即用，完美兼容：SD社区的图生视频插件I2V-Adapter来了

图像到视频生成（I2V）任务旨在将静态图像转化为动态视频，这是计算机视觉领域的一大挑战。其难点在于从单张图像中提取并生成时间维度的动态信息，同时确保图像内容的真实性和视觉上的连贯性。大多数现有的 I2V 方法依赖于复杂的模型架构和大量的训练数据来实现这一...

生成式AI 2024-01-15 人工智能

524阅读

python爬虫入门教程(非常详细),超级简单的Python爬虫教程

一、基础入门 1.1什么是爬虫爬虫(spider，又网络爬虫，是指向网站/网络发起请求，获取资源后分析并提取有用数据的程序。从技术层面来说就是通过程序模拟浏览器请求站点的行为，把站点返回的HTML代码/JSON数据/二进制数据（图片、视频）...

大数据 2024-01-14 大数据

670阅读

打破信息差！一款让人惊艳的大模型3D可视化工具！

近日，一位来自新西兰的小哥Brendan Bycroft在技术圈掀起了一股热潮。他创作的一项名为大模型3D可视化的项目，不仅登上了Hacker News的榜首，而且其震撼的效果更是让人瞠目结舌。通过这个项目，你将在短短几秒钟内完全理解LLM（Large...

人工智能 2024-01-14 人工智能

587阅读

LLaMA-v2-Chat vs. Alpaca：应该在什么时候使用不同的人工智能模型？

译者 | 李睿审校 | 重楼如今，大型语言模型（LLM）正在彻底改变人们的工作和生活，从语言生成到图像字幕软件，再到友好的聊天机器人。这些人工智能模型为解决现实世界的问题提供了强大的工具，例如生成聊天响应或遵循复杂的指令。在这篇关于LLaMA v2的...

大数据 2024-01-14 人工智能

567阅读

AIGC：【LLM（七）】——Baichuan2：真开源可商用的中文大模型

文章目录一.模型介绍二.模型部署 2.1 CPU部署 2.2 GPU部署三.模型推理 3.1 Chat 模型推理 3.2 Base 模型推理四.模型量化 4.1 量化方法 4.2 在线量化 4.3 离线量化 4.4 量化效果...

生成式AI 2024-01-09 人工智能

668阅读

13个优秀开源语音识别引擎

语音识别（ASR）在人机交互方面发挥着重要的作用，可用于：转录、翻译、听写、语音合成、关键字定位、语音日记、语言增强等场景。语音识别基本过程一般包括：分析音频、音频分解、格式转换、文本匹配，但实际的语音识别系统可能会更复杂，并且可能包括其他步骤和功能组件...

人工智能 2024-01-08 人工智能

855阅读

兵马俑跳《科目三》，是我万万没想到的

家人们，火爆全球的魔性舞蹈《科目三》，谁能料到，就连兵马俑也开始跳上了！图片热度还居高不下，瞬间被轰上了热搜，小伙伴们纷纷惊掉了下巴表示“闻所未闻，见所未见”。图片这到底是怎么一回事？原来，是有人借助了阿里之前走红的AI技术——AnimateA...

AIGC 2024-01-07 人工智能

562阅读

AI平台：印象笔记 | 工作必备效率应用

印象笔记 | 工作必备效率应用 Skip...

人工智能 2024-01-06 人工智能

862阅读

迷你AI模型TinyLlama发布：高性能、仅637MB

经过一番期待，TinyLlama项目发布了一款引人注目的开源模型。该项目于去年9月启动，开发人员致力于在数万亿标记上训练一款小型模型。在经历了一些辛勤工作和一些挫折之后，TinyLlama团队如今发布了这个模型。这个模型有着10亿个参数，大约在训练数据上进...

生成式AI 2024-01-06 人工智能

562阅读

aAMUSEd官网体验入口 AI自然语言处理工具软件免费下载地址

aAMUSEd是一个开源平台，提供各种自然语言处理（NLP）模型、数据集和工具。它包含一个基于MUSE的轻量级遮蔽图像模型（MIM），专用于文本到图像的生成。与潜在扩散（latent diffusion）方法相比，MIM需要更少的推理步骤，且更易于解释。此...

AIGC 2024-01-05 人工智能

480阅读

客观看待AI大模型在数字化转型中的地位和作用

“ AI大模型在数字化转型中的作用尚未突破《“以数据为中心的业务变革”之三种范式》中第三种范式的边界”。自从OpenAI公司研发的机器人聊天程序ChatGPT在2022年11月30日发布以来，在全世界迅速带起了热潮。ChatGPT是AI大模型驱动的自...

人工智能 2024-01-03 人工智能

511阅读

【Java干货教程】JSON，JSONObject，JSONArray类详解

一、定义 JSON：就是一种轻量级的数据交换格式，被广泛应用于WEB应用程序开发。JSON的简洁和清晰的层次结构，易于阅读和编写；同时也易于机器解析和生成，有效的提升网络传输效率；支持多种语言，很多流行的语言都对JSON格式有着很友好的支持。 JS...

大数据 2023-12-30 人工智能

674阅读

大模型被偷家！CNN搞多模态不弱于Transfromer（腾讯&港中文）

本文经自动驾驶之心公众号授权转载，转载请联系出处。腾讯AI实验室与港中文联合团队提出了一种新的CNN架构，图像识别精度和速度都超过了Transformer架构模型。切换到点云、音频、视频等其他模态，也无需改变模型结构，简单预处理即可接近甚至超越SO...

生成式AI 2023-12-28 人工智能

511阅读

快手Agents系统、模型、数据全部开源！

7B 大小的模型也能玩转 AI Agents 了？近期，快手开源了「KwaiAgents」，问它周末滑雪问题，它不但帮你找到场地，连当天的天气都帮你考虑周到了。大家都知道大语言模型（LLM）通过对语言的建模而掌握了大量知识，并具备一定认知和推理能力。...

生成式AI 2023-12-27 人工智能

509阅读

数栈UI5.0设计实战｜B端表单这样设计，不仅美观还提效

表单是B端产品中最常见的组件之一，主要⽤于数据收集、校验和提交。比如登陆流程的账号密码填写，注册流程的邮箱、用户名等信息填写，都是表单应用的常见案例，在数栈产品中也是出现频率⾮常⾼的组件。尽管表单应用十分普遍，但在我们对旧版数栈产品进行调研时，发现许多...

AIGC 2023-12-27 人工智能

554阅读

基于whisper模型的在线添加视频字幕网站（持续更新）

1.什么是whisper Whisper 是一个自动语音识别（ASR，Automatic Speech Recognition）系统，OpenAI 通过从网络上收集了 68 万小时的多语言（98 种语言）和多任务（multitask）监督数据对 Whi...

大数据 2023-12-26 人工智能

878阅读

Tracking Any Object Amodally ：让AI像人一样可以追踪任何对象

Tracking Any Object Amodally是由卡内基梅隆大学和丰田研究所开发的项目使得人工智能能够像人一样追踪物体的整体，即使在部分遮挡或不完全可见的情况下也能理解其完整结构。在这个项目中，计算机被训练成能够“理解”并追踪到部分遮挡物体的完...

人工智能 2023-12-25 人工智能

524阅读

别再乱用了，Java 21 将弃用、删除这些功能！

尽管Java 是我使用过的向后兼容程度最高的语言和环境之一，但始终存在功能弃用甚至删除的可能性。Java 21 将弃用两个功能，这就是我们今天要讨论的内容。 1 为什么要弃用功能？弃用代码或功能意味着不鼓励使用它，并且可能在未来的版本中不再存在。为什么...

人工智能 2023-12-25 人工智能

801阅读

大模型被偷家！腾讯港中文新研究修正认知：CNN搞多模态不弱于Transfromer

在Transformer占据多模态工具半壁江山的时代，大核CNN又“杀了回来”，成为了一匹新的黑马。腾讯AI实验室与港中文联合团队提出了一种新的CNN架构，图像识别精度和速度都超过了Transformer架构模型。切换到点云、音频、视频等其他模态，也无...

生成式AI 2023-12-25 人工智能

555阅读

紧跟潮流，抓住趋势，跟上全民AI的节奏，开源IM项目OpenIM产品介绍，为AIGC贡献力量

开源价值高度自主、安全可控、开放自由，私有化部署，一切皆可控透明度和可信度：开源软件的源代码是公开的，任何人都可以查看和检查代码，从而增强了软件的透明度和可信度。用户可以了解软件的内部结构和运作方式，发现和修复潜在的安全漏洞和错误。自由度和可定...

生成式AI 2023-12-25 人工智能

647阅读

在 “小小容器” WasmEdge 里运行小小羊驼 llama 2

昨天，特斯拉前 AI 总监、OpenAI 联合创始人 Andrej Karpathy 开源了 llama2.c 。只用 500 行纯 C 语言就能训练和推理 llama 2 模型的框架，没有任何繁杂的 python 依赖。这个项目一推出就受到大家的追捧...

生成式AI 2023-12-23 人工智能

605阅读

正面刚ChatGPT，谷歌发布Bard! AI们要battle起来了？

面对ChatGPT的步步紧逼，谷歌终于做出了回应，选择了正面刚。北京时间2月7日凌晨，谷歌CEO桑达尔·皮查伊（Sundar Pichai）宣布谷歌推出了下一代对话AI系统Bard。消息一出，自然引起广泛讨论，ChatGPT的火爆程度有目共睹，...

大数据 2023-12-19 人工智能

542阅读

word2vec作者爆料：seq2seq是我的想法、GloVe抄袭技巧，反击来了

随着 NeurIPS 2023 获奖论文的公布，十年前的词嵌入技术 word2vec 可谓是实至名归的获得了时间检验奖。这篇论文「Distributed Representations of Words and Phrases and their Com...

大数据 2023-12-19 人工智能

511阅读

Copilot 是否可以和 IDE 集成使用？

GitHub Copilot 是一种基于人工智能技术的代码生成工具，它能帮助程序员快速生成高质量的代码。虽然 Copilot 可以在其官方网站上使用，但为了更好的编写代码，开发者还需要使用集成开发环境（IDE），如 Visual Studio Code,...

生成式AI 2023-12-16 人工智能

788阅读

好用到爆！10个你可能不知道的VSCode开源工具神器

作为一款广受欢迎的开源IDE，VSCode凭借其轻量级和高度可扩展的特性，成为了越来越多开发者的首选工具。但是，VSCode的强大功能并不仅限于其本身，是可以通过插件、主题和其他扩展来进一步扩展其功能。在本篇文章中，我将介绍10个原先你可能根本不知道的开源...

AIGC 2023-12-15 人工智能

626阅读

北京大学发布EAGLE 大模型推理效率无损提升3倍

近年来，大语言模型在各领域应用广泛，但其文本生成过程昂贵且缓慢。为解决这一问题，滑铁卢大学、加拿大向量研究院、北京大学等机构联合发布了EAGLE。EAGLE的目标是提升大语言模型的推理速度，同时确保输出文本的分布一致性。通过外推大语言模型的第二顶层特征向量...

人工智能 2023-12-14 人工智能

594阅读

大模型推理效率无损提升3倍，滑铁卢大学、北京大学等机构发布EAGLE

大语言模型（LLM）被越来越多应用于各种领域。然而，它们的文本生成过程既昂贵又缓慢。这种低效率归因于自回归解码的运算规则：每个词（token）的生成都需要进行一次前向传播，需要访问数十亿至数千亿参数的 LLM。这导致传统自回归解码的速度较慢。近日，滑铁...

AIGC 2023-12-14 人工智能

477阅读

LLaMA Adapter和LLaMA Adapter V2

LLaMA Adapter论文地址： https://arxiv.org/pdf/2303.16199.pdf LLaMA Adapter V2论文地址： https://arxiv.org/pdf/2304.15010.pdf LLaMA Ada...

人工智能 2023-12-10 人工智能

633阅读

首个开源MoE大模型发布！7Bx8个专家，离GPT-4最近的一集

“取消今晚所有计划！”，许多AI开发者决定不睡了。只因首个开源MoE大模型刚刚由Mistral AI发布。 MoE架构全称专家混合（Mixture-of-Experts），也就是传闻中GPT-4采用的方案，可以说这是开源大模型离GPT-4最近的一集...

人工智能 2023-12-09 人工智能

564阅读

基于GPT+Adaptor的时间序列多任务统一大模型

今天跟大家聊一聊大模型时间序列预测的最新工作，来自阿里巴巴达摩院，提出了一种基于adaptor的通用时间序列分析框架，在长周期预测、短周期预测、zero-shot、few-shot、异常检测、时间序列分类、时间序列填充等7项时间序列任务上都取得了显著的效...

人工智能 2023-12-08 人工智能

597阅读

使用 LoRA 进行 Stable Diffusion 的高效参数微调

LoRA: Low-Rank Adaptation of Large Language Models 是微软研究员引入的一项新技术，主要用于处理大模型微调的问题。目前超过数十亿以上参数的具有强能力的大模型 (例如 GPT-3 通常在为了适应其下游任...

生成式AI 2023-12-07 人工智能

752阅读

AI抠图使用指南：Stable Diffusion WebUI Rembg实用技巧

抠图是图像处理工具的一项必备能力，可以用在重绘、重组、更换背景等场景。最近我一直在探索 Stable Diffusion WebUI 的各项能力，那么 SD WebUI 的抠图能力表现如何呢？这篇文章就给大家分享一下。安装插件作为一个生成式AI，S...

人工智能 2023-12-05 人工智能

632阅读

NeuRAD: 用于自动驾驶的神经渲染（多数据集SOTA）

论文"NeuRAD: Neural Rendering for Autonomous Driving"，来自Zenseact，Chalmers科技大学，Linkoping大学和Lund大学。神经辐射场（NeRF）在自动驾驶（AD）社区中越来越受欢迎。最...

AIGC 2023-12-05 人工智能

569阅读

【多模态】15、MobileSAM | 首个专为移动端设计的更快的 SAM

文章目录一、背景二、方法 2.1 耦合蒸馏 2.2 从半蒸馏到解耦蒸馏三、效果论文：FASTER SEGMENT ANYTHING: TOWARDS LIGHTWEIGHT SAM FOR MOBILE APPLICA...

AIGC 2023-12-05 人工智能

753阅读

矩阵模拟！Transformer大模型3D可视化，GPT-3、Nano-GPT每一层清晰可见

「矩阵模拟」的世界或许真的存在。模拟人类神经元，不断进化的Transformer模型，一直以来都深不可测。许多科学家都试着打开这个黑盒，看看究竟是如何工作的。而现在，大模型的矩阵世界，真的被打开了！一位软件工程师Brendan Bycroft制作了...

AIGC 2023-12-04 人工智能

577阅读

开源大模型框架llama.cpp使用C++ api开发入门

llama.cpp是一个C++编写的轻量级开源类AIGC大模型框架，可以支持在消费级普通设备上本地部署运行大模型，以及作为依赖库集成的到应用程序中提供类GPT的功能。以下基于llama.cpp的源码利用C++ api来开发实例demo演示加载本地模型文...

生成式AI 2023-12-04 人工智能

749阅读

【深度学习】Stable Diffusion AI 绘画项目搭建详解，并运行案例

文章目录前言 1.安装环境 1.1 基础环境 1.2 权重文件 2.牛刀小试 2.1 用法在这里 3.封装api 总结前言先把人家的git放过来：https://github.com/CompVis/stable-dif...

AIGC 2023-12-03 人工智能

538阅读

Midjourney 参数合集

探索Midjourney之旅，学习绘画与AI，一同成长。加入「阿杰与AI」公众号，参与内容社群建设。 1.Midjourney 新手快速起步指南 2.Prompts-提示指令 3.Explore Prompting-提示指令的探索 4.Blend-叠加...

生成式AI 2023-11-30 人工智能

937阅读

数字化转型升级之工业元宇宙与AIGC

月説·小飞象·交流会生活就是，面对复杂，保持欢喜。心烦时，记住三句话：1、算了吧。2、没关系。3、会过去的。内部交流│24期数字化转型升级工业元宇宙与AIGC data analysis ●●...

人工智能 2023-11-29 人工智能

566阅读

ControlNet 和 T2I-Adapter，控制Stable Diffusion的不受控制的力量,AI 图像生成精确控制的破冰解决方案(教程含免安装使用方式)

控制Stable Diffusion的不受控制的力量人工智能艺术社区的兴奋在最近几天达到顶峰，让我想起了去年 Stable Diffusion 的首次发布。本次重点介绍基于Stable Diffusion 1.5的轻量级预训练模型ControlNet...

AIGC 2023-11-28 人工智能

570阅读

Llama-Factory的baichuan2微调

Llama-Factory：https://github.com/hiyouga/LLaMA-Factory/tree/main 请使用 --quantization_bit 4/8 来启用 QLoRA 训练。默认模块应作...

人工智能 2023-11-28 人工智能

812阅读

谷歌：LLM找不到推理错误，但能纠正它

今年，大型语言模型（LLM）成为 AI 领域关注的焦点。LLM 在各种自然语言处理（NLP）任务上取得了显著的进展，在推理方面的突破尤其令人惊艳。但在复杂的推理任务上，LLM 的表现仍然欠佳。那么，LLM 能否判断出自己的推理存在错误？最近，剑桥大学和...

人工智能 2023-11-27 人工智能

504阅读

网络规模、训练学习速度提升，清华团队在大规模光电智能计算方向取得进展

随着大模型等人工智能技术的突破与发展，算法复杂度剧增，对传统计算芯片带来了算力和功耗的双重挑战。近年来，以光计算为基础、通过光电融合的方式构建光电神经网络的计算处理方法已经成为国际热点研究问题，有望实现计算性能的颠覆性提升。然而，光电神经网络的前向数学...

大数据 2023-11-27 人工智能

491阅读

Distil-Whisper：比Whisper快6倍，体积小50%的语音识别模型

内容来源：@xiaohuggg Distil-Whisper：比Whisper快6倍，体积小50%的语音识别模型该模型是由Hugging Face团队开发，它在Whisper核心功能的基础上进行了优化和简化，体积缩小了50%。速度提高了6倍。并...

AIGC 2023-11-24 人工智能

742阅读