github 第24页 - AIGC资讯

基于LLM的Unity游戏开发利器——LLMUnity

在本文中，我们将向您展示如何在Unity引擎中使用LLM（大型语言模型）。我们将使用LLMUnity包（https://github.com/undreamai/LLMUnity）展示如何仅用几行代码即可搭建一个交互对话的实例！免责声明：我本人是LLM...

人工智能 2024-03-22 人工智能

1019阅读

本地用AIGC生成图像与视频

最近AI界最火的话题，当属Sora了。遗憾的是，Sora目前还没开源或提供模型下载，所以没法在本地跑起来。但是，业界有一些开源的图像与视频生成模型。虽然效果上还没那么惊艳，但还是值得我们体验与学习下的。 Stable Diffusion（SD）是比较流行...

AIGC 2024-03-22 人工智能

1312阅读

AtomoVideo：AIGC赋能下的电商视频动效生成

✍? 本文作者：凌潼、依竹、桅桔、逾溪 1. 概述当今电商领域，内容营销的形式正日趋多样化，视频内容以其生动鲜明的视觉体验和迅捷高效的信息传播能力，为商家创造了新的机遇。消费者对视频内容的偏好驱动了视频创意供给的持续增长，视觉内容...

大数据 2024-03-22 人工智能

1222阅读

CMU朱俊彦、Adobe新作：512x512图像推理，A100只用0.11秒

简笔素描一键变身多风格画作，还能添加额外的描述，这在 CMU、Adobe 联合推出的一项研究中实现了。作者之一为 CMU 助理教授朱俊彦，其团队在 ICCV 2021 会议上发表过一项类似的研究：仅仅使用一个或数个手绘草图，即可以自定义一个现成的 GA...

生成式AI 2024-03-21 人工智能

855阅读

Monorepo 解决方案 — 基于 Bazel 的 Xcode 性能优化实践

背景介绍书接上回《Monorepo 解决方案 — Bazel 在头条 iOS 的实践》，在头条工程切换至 Bazel 构建系统后，为了支持用户使用 Xcode 开发的习惯，我们使用了开源项目 Tulsi 作为生成工具，用于将 Bazel 工程转换为...

AIGC 2024-03-21 人工智能

1249阅读

一个开源免费的实时AI绘画软件Krita

Krita是由Krita插件+ComfyUI+LCM插件结合的一个实时可预览的AI绘画工具，是一款自由开源、免费的专业级绘画软件，Krita采用的是GNU GPL许可证确保它将一直保持自由开源的本色。一：搭建Krita创作平台 1、Krita客户...

人工智能 2024-03-21 人工智能

2731阅读

GitHub 最新 AI 工具可帮助用户自动修复代码中的错误和漏洞

3 月 21 日消息，GitHub 今天为所有 Advanced Security（GHAS）许可用户推出了全新的“代码扫描”功能（预览版），用于搜索 GitHub 代码中潜在的安全漏洞和编码错误。这项新功能可利用 Copilot 与 Code...

生成式AI 2024-03-21 人工智能

995阅读

如何开启Windows Copilot

如何开启Windows Copilot 前情提要：MVP成员FireCube被除名透露的教程指向这篇文章 (https://firecube.news/posts/7074855605369835520 ，此外Blog里面还有更多使用ViVeTool...

大数据 2024-03-21 人工智能

1123阅读

Stable Diffusion｜Ai赋能电商 Inpaint Anything

在电商领域中，产品展示对消费者购买决策的影响至关重要。以电商服装行业为例，商家在推出新品时，需要经历摄影拍摄、模特选择、场景布置、道具搭配、后期修图等一系列繁琐环节，以制作出吸引人的产品图片。然而，这些步骤不仅耗费大量时间和人力，而且要求商家拥有专业的技能...

大数据 2024-03-21 人工智能

1251阅读

【本地化部署Stable Diffusion WebUI（MACOS安装）】

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、Stable Diffusion WebUI适配三类芯片二、安装 1.安装git、conda等 2.选定目录及下载Github远程仓库文件 3....

大数据 2024-03-20 人工智能

874阅读

C# RAM Stable Diffusion 提示词反推 Onnx Demo

目录介绍效果模型信息项目代码下载 C# RAM Stable Diffusion 提示词反推 Onnx Demo 介绍 github地址：GitHub - xinyu1205/recognize-anything: Open...

人工智能 2024-03-20 人工智能

894阅读

谷歌发布“Vlogger”模型：单张图片生成10秒视频

谷歌发布了一个新的视频框架：只需要一张你的头像、一段讲话录音，就能得到一个本人栩栩如生的演讲视频。视频时长可变，目前看到的示例最高为10s。可以看到，无论是口型还是面部表情，它都非常自然。如果输入图像囊括整个上半身，它也能配合丰富的手势：网友...

人工智能 2024-03-20 人工智能

846阅读

20年编程，AI编程6个月，关于Copliot辅助编码工具，你想知道的都在这里

最初我认为不会有太多地方用得上它们。因为大厂都有一套自己的技术体系和技术架构。外部的工具不可能学会，也不会让他们去训练自家的技术。所以我的定位是解决重复性编码的工作。经过六个月的使用后，发现我使用AI的方式随着时间的推移在不断变化和改进。首先在选择工具...

大数据 2024-03-20 人工智能

1064阅读

Ai绘画工具，Stable Diffusion Lora使用攻略

一、Lora是什么 LoRA，英文全称Low-Rank Adaptation of Large Language Models，直译为大语言模型的低阶适应，这是微软的研究人员为了解决大语言模型微调而开发的一项技术。可以理解为Stable-Diffus...

生成式AI 2024-03-20 人工智能

2628阅读

在VSCode中使用GitHub Copilot Chat

GitHub Copilot Chat 是一个扩展，可以在你的代码编辑器或IDE(目前是VS Code或Visual Studio 中工作，允许你从编辑器中与 GitHub Copilot 进行对话。开始要开始使用 GitHub Copilot C...

大数据 2024-03-20 人工智能

1034阅读

在Win11上部署Stable Diffusion WebUI Forge

Stable Diffusion WebUI Forge 是 Stable Diffusion WebUI（基于 Gradio）之上的平台，可简化开发、优化资源管理并加快推理速度。“Forge”这个名字的灵感来自“Minecraft Forge”。这个项目...

生成式AI 2024-03-20 人工智能

1636阅读

AI新工具(20240312) Midjourney官方发布角色一致性功能；免费且开源的简历制作工具；精确克隆语调、控制声音风格

1: Midjourney角色一致性功能使人物画像在多方面高度一致成为可能。 Midjourney的角色一致性功能的使用方法如下： ⭐在你的输入指令后面加上 --cref URL，其中URL是你选择的角色图像的链接。 ⭐你可以通...

人工智能 2024-03-20 人工智能

1155阅读

如何扩展大模型的上下文长度

一、背景大模型的上下文长度是指我们在使用大模型的时候，给大模型的输入加上输出的字符（Token）总数，这个数字会被限制，如果超过这个长度的字符会被大模型丢弃。目前开源的大模型上下文长度一般不长，比如 Llama 2 只有 4K，Code-Llama 系...

生成式AI 2024-03-19 人工智能

1142阅读

连续学习不怕丢西瓜捡芝麻，神经形态方法保护旧知识

以脉冲神经网络（SNN）为代表的脑启发神经形态计算（neuromorphic computing）由于计算上的节能性质在最近几年受到了越来越多的关注 [1]。受启发于人脑中的生物神经元，神经形态计算通过模拟并行的存内计算、基于脉冲信号的事件驱动计算等生物...

大数据 2024-03-19 人工智能

860阅读

全球首个AI程序员当老板！IOI金牌得主全部工作AI掌盘，技术细节报告公开

AI程序员Devin竟可以做老板的工作了？！最近，Cognition AI的首席执行官Steven Hao给了Devin访问自己帐户的权限，然后Devin便开始为他工作了... 比如，「他」向初创公司Modal支持团队写了一封邮件，是询问关于其产品S...

人工智能 2024-03-19 人工智能

880阅读

DarkGPT：基于ChatGPT-4的AI工具用于检测泄露的数据库

近日，一位在GitHub上使用“luijait”别名的西班牙渗透测试人员发布了一个名为“DarkGPT”的AI OSINT工具，旨在帮助检测泄露的数据库。 DarkGPT是一款由ChatGPT-4-200K驱动的OSINT（开源情报）助手，在这个数字化时...

人工智能 2024-03-19 人工智能

973阅读

为自动驾驶而生，Lightning NeRF：速度提升10倍

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解最近的研究强调了NeRF在自动驾驶环境中的应用前景。然而室外环境的复杂性，加上驾驶场景中的视点受限，使精确重建场景几何体的任务变得复杂。这些挑战往往会导致重建质量下降...

人工智能 2024-03-19 人工智能

828阅读

马斯克兑现承诺，Grok模型携3140亿参数强势开源，商业用途全免费！

马斯克确实以其高效率和大胆的行动著称，最近他旗下的AI初创企业xAI宣布了一项引人注目的举措：开源了一个名为Grok-1[1]的混合专家模型。这个模型拥有3140亿个参数，是目前参数量最大的开源大型语言模型之一，而允许商用、可修改和分发，对各种自研...

生成式AI 2024-03-19 人工智能

933阅读

DECO: 纯卷积Query-Based检测器超越DETR！

本文经自动驾驶之心公众号授权转载，转载请联系出处。标题：DECO: Query-Based End-to-End Object Detection with ConvNets 论文：https://arxiv.org/pdf/2312.13735...

生成式AI 2024-03-19 人工智能

888阅读

AIGC: 2 语音转换新纪元-Whisper技术在全球客服领域的创新运用

背景现实世界，人跟人的沟通相当一部分是语音沟通，比如打电话，聊天中发送语音消息。而在程序的世界，大部分以处理字符串为主。所以，把语音转换成文字就成为了编程世界非常普遍的需求。 Whisper 是由 OpenAI 开发的一种高效的语音识别（AS...

生成式AI 2024-03-19 人工智能

953阅读

Mac电脑本地安装Stable Diffusion小白教程避开所有坑教程

CPU可为intel或M芯片。特别说明github拉取代码时需要魔法上网，所以尽量全程开启魔法上网。本教程所用系统为macOs venture 13.6.4。启动“终端” 按下“command+空格”按钮，输入终端，如...

生成式AI 2024-03-19 人工智能

1173阅读

huggingface的diffusers训练stable diffusion记录

代码：https://github.com/huggingface/diffusers/tree/main/examples/text_to_image 2006.11239.pdf (arxiv.org 论文 2006.11239.pdf (ar...

人工智能 2024-03-19 人工智能

1455阅读

机器学习：Github上排名前19个强化学习 (RL)项目

强化学习 (RL 是一种机器学习，使代理能够通过反复试验来学习。强化学习算法用于各种应用，包括游戏、机器人和金融。 RL 的目标是找到一种最大化预期长期回报的策略。强化学习算法通常分为两类：基于模型的算法和无模型的算法。基于模型的强化学习算法构建环境模...

人工智能 2024-03-19 人工智能

901阅读

拖拽P图技术又升级了：StableDrag更稳、更准，南大、腾讯联合打造

去年 5 月，动动鼠标就能让图片变「活」得研究 DragGAN 吸引了 AI 圈的关注。通过拖拽，我们可以改变并合成自己想要的图像，比如下图中让一头狮子转头并张嘴。实现这一效果的研究出自华人一作领衔的「Drag Your GAN」论文，于上个月放出并已...

AIGC 2024-03-18 人工智能

905阅读

探索编程新纪元：Code GeeX、Copilot与通义灵码的智能辅助之旅

在人工智能技术日新月异的今天，编程领域的革新也正以前所未有的速度推进。新一代的编程辅助工具，如Code GeeX、Copilot和通义灵码，正在重塑开发者的工作流程，提升编程效率，并推动编程教育的普及。本文将深入探讨这三款工具的特点、优势与局限，为开发者提...

人工智能 2024-03-18 人工智能

1246阅读

微软AI程序员登场，10倍AI工程师真来了？996自主生成代码，性能超GPT-4 30%

全球首个AI程序员Devin的横空出世，可能成为软件和AI发展史上一个重要的节点。它掌握了全栈的技能，不仅可以写代码debug，训模型，还可以去美国最大求职网站Upwork上抢单。一时间，网友们惊呼，「程序员不存在了」？甚至连刚开始攻读计算机学位...

生成式AI 2024-03-18 人工智能

858阅读

一键点、万物动！腾讯混元联合清华、港科大推出图生视频大模型“Follow Your Click”

编辑 | 言征出品 | 51CTO技术栈（微信号：blog51cto） 3月15日，腾讯混元和清华大学、香港科技大学联合推出全新图生视频模型“Follow-Your-Click“，基于输入模型的图片，只需点击对应区域，加上少量提示词，就可以让图片中原...

AIGC 2024-03-18 人工智能

808阅读

巧解「数据稀缺」问题！清华开源GPD：用扩散模型生成神经网络参数

传统的时空预测模型通常需要大量数据支持才能取得良好效果。然而，由于城市发展水平不均衡和数据收集政策的差异，许多城市和地区的时空数据（如交通和人群流动数据）受到了限制。在这种情况下，模型在数据稀缺情况下的可迁移性变得尤为重要。现有研究主要利用数据丰富的...

生成式AI 2024-03-18 人工智能

967阅读

AI大模型控制红绿灯，港科大（广州）智慧交通新成果已开源

大模型“上路”，干起了交通信号控制（TSC）的活～模型名为LightGPT，以排队及不同区段快要接近信号灯的车辆对路口交通状况分析，进而确定最好的信号灯配置。该模型由香港科技大学（广州）的研究团队提出，其背后关键是一个名为LLMLight的框架。...

生成式AI 2024-03-18 人工智能

831阅读

别等OpenAI了，全球首个类Sora抢先开源！所有训练细节/模型权重全公开，成本仅1万美元

不久前OpenAI Sora以其惊人的视频生成效果迅速走红，在一众文生视频模型中突出重围，成为全球瞩目的焦点。继2周前推出成本直降46%的Sora训练推理复现流程后，Colossal-AI团队全面开源全球首个类Sora架构视频生成模型「Open-Sor...

AIGC 2024-03-18 人工智能

893阅读

Stable Diffusion——常用插件安装与测试（一）

前言随着Stable Diffusion不断演进，越来越多的开发者开始涉足插件开发。尽管网络上存在大量教程，但它们通常零散分布，逐个学习和查找非常耗时，使人感觉每天都在劳累思考。这里总结了Stable Diffusion常用的插件安装与测试方法。感...

AIGC 2024-03-18 人工智能

1397阅读

马斯克突然开源Grok：3140亿参数巨无霸，免费可商用

马斯克说到做到：旗下大模型Grok现已开源！代码和模型权重已上线GitHub。官方信息显示，此次开源的Grok-1是一个3140亿参数的混合专家模型—— 就是说，这是当前开源模型中参数量最大的一个。消息一出，Grok-1的GitHub仓库已揽获4...

AIGC 2024-03-18 人工智能

834阅读

全球首个类Sora开源复现方案来了！全面公开所有训练细节和模型权重

全球首个开源的类Sora架构视频生成模型，来了！整个训练流程，包括数据处理、所有训练细节和模型权重，全部开放。这就是刚刚发布的Open-Sora 1.0。它带来的实际效果如下，能生成繁华都市夜景中的车水马龙。还能用航拍视角，展现悬崖海岸边，海水...

生成式AI 2024-03-18 人工智能

857阅读

Stable Diffusion WebUI 笔记本低显存无魔法本地安装使用（五）--- 插件安装

一、查找插件 1. 启动webui，在打开的页面上，点击 extensions，点击 Available 2. 点击“Load from”黄色按钮，会列出所有的可用插件，查找你的插件，如果是汉化的插件，请去掉localization的选择 3....

AIGC 2024-03-18 人工智能

892阅读

马斯克打脸OpenAI，全球最大巨无霸模型Grok-1开源！3140亿参数8个MoE，GitHub狂揽6k星

说到做到，马斯克xAI的Grok，果然如期开源了！就在刚刚，xAI正式发布3140亿参数混合专家模型Grok-1的权重和架构。 3140亿的参数，让Grok-1成为迄今参数量最大的开源LLM，是Llama 2的4倍。目前，xAI关于Grok-1...

大数据 2024-03-18 人工智能

804阅读

淘宝人生2的AIGC技术应用——虚拟人写真算法技术方案

近几个月，随着基于Stable Diffusion的相关技术发展，基于参考图的角色定制化技术[1,2, 3, 4, 7]受到相关行业以及学者的广泛关注。其中，人像定制化是指：给定任务角色（参考图），通过提示词控制生成多样新的图像，并且图像...

AIGC 2024-03-18 人工智能

959阅读

stable diffusion采样详解

采样：模型会在Latent Space中生成一个完全随机的图像，然后噪声预测器会从图像中减去预测的噪声。随着这个步骤的不断重复，最终得到一个清晰的图像。 Stable Diffusion在每个步骤中都会生成一张新的采样后的图像，整个去噪...

大数据 2024-03-18 人工智能

1200阅读

自适应剪枝让多模态大模型加速2-3倍，哈工大等推出SmartTrim

基于 Transformer 结构的视觉语言大模型（VLM）在各种下游的视觉语言任务上取得了巨大成功，但由于其较长的输入序列和较多的参数，导致其相应的计算开销地提升，阻碍了在实际环境中进一步部署。为了追求更为高效的推理速度，前人提出了一些针对 VLM 的...

大数据 2024-03-18 人工智能

891阅读

马斯克旗下xAI宣布开源Grok-1 包含3140亿参数

今日，马斯克旗下xAI宣布开源Grok-1。据悉，Grok-1基础模型基于大量文本数据训练，共有3140亿参数。该模型使用基于 JAX 和 Rust 的自定义训练堆栈进行训练。而xAI 是埃隆・马斯克成立的人工智能公司，于2023年7月12日宣布成立。...

生成式AI 2024-03-18 人工智能

861阅读

手把手教你搭建更节省显存的AI绘画工具ComfyUI

前言相信大家玩 Stable Diffusion（以下简称 SD）都是用的 web UI 操作界面吧，不知道有没有小伙伴听说过**ComfyUI(**最强大、模块化的稳定扩散 GUI 。 // ComfyUI示例 https://comfyanon...

人工智能 2024-03-18 人工智能

3672阅读

没等来OpenAI，等来了Open-Sora全面开源

不久前 OpenAI Sora 以其惊人的视频生成效果迅速走红，在一众文生视频模型中突出重围，成为全球瞩目的焦点。继 2 周前推出成本直降 46% 的 Sora 训练推理复现流程后，Colossal-AI 团队全面开源全球首个类 Sora 架构视频生成模...

AIGC 2024-03-18 人工智能

945阅读

ChatGPT的前辈GPT-2被塞入Excel表格：体积达1.25GB之巨！

快科技3月17日消息，Excel真是无所不能，酷爱它的软件开发者Ishan Anand居然将OpenAI GPT-2大模型硬生生放到了Excel之中，体积达到1.2GB，关键是还能正常运行！我们熟悉的ChatGPT，其实支持GPT系列大模型的一种呈现形式...

AIGC 2024-03-18 人工智能

897阅读

AI程序员Devin卧底工作群修bug！和CTO聊技术，网友：顶级码农水平

首个AI程序员Devin，现身明星创业公司内部群。为解决一个技术问题，Devin借用了其创造者的账号，与客户公司的CTO交流，并根据回复调整了代码方案。对话之专业，围观者看了直呼这个世界太疯狂。事情发生在办公软件Slack，截图中的akshat是...

大数据 2024-03-18 人工智能

875阅读

小妙招：Copilot 当跳板免费调用 GPT4

GPT4 每月 20 刀，Github Copilot 每月 10 刀首先叠个甲：免费不是 0 成本。由于我在日常开发过程中，Copilot 对我来说是必需品，我会用它检查代码、写工具函数、写注释、干苦力。所以这钱是我的必要支出。而这篇文章是介...

人工智能 2024-03-18 人工智能

1207阅读

利用学生认证部署 copilot-gpt4-service 白嫖 gpt-4.0

过年期间在公众号 HelloGitHub 上看到了一个项目 copilot-gpt4-service，可以将 GitHub Copilot 转成 ChatGPT 的服务。这么一个转换的好处是， GitHub 可以通过学生认证免费试用，转换成 ChatGP...

生成式AI 2024-03-18 人工智能

1225阅读