当前位置:AIGC资讯 > AIGC > 正文

AI视野:OpenAI否认即将发布GPT-4.5;Stability AI推出新会员模式;DomoAI支持视频一键转动漫;阿里I2VGen-XL模型代码公布

???AI新鲜事

OpenAI否认即将发布GPT-4.5

OpenAI CEO Sam Altman在Reddit上辟谣称公司未计划发布GPT-4.5,否认最新语言模型的泄露,截图显示为虚假信息。

OpenAI新研究:GPT-2能监督GPT-4

研究发现通过以GPT-2级模型为弱监督者对GPT-4进行微调,能显著提高自然语言处理任务中的泛化性能,为超级AI对齐问题提供新思路。

Stability AI推出新会员模式

Stability AI在充满活力的2023年推出新会员模式,以标准化商业使用,包括免费和PRO会员,同时保持对源代码和权重的开放。

英特尔发布AI加速器Gaudi3

英特尔发布Gaudi3系列AI加速器,采用先进5nm制程,性能优越,计划于明年推出,与英伟达的H200加速卡竞争。

悉尼科技大学成功开发无侵入系统,将脑电波转化为文字

悉尼科技大学的研究团队成功开发了一款便携、无侵入的系统,通过AI模型将脑电波信号转换为文字,为中风或瘫痪患者提供新的交流方式。

微软扩展Azure AI Studio,引入Llama2和GPT-4Turbo with Vision

微软将Meta竞争对手Llama2引入Azure AI Studio,提供AI模型即服务(MaaS),同时加入OpenAI的GPT-4Turbo with Vision,拓展Azure云平台AI选择。

Ollama支持多模态模型使用

Ollama最新版本为macOS和Linux用户提供了多模态模型支持,通过输入命令“ollama run llava”并下载llava-7B模型,用户可轻松在本地运行Llama2、Code Llama等模型,支持近二十多个语言模型系列。

官网地址:https://top.aibase.com/tool/ollama

????大模型动态

阿里图像生成视频模型I2VGen-XL代码发布

阿里于11月份发布的图像生成视频模型I2VGen-XL,如期开源了其代码和模型,该模型通过3500万个单镜头文本视频对和60亿个文本图像对的数据训练,提高了生成视频的语义准确性和细节连续性。

代码地址:https://github.com/damo-vilab/i2vgen-xl

元象开源 XVERSE-65B-Chat 大模型

元象宣布开源 XVERSE-65B-Chat 大模型,提供强大且无条件免费商用工具,广大开发者可登录官网或小程序体验。

Github:https://github.com/xverse-ai/XVERSE-65B

上海交通大学携手百度发布白玉兰科学大模型2.0版

上海交通大学与百度智能云合作发布了包括“法律开源”和“化学合成2.0”在内的“白玉兰科学大模型2.0版”,其中“法律开源”模型在法律领域表现出色,超越了同类中文通用大模型和中文法律大模型。

谷歌推生成式AI医疗模型MedLM

谷歌发布MedLM生成式AI医疗模型,基于Med-PaLM2,美国医学执照考试准确率达85%,计划整合Gemini模型服务全球医疗行业。

???AI应用

Spotify测试AI歌单功能

Spotify正在测试基于AI技术和用户提示创建歌单的功能,通过ChatGPT响应用户输入,展示了AI驱动的歌单生成过程。

视频重绘工具DomoAI 不用SD视频一键就能转动漫

DomoAI是一款免费的人工智能艺术生成器,通过简单操作和多样化预设模型,用户能在20秒内将文本转化为高质量艺术品,实现快速创作和保持一致的绘画风格。

官网地址:https://top.aibase.com/tool/domoai

Visual Electric发布多张图像组合重绘功能

AI图像生成工具Visual Electric推出两大功能,使图像创作者能够轻松将多张图像组合重绘,提高创作流程的灵活性。设计师可分开生成各个主体,然后通过重绘功能将它们组合,实现更直观的创意实现。

官网地址:https://top.aibase.com/tool/visual-electric

Instagram推出生成式AI背景编辑工具

Instagram推出生成式AI背景编辑工具,让用户通过各种提示定制独特图片背景,促进互动体验。

?‍???聚焦开发者

谷歌开发实时渲染大型三维场景技术SMERF

Google团队推出的SMERF技术能在最大300平方米的房间内实时创建逼真的三维场景,支持智能手机和笔记本,具备60fps实时渲染和完整的六自由度导航。该技术采用分层模型划分和蒸馏训练策略,解决了渲染大型三维场景性能和质量问题,提供更真实、流畅的三维体验。

项目地址:https://smerf-3d.github.io/

AI生成前端代码项目“Coffee”

通过人工智能工具“Coffee”,前端开发者能够以零依赖、零设置的方式,实现对React代码库的快速生成、编辑和维护,显著提高开发效率。

代码地址:https://github.com/Coframe/coffee

谷歌发布NeRFiller,用2D图像补全3D场景

谷歌与加州大学伯克利分校的研究人员合作推出NeRFiller框架,通过2D图像修复缺失的3D场景,采用网格先验和联合多视角补全策略,显著提高修复效果和重建效率。

即将开源地址:https://github.com/ethanweber/nerfiller

论文:https://arxiv.org/abs/2312.04560

更新时间 2023-12-15