全国首个上手机的AI视频通话来了！《黑神话：悟空》经文也能破译

免费的AI视频通话功能，就这么水灵灵地来了。

之前B站Up主“女流姐”在直播《黑神话:悟空》的时候，科普游戏内的经文被大家津津乐道。

那么这个可以打视频通话的AI，是否也能帮玩家破译经文呢?

我们这就实测了一波:

这个AI在看完经文后，表示大致意思是:

而清华毕业的“女流姐”在直播中给出的解释也是“世尊在启示众人”。

这一波，AI算是把博大精深的经文给解释到位了。

那么对于这款游戏，AI又了解多少呢?我们给它看了下开场大片并提问:

嗯，这个AI准确地认出了孙悟空和游戏的名字。

这便是智谱AI最新推出的类GPT-4o视频通话的功能——让AI边看世界边和你聊天。

而且已经在自家App智谱清言里上线了，是全国首个正式开放的那种（一部分人先用起来，再逐步完全开放）。

AI视频通话，还能用来干啥?

首先，AI视频通话的入口，就在首页底部输入框右侧的电话按钮:

进入通话界面，再点击视频按钮，就可以开启视频通话的模式了:

现在，是时候打开新世界的大门了!

它能直接辅导小孩做作业。不仅能直接看到、看懂题目，还会循循善诱，一步步引导小孩自己思考找到正确答案。

轻松拿捏英语翻译，甚至是专业论文。

当然还能变成日常生活助手，比如让它帮忙看下食品是否过期。

还能陪人闲聊，情绪价值拉满。

而且可以随时打断它的话，不用固定一来一回，就像和人聊天那样。

（聊天过程也主打一个“啊对对对，你们人类说的都对”）

同时也能和人互动，可以准确找到手指指到的地方。

总结来说，新增的AI视频通话能力，让智谱清言不用仅仅依赖打字、语音这种人类主动输入的形式了解世界，只要打开摄像头，咱们看到的画面，AI也能了解。

这样一来，AI的能力立马提升了一个维度。具备跨文本、音频、视频实时推理能力后，AI也在交互上变得更加灵活、亲切。

基座大模型也升级了

除了这次AI视频通话功能之外，智谱AI在大模型技术上也一波大更新——

推出新一代基座大模型GLM-4-Plus。

而且是敢在KDD国际数据挖掘与知识发现大会上发布的那种。今年以来，智谱以“国产之光”的形象频繁在ICLR等国际舞台上露脸亮相，向外展示中国大模型当下最前沿进展。

首先，在语言文本能力方面，GLM-4-Plus已经取得与GPT4o及405B参数量的Llama3.1相当的成绩。

大模型长文本能力也随着此次的更新得到了加强:

在图像和视频理解能力方面，GLM-4-Plus也取得了较为突出的成绩;而且还是可以理解网页内容，并将其转换为HTML代码的那种。

即使是面对复杂的视频内容，GLM-4V-Plus也能轻松hold住。

据了解，该模型将上线开放平台（bigmodel.cn），智谱AI还将提供国内首个通用视频理解模型的API!

以下面这个视频为例:

GLM-4V-Plus在看完视频之后，便可以对其内容做理解并回答用户的问题。

用户:这个穿绿色衣服的球员在整个视频都做了什么?

GLM-4V-Plus:在整个视频中，穿绿色衣服的球员在场上运球，然后跳起将球投入篮筐。

用户:这个视频的精彩时刻是什么?发生在第几秒?

GLM-4V-Plus:这个视频的精彩时刻发生在第4秒，当时穿绿色衣服的球员跳起并将球投入篮筐。

由此，也就不难理解智谱清言上的AI视频通话功能为什么可以做到如此丝滑了。

智谱AI，又先迈了一步

今年以来，智谱的大动作不断。

不仅仅是这次上线的AI视频通话是全国首个，更早之前的每一个“大动作”也都是属于领先的梯队。

比如年初发布的新一代基座模型GLM-4，全面对标GPT-4;7月发布的类Sora视频生成模型CogVideoX;以及文生图模型迎来最新版本CogView-3-Plus，其效果接近目前最佳的MJ-V6及FLUX等模型，并支持图片编辑功能。

全面对标OpenAI，不是说说而已。

更关键的是，发布即开放，这很智谱。

智谱清影上线即可免费体验。底层模型同样开放。

也是在这两天，智谱AI的CogVideoX-5B宣布开源。它能在低门槛条件下带来更好的视频生成效果。

为开源社区提供了更丰富选择。

与此同时，GLM-4-Flash也已经做到了完全免费。

由此可见，智谱AI在让大模型变得亲民这条路上是认真的。

毕竟AIGC应用，好用、易用才是硬道理;得用户者得天下。

那么你觉得智谱AI的视频通话功能如何呢?欢迎体验过后在评论区留言讨论哦~

p.s.目前只是Beta版本，近期还会有更大版本迭代~

参考链接:

[1]https://www.bilibili.com/video/BV1p2421Z7f1/?vd_source=2cbb36f222ba4fbcf9054d7042914889

[2]https://www.bilibili.com/video/BV1giWHewELY/?spm_id_from=333.337.search-card.all.click&vd_source=1da63cf85df97568b93eb5f22aae3fa3

—完—

总结

### 文章总结
智谱AI最新推出了AI视频通话功能，该功能通过智谱清言App向用户开放，成为国内首个正式开放的AI视频通话功能。通过这一功能，AI不仅能在打字、语音等传统方式基础上，还能够利用画面直观理解场景，提升了交互的灵活性和亲密度。
#### 主要亮点：
1. **AI视频通话功能**：
- 用户可以通过App中的电话和视频按钮，与AI进行视频通话，进行更直观的互动。
- AI能够在观看视频画面的同时，进行理解和回答，提供包括经文解读、游戏分析等多种功能。
2. **多样化应用场景**：
- 辅导孩子作业：能看懂题目，引导孩子自主思考。
- 英语翻译和专业论文解析：高效完成翻译和解析任务。
- 日常生活助手：检查食品保质期等。
- 闲聊互动：可随时打断，自由交流，增强情绪价值。
- 准确手指交互：通过视频识别用户指示，进行精准互动。
3. **基座大模型升级**：
- 推出新一代基座大模型GLM-4-Plus，性能显著提升。
- 在语言文本、长文本能力、图像和视频理解等方面均有显著增强。
- GLM-4V-Plus模型特别强化了视频理解能力，能够提供精确的视频内容分析和问答服务。
#### 智谱AI的成就与开放精神：
- **持续领先**：今年以来，智谱AI频频发布新技术，包括GLM-4、CogVideoX和CogView-3-Plus，对标OpenAI，持续在AIGC领域保持领先。
- **开放态度**：发布即开放，智谱清言和底层大模型均提供免费体验，CogVideoX-5B的开源更是为开源社区提供了更多选择。
- **亲民策略**：通过不断迭代和技术开源，智谱AI让大模型技术更加易用和普及，让更多用户受益。
#### 总结评价：
智谱AI推出的AI视频通话功能是一个重大的创新，不仅扩展了AI的应用场景，也让用户感受到了更直观、更灵活的交互体验。同时，其在大模型和视频理解方面的技术突破，展现了智谱AI在AIGC领域的领先地位和强大的技术实力。期待智谱AI在未来能带给我们更多的惊喜与便利。

视频通话智谱ai ai视频大模型 ide app aigc gpt 视频生成 openai 长文本生活助手 gpt-4 视频内容低门槛 gpt4 开放平台模型升级生成效果多样化