GPT4o 介绍

一、GPT4o 介绍

1.什么是 GPT4o?

GPT-4o 是 OpenAI 公司于 2024 年 5 月 13 日发布的一款多模态新旗舰模型,可以实时跨音频、视觉和文本进行推理。

GPT-4o 全称为 “ChatpGPT-4 Omni”

GPT-4 中的“4”表示是第四代 GPT

“Omni”的意思是“全能”,GPT-4o 是能跨文本、语音、视觉工作

全能,即用户可以发文本、声音、视频甚至摄像头直播给 Omni,Omni 会以文本、声音予以回复

GPT-4o有一个“新语音模式”,在这个模式下

最神奇的一点,对话过程中,正在说话的GPT-4o可以被用户用语音打断,用户补充新的信息,然后聊天继续,更符合人与人正常沟通场景

不要小看这个功能,这是独创的,之前的 AI 都没有办法实现

2.GPT4o 所有功能正式发布了吗?

答:5 月 13 日只发布了 GPT-4o 的文本功能

新语音功能将在未来几周内向 Plus 用户(OpenAI 的会员)发布,视频功能暂时未确定时间

GPT4o官网入口:https://openai.com/index/hello-gpt-4o(国内无法直接访问)

3.什么是 OpenAI 公司?

OpenAI 是目前全球公认排名第一的 AI 软件公司。成立于 2015 年,旗下产品包括文字 AI “ChatGPT”系列、图片 AI “DALL-E”系列、视频 AI "Sora"等。

4. 什么是 ChatGPT?

通俗讲,ChatGPT 就是 OpenAI 公司基于 GPT 模型构建的一个 AI 聊天机器人。

ChatGPT = Chat + GPT

CHAT 就是聊天,GPT 是创建 CHat 的模型。

用户可以像与人对话一样,使用文字、语音和 GPT 沟通

5.ChatGPT 有哪些版本

答:截止目前,GPT 发布了 4 代版本,即 GPT-1 到 GPT-4

据说,2024 年将发布 GPT-5!

2018 年 GPT1,2022 年底 GPT3.5,2023 年 3 月 GPT4

每个版本,又有不同的小版本。GPT4 目前常用版本包括 GPT-4 Turbo 和 GPT-4o

第一,GPT3.5 和之前的版本是单模 AI,只支持文字对话;GPT4 则是多模 AI(多模=文字+语音+图片+视频)

第二,GPT4 比 GPT3.5 更聪明,懂的东西更多(训练数据更多)。GPT3.5=高中毕业生,GPT4 则是 985 的本科生

6.GPT4o 与 GPT4有什么区别?

GPT4o 是 OpenAI 公司 Omni 团队第一个项目

通过优化算法,GPT4o 性能提升 5%左右,速度比其他版本 GPT4 快两倍,API 价格下降 50%

在与视觉能力相关的评估中,GPT-4o 的视觉能力表现优于 GPT-4 Turbo。

多语言:GPT-4o 比 GPT-4 Turbo 改进了对非英语语言的支持。

功能上:GPT-4o 有新语音模式,还可以通过声音、视频检测用户周边环境,对用户“察言观色”,识别用户的情绪和状态,反应又快,会是一个很会聊天的朋友!

7.什么是上下文长度?

答:上下文长度,即你与 AI 对话的总长度,包括你发给 AI 的,AI 回复你的,AI 记住的历史数据。

GPT-4o 目前的上下文窗口为 128k,约 1.4 万个汉字

8.ChatGPT 有记忆吗?

有记忆,分为短期记忆和长期记忆。

短期记忆:即当前对话记忆,所有版本 GPT 都有此功能。ChatGPT 是有记忆的,可以根据上下文连续给出建议,和 ChatGPT 沟通,就好像在和人对话一样。

长期记忆:最新版 GPT4 都有长期记忆功能,GPT4 会根据情况,判定是否是个人信息,然后更新到你的专属数据库。目前测试阶段,详见《GPT 比你自己还懂你?》

9.什么是 AI 的通识

包括 GPT 在内的 AI,都是人类用大量的数据训练出来的,这些数据称为“通识”。

通识有一个截止日,比如 gpt4o 的知识截止日是 2023 年 10 月。

2023 年 10 月至今的信息,由 GPT4o 内置的搜索引擎补充提供。

10.GPT-4o 的应用场景

有了 GPT-4o 新语音模式加持,应用非常广泛!

在 GPT-4o 的新语音模式下,用户与 GPT-4o 沟通,感觉很自然,对话如真人般丝滑

有语音模式的加持,可以广泛的使用在日常交流、工作学习中,细分领域包括日常对话、教育、聊天、学外语、教育辅导

奥特曼在接受采访时说:

“因为我认为这是使用计算机的一种非常棒的方式。实际上,我们很久以前就有了语音控制计算机的想法。你知道的,我们有 Siri,之前还有其他类似的技术。但它们从来没有让我感觉到使用起来很自然。这个新技术,由于很多原因——它的功能、速度、增加的多模态支持、语调的自然性等——让使用体验大大提升。你可以轻松地调整说话速度或改变声音,它的流畅性和灵活性让我非常喜欢。

有个特别惊喜的用途是在我全神贯注工作时,将手机放在桌子上。然后在不需要切换窗口或改变我正在做的事情的情况下,将它作为另一个通信渠道。这样我就可以在继续工作的同时,询问并立即得到回答,而不需要转移视线,这真的很酷。”

11.GPT4o 可以免费使用吗?

免费注册用户可以使用 GPT4o!

对于免费用户,GPT4o 每 3 小时有 10 条请求的限额,并且支持上传文件。一旦达到限额,它会自动切换回 GPT-3.5 模型

对于付费的 Plus 用户,GPT4o 每 3 小时有 80 条请求的限额,而 GPT-4 每 3 小时有 40 条请求的限额

不过你可以关注公众号“浩瀚的苍穹”来找我,我送你一套GPT-4o 多轮白嫖大法

12.GPT4o 会犯错吗?

答:会!所有 AI 都会犯错

聪明的 AI 或能联网的 AI 犯错几率小一点。注意官网对话框下面那行小字:

“ChatGPT 也可能会犯错。请核查重要信息。”

网友评论