一、GPT4o 介绍
1.什么是 GPT4o?
GPT-4o 是 OpenAI 公司于 2024 年 5 月 13 日发布的一款多模态新旗舰模型,可以实时跨音频、视觉和文本进行推理。
GPT-4o 全称为 “ChatpGPT-4 Omni”
GPT-4 中的“4”表示是第四代 GPT
“Omni”的意思是“全能”,GPT-4o 是能跨文本、语音、视觉工作
全能,即用户可以发文本、声音、视频甚至摄像头直播给 Omni,Omni 会以文本、声音予以回复
GPT-4o有一个“新语音模式”,在这个模式下
最神奇的一点,对话过程中,正在说话的GPT-4o可以被用户用语音打断,用户补充新的信息,然后聊天继续,更符合人与人正常沟通场景
不要小看这个功能,这是独创的,之前的 AI 都没有办法实现
2.GPT4o 所有功能正式发布了吗?
答:5 月 13 日只发布了 GPT-4o 的文本功能
新语音功能将在未来几周内向 Plus 用户(OpenAI 的会员)发布,视频功能暂时未确定时间
GPT4o官网入口:https://openai.com/index/hello-gpt-4o(国内无法直接访问)
3.什么是 OpenAI 公司?
OpenAI 是目前全球公认排名第一的 AI 软件公司。成立于 2015 年,旗下产品包括文字 AI “ChatGPT”系列、图片 AI “DALL-E”系列、视频 AI "Sora"等。
4. 什么是 ChatGPT?
通俗讲,ChatGPT 就是 OpenAI 公司基于 GPT 模型构建的一个 AI 聊天机器人。
ChatGPT = Chat + GPT
CHAT 就是聊天,GPT 是创建 CHat 的模型。
用户可以像与人对话一样,使用文字、语音和 GPT 沟通
5.ChatGPT 有哪些版本
答:截止目前,GPT 发布了 4 代版本,即 GPT-1 到 GPT-4
据说,2024 年将发布 GPT-5!
2018 年 GPT1,2022 年底 GPT3.5,2023 年 3 月 GPT4
每个版本,又有不同的小版本。GPT4 目前常用版本包括 GPT-4 Turbo 和 GPT-4o
第一,GPT3.5 和之前的版本是单模 AI,只支持文字对话;GPT4 则是多模 AI(多模=文字+语音+图片+视频)
第二,GPT4 比 GPT3.5 更聪明,懂的东西更多(训练数据更多)。GPT3.5=高中毕业生,GPT4 则是 985 的本科生
6.GPT4o 与 GPT4有什么区别?
GPT4o 是 OpenAI 公司 Omni 团队第一个项目
通过优化算法,GPT4o 性能提升 5%左右,速度比其他版本 GPT4 快两倍,API 价格下降 50%
在与视觉能力相关的评估中,GPT-4o 的视觉能力表现优于 GPT-4 Turbo。
多语言:GPT-4o 比 GPT-4 Turbo 改进了对非英语语言的支持。
功能上:GPT-4o 有新语音模式,还可以通过声音、视频检测用户周边环境,对用户“察言观色”,识别用户的情绪和状态,反应又快,会是一个很会聊天的朋友!
7.什么是上下文长度?
答:上下文长度,即你与 AI 对话的总长度,包括你发给 AI 的,AI 回复你的,AI 记住的历史数据。
GPT-4o 目前的上下文窗口为 128k,约 1.4 万个汉字
8.ChatGPT 有记忆吗?
有记忆,分为短期记忆和长期记忆。
短期记忆:即当前对话记忆,所有版本 GPT 都有此功能。ChatGPT 是有记忆的,可以根据上下文连续给出建议,和 ChatGPT 沟通,就好像在和人对话一样。
长期记忆:最新版 GPT4 都有长期记忆功能,GPT4 会根据情况,判定是否是个人信息,然后更新到你的专属数据库。目前测试阶段,详见《GPT 比你自己还懂你?》
9.什么是 AI 的通识
包括 GPT 在内的 AI,都是人类用大量的数据训练出来的,这些数据称为“通识”。
通识有一个截止日,比如 gpt4o 的知识截止日是 2023 年 10 月。
2023 年 10 月至今的信息,由 GPT4o 内置的搜索引擎补充提供。
10.GPT-4o 的应用场景
有了 GPT-4o 新语音模式加持,应用非常广泛!
在 GPT-4o 的新语音模式下,用户与 GPT-4o 沟通,感觉很自然,对话如真人般丝滑
有语音模式的加持,可以广泛的使用在日常交流、工作学习中,细分领域包括日常对话、教育、聊天、学外语、教育辅导
奥特曼在接受采访时说:
“因为我认为这是使用计算机的一种非常棒的方式。实际上,我们很久以前就有了语音控制计算机的想法。你知道的,我们有 Siri,之前还有其他类似的技术。但它们从来没有让我感觉到使用起来很自然。这个新技术,由于很多原因——它的功能、速度、增加的多模态支持、语调的自然性等——让使用体验大大提升。你可以轻松地调整说话速度或改变声音,它的流畅性和灵活性让我非常喜欢。
有个特别惊喜的用途是在我全神贯注工作时,将手机放在桌子上。然后在不需要切换窗口或改变我正在做的事情的情况下,将它作为另一个通信渠道。这样我就可以在继续工作的同时,询问并立即得到回答,而不需要转移视线,这真的很酷。”
11.GPT4o 可以免费使用吗?
免费注册用户可以使用 GPT4o!
对于免费用户,GPT4o 每 3 小时有 10 条请求的限额,并且支持上传文件。一旦达到限额,它会自动切换回 GPT-3.5 模型
对于付费的 Plus 用户,GPT4o 每 3 小时有 80 条请求的限额,而 GPT-4 每 3 小时有 40 条请求的限额
不过你可以关注公众号“浩瀚的苍穹”来找我,我送你一套GPT-4o 多轮白嫖大法
12.GPT4o 会犯错吗?
答:会!所有 AI 都会犯错
聪明的 AI 或能联网的 AI 犯错几率小一点。注意官网对话框下面那行小字:
“ChatGPT 也可能会犯错。请核查重要信息。”
网友评论