OpenAI模型

2024-08-15 139

OpenAI API由多种模型支持,这些模型具有不同的功能和定价,用户可以通过微调(fine-tuning)对OpenAI的基础模型进行一定程度的定制,以适应特定需求。本文主要介绍OpenAI提供的各种模型。

一、OpenAI模型概述

模型 描述
GPT-4 Beta 一组改进 GPT-3.5 的模型,可以理解和生成自然语言或代码
GPT-3.5 一组改进 GPT-3 的模型,可以理解并生成自然语言或代码
DALL·E Beta 可以在给定自然语言提示的情况下生成和编辑图像的模型
Whisper Beta 可以将音频转换为文本的模型
Embeddings 一组可以将文本转换为数字形式的模型
Codex Limited Beta 一组可以理解和生成代码的模型,包括将自然语言转换为代码
Moderation 可以检测文本是否敏感或不安全的微调模型
GPT-3 一组可以理解和生成自然语言的模型

二、OpenAI模型升级

随着gpt-3.5-turbo的推出,OpenAI的一些模型现在正在不断更新。OpenAI还提供静态模型版本,开发人员可以在更新的模型引入后继续使用至少三个月。随着模型更新的新节奏,OpenAI还让人们能够贡献评估,以帮助OpenAI改进不同用例的模型。

以下模型是临时快照,包含停用时间和替换的GPT模型。

Model name(GPT 模型) Discontinuation date(停用时间) Replacement model(替换的 GPT 模型)
gpt-3.5-turbo-0301 09/13/2023 gpt-3.5-turbo-0613
gpt-4-0314 09/13/2023 gpt-4-0613
gpt-4-32k-0314 09/13/2023 gpt-4-32k-0613

三、GPT-4

GPT-4是一个大型多模态模型(今天接受文本输入并产生文本输出,未来将支持图像输入),由于其更广泛的通用知识和高级推理能力,它可以比OpenAI以前的任何模型更准确地解决复杂问题。与gpt-3.5-turbo一样,GPT-4针对聊天进行了优化,但也适用于传统的补全(Completion)任务。

MODEL 描述 最大 tokens 数 训练数据
gpt-4 比任何 GPT-3.5 模型都更强大,能够执行更复杂的任务,并针对聊天进行了优化。将使用我们最新的模型迭代进行更新。 8,192 个 tokens 截至 2021 年 9 月
gpt-4-0613 2023 gpt-4 年 6 月 13 日的快照,包含函数调用数据。与此不同 gpt-4 ,此模型将不会收到更新,并将在新版本发布后 3 个月弃用。 8,192 个 tokens 截至 2021 年 9 月
gpt-4-32k 与基本gpt-4模式相同的功能,但上下文长度是其 4 倍。将使用我们最新的模型迭代进行更新。 32,768 个 tokens 截至 2021 年 9 月
gpt-4-32k-0613 2023 gpt-4-32 年 6 月 13 日的快照。与此不同 gpt-4-32k ,此模型将不会收到更新,并将在新版本发布后 3 个月弃用。 32,768 个 tokens 截至 2021 年 9 月

四、GPT-3.5

GPT-3.5模型可以理解和生成自然语言或代码。OpenAI在GPT-3.5系列中功能最强大、最具成本效益的型号是gpt-3.5-turbo,它已针对聊天进行了优化,但也适用于传统的补全(Completion)任务。OpenAI建议使用gpt-3.5-turbo而不是其他GPT-3.5模型,因为它的成本更低。

LATEST MODEL(最新模型) 描述 最大 tokens 数 训练数据
gpt-3.5-turbo 功能最强大的 GPT-3.5 型号,针对聊天进行了优化,成本仅为 text-davinci-003 的 1/10。将使用我们最新的模型迭代进行更新。 4096 tokens 截至 2021 年 9 月
gpt-3.5-turbo-16k 与标准模型gpt-3.5-turbo有相同的功能,但该模型是其 4 倍的上下文。 16,384 tokens 截至 2021 年 9 月
gpt-3.5-turbo-0613 2023 gpt-3.5-turbo 年 6 月 13 日的快照,包含函数调用数据。与此不同 gpt-3.5-turbo ,此模型将不会收到更新,并将在新版本发布后 3 个月弃用。 4096 tokens 截至 2021 年 9 月
gpt-3.5-turbo-16k-0613 2023 gpt-3.5-turbo-16k 年 6 月 13 日的快照。与此不同 gpt-3.5-turbo-16k ,此模型将不会收到更新,并将在新版本发布后 3 个月弃用。 16,384 tokens 截至 2021 年 9 月
text-davinci-003 可以比 curie、babbage、ada 模型更好的质量、更长的输出和一致的指令遵循来完成任何语言任务。还支持在文本中 插入补全。 4097 tokens 截至 2021 年 6 月
text-davinci-002 与 text-davinci-003 类似的功能,但使用监督微调而不是强化学习进行训练 4097 tokens 截至 2021 年 6 月
code-davinci-002 针对代码完成任务进行了优化 8001 tokens 截至 2021 年 6 月

五、特定功能模型

虽然新的gpt-3.5-turbo模型针对会话进行了优化,但它对于传统的完成任务也非常有效。原始的GPT-3.5模型针对文本补全进行了优化。

OpenAI用于创建嵌入(Embedding)和编辑文本的端点它们自己的一组专用模型。

六、寻找合适的模型

使用gpt-3.5-turbo进行试验是了解API功能的好方法。在了解要实现的目标后,可以继续使用gpt-3.5-turbo或其他模型并尝试围绕其功能进行优化。可以使用GPT比较工具,让并排运行不同的模型来比较输出、设置和响应时间,然后将数据下载到Excel电子表格中。

七、DALL·E

DALL·E是一个人工智能系统,可以根据自然语言的描述创建逼真的图像和艺术作品。OpenAI目前支持在提示的情况下创建具有特定大小的新图像、编辑现有图像或创建用户提供的图像的变体的能力。

通过OpenAI的API提供的当前DALL·E模型是DALL·E的第2代,具有比原始模型更逼真、更准确且分辨率高4倍的图像。

八、Whisper

Whisper是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。目前可通过OpenAI的API(模型名whisper-1)使用Whisperv2-large模型。

目前,Whisper的开源版本和通过OpenAI的API提供的版本之间没有区别。但是,通过OpenAI的API,OpenAI提供了一个优化的推理过程,这使得通过OpenAI的API运行Whisper比通过其他方式运行要快得多。

九、嵌入

嵌入(Embedding)是文本的数字表示,可用于衡量两段文本之间的相关性。OpenAI的第二代嵌入模型text-embedding-ada-002旨在以一小部分成本取代之前的16种第一代嵌入(Embedding)模型。嵌入(Embedding)可用于搜索、聚类、推荐、异常检测和分类任务。

十、Codex

Codex模型是OpenAI的GPT-3模型的后代,可以理解和生成代码。他们的训练数据包含自然语言和来自GitHub的数十亿行公共代码。精通JavaScript、Go、Perl、PHP、Ruby、Swift、TypeScript、SQL,甚至Shell等十几种语言。

OpenAI目前提供两种Codex型号:

MODEL 描述 最大 tokens 数 训练数据
code-davinci-002 功能最强大的 Codex 型号。特别擅长将自然语言翻译成代码。除了补全代码,还支持在代码中插入插入补全。 8001 tokens 截至 2021 年 6 月
code-cushman-001 几乎与 Davinci Codex 一样强大,但速度稍快。这种速度优势可能使其成为实时应用程序的首选。 最多 2048 个 tokens /

Codex模型在有限测试期间可免费使用,并受降低的速率限制的约束。当OpenAI了解使用情况时,OpenAI将寻求提供定价以支持广泛的应用程序。

特定功能模型:主要的Codex模型旨在与文本补全(Completion)端点一起使用。OpenAI还提供专门用于OpenAI的端点以创建嵌入(Embedding)和编辑代码。

十一、审核

审核(Moderation)模型旨在检查内容是否符合OpenAI的使用策略。审核模型采用任意大小的输入,该输入会自动分解以适应模型特定的上下文窗口。

MODEL 描述
text-moderation-latest 最有能力的审核模型,精度会比稳定模型略高
text-moderation-stable 几乎与最新型号一样强大,但略旧。

十二、GPT-3

GPT-3模型可以理解和生成自然语言。这些模型已被更强大的GPT-3.5代模型所取代。但是,原始GPT-3基本模型(davinci、curie、ada和babbage)是当前唯一可用于微调的模型。

MODEL 描述 最大 tokens 数 训练数据
text-curie-001 非常有能力,比 davinci 更快,成本更低。 2,049 tokens 截至 2019 年 10 月
text-babbage-001 能够完成简单的任务,速度非常快,成本更低。 2,049 tokens 截至 2019 年 10 月
text-ada-001 能够完成非常简单的任务,通常是 GPT-3 系列中最快的型号,成本最低。 2,049 tokens 截至 2019 年 10 月
davinci 功能最强大的 GPT-3 模型。可以完成其他模型可以完成的任何任务,通常质量更高。 2,049 tokens 截至 2019 年 10 月
curie 非常有能力,但比 davinci 更快,成本更低。 2,049 tokens 截至 2019 年 10 月
babbage 能够完成简单的任务,速度非常快,成本更低。 2,049 tokens 截至 2019 年 10 月
ada 能够完成非常简单的任务,通常是 GPT-3 系列中最快的型号,成本最低。 2,049 tokens 截至 2019 年 10 月

十三、OpenAI模型兼容性

Endpoint(指具体的某个 API) 型号名称
/v1/chat/completions gpt-4, gpt-4-0314, gpt-4-32k, gpt-4-32k-0314, gpt-3.5-turbo, gpt-3.5-turbo-0301
/v1/completions text-davinci-003, text-davinci-002, text-curie-001, text-babbage-001, text-ada-001, davinci, curie, babbage, ada
/v1/edits text-davinci-edit-001 text-davinci-edit-001, code-davinci-edit-001
/v1/audio/transcriptions whisper-1
/v1/audio/translations whisper-1
/v1/fine-tunes davinci, curie, babbage, ada
/v1/embeddings text-embedding-ada-002, text-search-ada-doc-001
/v1/moderations 文本审核稳定,文本审核最新
  • 广告合作

  • QQ群号:707632017

温馨提示:
1、本网站发布的内容(图片、视频和文字)以原创、转载和分享网络内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。邮箱:2942802716#qq.com(#改为@)。 2、本站原创内容未经允许不得转裁,转载请注明出处“站长百科”和原文地址。
OpenAI模型
上一篇: OpenAI API快速入门
OpenAI模型
下一篇: OpenAI补全