ChatGPT 文档-API-Reference配制教程（三）

嵌入

获得一个给定输入的向量表示，可以轻松地被机器学习模型和算法使用。

创建嵌入

https://api.openai.com/v1/embeddings(opens in a new tab)

创建一个嵌入向量，代表输入的文本。

请求正文

model 字符串必填

要使用的模型ID。您可以使用“列出模型”API查看所有可用模型，或者请参阅我们的“模型概述”以了解它们的描述。

input 字符串或数组必填

输入文本以获取嵌入，编码为字符串或令牌数组。要在单个请求中获取多个输入的嵌入，请传递字符串数组或令牌数组的数组。每个输入长度不得超过8192个标记。

user 字符串可选的

一个唯一的标识符，代表您的终端用户，可以帮助OpenAI监测和检测滥用。了解更多信息。

curl https://api.openai.com/v1/embeddings \ -H “Authorization: Bearer $OPENAI_API_KEY” \ -H “Content-Type: application/json” \ -d ‘{ “input”: “The food was delicious and the waiter…”, “model”: “text-embedding-ada-002” }’

{ “model”: “text-embedding-ada-002”, “input”: “The food was delicious and the waiter…”}

{ “object”: “list”, “data”: [ { “object”: “embedding”, “embedding”: [ 0.0023064255, -0.009327292, …. (1536 floats total for ada-002) -0.0028842222, ], “index”: 0 } ], “model”: “text-embedding-ada-002”, “usage”: { “prompt_tokens”: 8, “total_tokens”: 8 }}

音频

学习如何将音频转换为文本

创建转录

https://api.openai.com/v1/audio/transcriptions(opens in a new tab)

将音频转录为输入语言。

请求正文

file 字符串必填

要转录的音频文件，格式为以下之一：mp3、mp4、mpeg、mpga、m4a、wav 或 webm。

model 字符串必填

要使用的模型ID。目前仅有whisper-1可用。

prompt 字符串可选的

一个可选的文本，用于指导模型的风格或继续之前的音频片段。提示应该与音频语言相匹配。

response_format 字符串可选项默认为json

转换成简体中文：转录输出的格式，可选项包括json、文本、srt、verbose_json或vtt。

temperature 数字可选项默认为0

采样温度介于0和1之间。较高的值（如0.8）会使输出更随机，而较低的值（如0.2）则会使其更加集中和确定性。如果设置为0，则模型将使用对数概率自动增加温度，直到达到某些阈值。

language 字符串可选的

输入音频的语言。以 ISO-639-1 格式提供输入语言将提高准确性和延迟。

curl https://api.openai.com/v1/audio/transcriptions \ -H “Authorization: Bearer $OPENAI_API_KEY” \ -H “Content-Type: multipart/form-data” \ -F file=”@/path/to/file/audio.mp3″ \ -F model=”whisper-1″

{ “file”: “audio.mp3”, “model”: “whisper-1”}

{ “text”: “Imagine the wildest idea that you’ve ever had, and you’re curious about how it might scale to something that’s a 100, a 1,000 times bigger. This is a place where you can get to do that.”}

创建翻译

https://api.openai.com/v1/audio/translations(opens in a new tab)

将音频翻译成英语。

请求正文

file 字符串必填

要翻译的音频文件必须是以下格式之一：mp3、mp4、mpeg、mpga、m4a、wav或webm。

model 字符串必填

要使用的模型ID。目前仅有whisper-1可用。

prompt 字符串可选的

一个可选的文本，用于指导模型的风格或继续之前的音频片段。提示应该是英语。

response_format 字符串可选项默认为json

转换成简体中文：转录输出的格式，可选项包括json、文本、srt、verbose_json或vtt。

temperature 数字可选项默认为0

curl https://api.openai.com/v1/audio/translations \ -H “Authorization: Bearer $OPENAI_API_KEY” \ -H “Content-Type: multipart/form-data” \ -F file=”@/path/to/file/german.m4a” \ -F model=”whisper-1″

{ “file”: “german.m4a”, “model”: “whisper-1”}

{ “text”: “Hello, my name is Wolfgang and I come from Germany. Where are you heading today?”}

文章版权归作者所有，严禁转载。

THE END

AI工具

ChatGPT 文档–API-Reference配制教程（三）

嵌入

创建嵌入

请求正文

学习如何将音频转换为文本

创建转录

请求正文

创建翻译

请求正文