嵌入
获得一个给定输入的向量表示,可以轻松地被机器学习模型和算法使用。
相关指南:嵌入
创建嵌入
https://api.openai.com/v1/embeddings(opens in a new tab)
创建一个嵌入向量,代表输入的文本。
请求正文
model 字符串 必填
要使用的模型ID。您可以使用“列出模型”API查看所有可用模型,或者请参阅我们的“模型概述”以了解它们的描述。
input 字符串或数组 必填
输入文本以获取嵌入,编码为字符串或令牌数组。要在单个请求中获取多个输入的嵌入,请传递字符串数组或令牌数组的数组。每个输入长度不得超过8192个标记。
user 字符串 可选的
一个唯一的标识符,代表您的终端用户,可以帮助OpenAI监测和检测滥用。了解更多信息。
curl https://api.openai.com/v1/embeddings \ -H “Authorization: Bearer $OPENAI_API_KEY” \ -H “Content-Type: application/json” \ -d ‘{ “input”: “The food was delicious and the waiter…”, “model”: “text-embedding-ada-002” }’
{ “model”: “text-embedding-ada-002”, “input”: “The food was delicious and the waiter…”}
{ “object”: “list”, “data”: [ { “object”: “embedding”, “embedding”: [ 0.0023064255, -0.009327292, …. (1536 floats total for ada-002) -0.0028842222, ], “index”: 0 } ], “model”: “text-embedding-ada-002”, “usage”: { “prompt_tokens”: 8, “total_tokens”: 8 }}
音频
学习如何将音频转换为文本
相关指南:语音转文字
创建转录
https://api.openai.com/v1/audio/transcriptions(opens in a new tab)
将音频转录为输入语言。
请求正文
file 字符串 必填
要转录的音频文件,格式为以下之一:mp3、mp4、mpeg、mpga、m4a、wav 或 webm。
model 字符串 必填
要使用的模型ID。目前仅有whisper-1可用。
prompt 字符串 可选的
一个可选的文本,用于指导模型的风格或继续之前的音频片段。提示应该与音频语言相匹配。
response_format 字符串 可选项 默认为json
转换成简体中文:转录输出的格式,可选项包括json、文本、srt、verbose_json或vtt。
temperature 数字 可选项 默认为0
采样温度介于0和1之间。较高的值(如0.8)会使输出更随机,而较低的值(如0.2)则会使其更加集中和确定性。如果设置为0,则模型将使用对数概率自动增加温度,直到达到某些阈值。
language 字符串 可选的
输入音频的语言。以 ISO-639-1 格式提供输入语言将提高准确性和延迟。
curl https://api.openai.com/v1/audio/transcriptions \ -H “Authorization: Bearer $OPENAI_API_KEY” \ -H “Content-Type: multipart/form-data” \ -F file=”@/path/to/file/audio.mp3″ \ -F model=”whisper-1″
{ “file”: “audio.mp3”, “model”: “whisper-1”}
{ “text”: “Imagine the wildest idea that you’ve ever had, and you’re curious about how it might scale to something that’s a 100, a 1,000 times bigger. This is a place where you can get to do that.”}
创建翻译
https://api.openai.com/v1/audio/translations(opens in a new tab)
将音频翻译成英语。
请求正文
file 字符串 必填
要翻译的音频文件必须是以下格式之一:mp3、mp4、mpeg、mpga、m4a、wav或webm。
model 字符串 必填
要使用的模型ID。目前仅有whisper-1可用。
prompt 字符串 可选的
一个可选的文本,用于指导模型的风格或继续之前的音频片段。提示应该是英语。
response_format 字符串 可选项 默认为json
转换成简体中文:转录输出的格式,可选项包括json、文本、srt、verbose_json或vtt。
temperature 数字 可选项 默认为0
采样温度介于0和1之间。较高的值(如0.8)会使输出更随机,而较低的值(如0.2)则会使其更加集中和确定性。如果设置为0,则模型将使用对数概率自动增加温度,直到达到某些阈值。
curl https://api.openai.com/v1/audio/translations \ -H “Authorization: Bearer $OPENAI_API_KEY” \ -H “Content-Type: multipart/form-data” \ -F file=”@/path/to/file/german.m4a” \ -F model=”whisper-1″
{ “file”: “german.m4a”, “model”: “whisper-1”}
{ “text”: “Hello, my name is Wolfgang and I come from Germany. Where are you heading today?”}