ChatGPT 文档–API-Reference配制教程(三)

嵌入

获得一个给定输入的向量表示,可以轻松地被机器学习模型和算法使用。

相关指南:嵌入

创建嵌入

https://api.openai.com/v1/embeddings(opens in a new tab)

创建一个嵌入向量,代表输入的文本。

请求正文

model 字符串 必填

要使用的模型ID。您可以使用“列出模型”API查看所有可用模型,或者请参阅我们的“模型概述”以了解它们的描述。

input 字符串或数组 必填

输入文本以获取嵌入,编码为字符串或令牌数组。要在单个请求中获取多个输入的嵌入,请传递字符串数组或令牌数组的数组。每个输入长度不得超过8192个标记。

user 字符串 可选的

一个唯一的标识符,代表您的终端用户,可以帮助OpenAI监测和检测滥用。了解更多信息。

curl https://api.openai.com/v1/embeddings \ -H “Authorization: Bearer $OPENAI_API_KEY” \ -H “Content-Type: application/json” \ -d ‘{ “input”: “The food was delicious and the waiter…”, “model”: “text-embedding-ada-002” }’

{ “model”: “text-embedding-ada-002”, “input”: “The food was delicious and the waiter…”}

{ “object”: “list”, “data”: [ { “object”: “embedding”, “embedding”: [ 0.0023064255, -0.009327292, …. (1536 floats total for ada-002) -0.0028842222, ], “index”: 0 } ], “model”: “text-embedding-ada-002”, “usage”: { “prompt_tokens”: 8, “total_tokens”: 8 }}

音频

学习如何将音频转换为文本

相关指南:语音转文字

创建转录

https://api.openai.com/v1/audio/transcriptions(opens in a new tab)

将音频转录为输入语言。

请求正文

file 字符串 必填

要转录的音频文件,格式为以下之一:mp3、mp4、mpeg、mpga、m4a、wav 或 webm。

model 字符串 必填

要使用的模型ID。目前仅有whisper-1可用。

prompt 字符串 可选的

一个可选的文本,用于指导模型的风格或继续之前的音频片段。提示应该与音频语言相匹配。

response_format 字符串 可选项 默认为json

转换成简体中文:转录输出的格式,可选项包括json、文本、srt、verbose_json或vtt。

temperature 数字 可选项 默认为0

采样温度介于0和1之间。较高的值(如0.8)会使输出更随机,而较低的值(如0.2)则会使其更加集中和确定性。如果设置为0,则模型将使用对数概率自动增加温度,直到达到某些阈值。

language 字符串 可选的

输入音频的语言。以 ISO-639-1 格式提供输入语言将提高准确性和延迟。

curl https://api.openai.com/v1/audio/transcriptions \ -H “Authorization: Bearer $OPENAI_API_KEY” \ -H “Content-Type: multipart/form-data” \ -F file=”@/path/to/file/audio.mp3″ \ -F model=”whisper-1″

{ “file”: “audio.mp3”, “model”: “whisper-1”}

{ “text”: “Imagine the wildest idea that you’ve ever had, and you’re curious about how it might scale to something that’s a 100, a 1,000 times bigger. This is a place where you can get to do that.”}

创建翻译

https://api.openai.com/v1/audio/translations(opens in a new tab)

将音频翻译成英语。

请求正文

file 字符串 必填

要翻译的音频文件必须是以下格式之一:mp3、mp4、mpeg、mpga、m4a、wav或webm。

model 字符串 必填

要使用的模型ID。目前仅有whisper-1可用。

prompt 字符串 可选的

一个可选的文本,用于指导模型的风格或继续之前的音频片段。提示应该是英语。

response_format 字符串 可选项 默认为json

转换成简体中文:转录输出的格式,可选项包括json、文本、srt、verbose_json或vtt。

temperature 数字 可选项 默认为0

采样温度介于0和1之间。较高的值(如0.8)会使输出更随机,而较低的值(如0.2)则会使其更加集中和确定性。如果设置为0,则模型将使用对数概率自动增加温度,直到达到某些阈值。

curl https://api.openai.com/v1/audio/translations \ -H “Authorization: Bearer $OPENAI_API_KEY” \ -H “Content-Type: multipart/form-data” \ -F file=”@/path/to/file/german.m4a” \ -F model=”whisper-1″

{ “file”: “german.m4a”, “model”: “whisper-1”}

{ “text”: “Hello, my name is Wolfgang and I come from Germany. Where are you heading today?”}

 

© 版权声明
THE END
喜欢就支持一下吧
点赞5 分享