Google AI 推出 Gemini 1.5 Pro API 全面提升開發(fā)者體驗(yàn) 原創(chuàng)
Gemini 1.5 Pro 現(xiàn)已在全球公測(cè),帶來(lái)多項(xiàng)關(guān)鍵更新
Gemini 1.5 Pro 現(xiàn)已在超過(guò) 180 個(gè)國(guó)家或地區(qū)的 Gemini API 公測(cè)環(huán)境中提供,引入了官方改進(jìn)的音頻/視頻(語(yǔ)言)理解能力和新的文件 API,以便于實(shí)時(shí)大文件訪問(wèn)。此外,還增加了多套綜合的 JSON 解析器架構(gòu),給予開發(fā)者更多控制與調(diào)試的功能。最后,發(fā)布了性能優(yōu)越的下一代文本嵌入模型。
主要更新內(nèi)容
全球可用性:
Gemini 1.5 Pro 現(xiàn)已在超過(guò) 180 個(gè)國(guó)家或地區(qū)的 Gemini API 公測(cè)環(huán)境中提供,使得全球開發(fā)者都能訪問(wèn)并利用這一新型模型。
官方音頻/視頻(語(yǔ)言)理解能力:
引入了官方改進(jìn)的音頻(語(yǔ)言)理解能力,意味著 Gemini 1.5 Pro 能夠更精確地解析和理解音頻輸入,為開發(fā)者提供更豐富的語(yǔ)言識(shí)別和處理工具。
新的文件 API:
新增的文件 API 使得文件大小不再成為限制,開發(fā)者能夠更高效地處理應(yīng)用中的大文件傳輸,視頻和音頻文件的處理。
JSON 解析:
升級(jí)了 JSON 能力,包括多套綜合的 JSON 解析器架構(gòu),極大地提高了數(shù)據(jù)解析的精度和性能。
功能和接口:
改進(jìn)了功能和接口調(diào)用,開發(fā)者可以選擇不同的接口實(shí)現(xiàn)功能調(diào)試,增強(qiáng)了系統(tǒng)接口的靈活性和適用性。
新的文本嵌入模型:
推出了性能優(yōu)越的最新一代文本嵌入模型(text-embedding-004),在 MTEB 基準(zhǔn)測(cè)試中顯示出比前幾代模型更優(yōu)越的綜合性能,為文本分析和語(yǔ)義理解提供了強(qiáng)大的支持。
更廣泛的輸入格式支持:
Gemini 1.5 Pro 擴(kuò)展了對(duì)不同輸入格式的支持,包括音頻和視頻,并計(jì)劃很快支持圖片內(nèi)容和語(yǔ)言(語(yǔ)言)跨模態(tài)轉(zhuǎn)換的 API 交互,為開發(fā)者提供更多元化的應(yīng)用可能。
這些更新不僅展示了 Google 對(duì) AI 技術(shù)不斷創(chuàng)新的承諾,也為開發(fā)者提供了更多工具和資源,以便更好地構(gòu)建和優(yōu)化他們的應(yīng)用程序和服務(wù)。
如何使用 Gemini 1.5 Pro?
創(chuàng)建 API 密鑰:
在 Google AI Studio 創(chuàng)建或申請(qǐng)測(cè)試的 API 密鑰,開始構(gòu)建。
查看和使用擴(kuò)展的音頻/視頻(語(yǔ)言)能力:
在 Gemini API 和 Google AI Studio 中查看擴(kuò)展的音頻和視頻(語(yǔ)言)理解能力。支持通過(guò)上傳到 Google AI Studio 的視頻和音頻自動(dòng)翻譯的音頻輸入,API 交互的潛力巨大。
配置 API 調(diào)用:
在 Google AI Studio 的 Gemini API 中,通過(guò)交互式的分析與管理控制臺(tái)創(chuàng)建、定義角色、格式、時(shí)間和規(guī)則,以便于理解不同的輸入格式和行為。
JSON 解析:
查看和使用改進(jìn)的 JSON 解析功能和新的文本嵌入模型,使你可以更靈活地處理大文本數(shù)據(jù)和結(jié)構(gòu)化的 JSON 響應(yīng)。你可以使用 cURL 或 Python SDK 支持的交互功能。
import requests
url = "https://gemini.api.google.com/v1/json-parser"
headers = {
"Authorization": "Bearer YOUR_API_KEY",
"Content-Type": "application/json"
}
payload = {
"json_input": {"example_key": "example_value"}
}
response = requests.post(url, headers=headers, json=payload)
print(response.json())
跨模態(tài)轉(zhuǎn)換的使用:
現(xiàn)在可以與 Gemini API 互動(dòng),將音頻、視頻和文本,甚至圖片進(jìn)行交互,功能適用范圍大大擴(kuò)展。
申請(qǐng) Gemini 1.5 Pro API 步驟
訪問(wèn) Google AI Studio:
打開瀏覽器,訪問(wèn) Google AI Studio。
創(chuàng)建賬號(hào)或登錄:
使用 Google 賬號(hào)登錄,若沒(méi)有賬號(hào),請(qǐng)先注冊(cè)。
申請(qǐng) API 密鑰:
在主頁(yè)上選擇“創(chuàng)建項(xiàng)目”。輸入項(xiàng)目名稱并選擇相關(guān)設(shè)置。在項(xiàng)目設(shè)置中選擇“API 與服務(wù)”,然后選擇“創(chuàng)建 API 密鑰”。
預(yù)充值:
輸入預(yù)充值金額,最低為 5 美元。
配置和測(cè)試 API:
在 API 控制臺(tái)中配置所需的 API 服務(wù)。使用提供的 API 密鑰在開發(fā)環(huán)境中進(jìn)行測(cè)試和開發(fā)。
Gemini 1.5 Pro 帶來(lái)了顯著的改進(jìn)和新功能,為開發(fā)者提供了強(qiáng)大的工具和更大的靈活性,幫助他們?cè)谌蚍秶鷥?nèi)更高效地開發(fā)和優(yōu)化應(yīng)用程序。通過(guò)詳細(xì)的 API 調(diào)用和配置步驟,開發(fā)者可以輕松上手并充分利用這些新特性。
