自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI 網關對決:Higress 與 OneAPI 的功能對比

人工智能
AI 網關旨在統(tǒng)一管理與各種大型語言模型(LLMs)的交互。通過提供單一入口點,它解決了使用來自不同供應商的多個 AI 模型所帶來的復雜性問題。

什么是 AI 網關?

AI 網關旨在統(tǒng)一管理與各種大型語言模型(LLMs)的交互。通過提供單一入口點,它解決了使用來自不同供應商的多個 AI 模型所帶來的復雜性問題。這不僅簡化了訪問流程,提高了系統(tǒng)穩(wěn)定性,還降低了成本,并靈活地利用了不同模型的優(yōu)勢。

什么是 OneAPI?

OneAPI 是一個開源的 LLM API 管理 & 分發(fā)系統(tǒng),可以幫助統(tǒng)一管理和轉發(fā)各類大語言模型(如 DeepSeek 等)的 API 請求。它提供了一個兼容 OpenAI API 格式的統(tǒng)一接口,讓用戶能夠方便地切換和管理不同的 AI 模型服務,同時支持令牌管理、負載均衡等功能。

什么是 Higress?

Higress 是一款云原生 API 網關,內核基于 Istio 和 Envoy,可以用 Go/Rust/JS 等編寫 Wasm 插件,提供了數(shù)十個現(xiàn)成的通用插件。Higress 在阿里內部為解決 Tengine reload 對長連接業(yè)務有損,以及 gRPC/Dubbo 負載均衡能力不足而誕生。阿里云基于 Higress 構建了云原生 API 網關產品,為大量企業(yè)客戶提供 99.99% 的網關高可用保障服務能力。

Higress 同時也能夠作為 AI 網關,通過統(tǒng)一的協(xié)議對接國內外所有 LLM 模型廠商,同時具備豐富的 AI 可觀測、多模型負載均衡/fallback、AI token 流控、AI 緩存等能力。

圖片圖片

Higress 和 OneAPI 的對比

下面的表格從多個維度對比了 OneAPI 和 Higress 之前的差異:

差異項

OneAPI

Higress

核心功能

AI 網關

具有 AI 網關功能的 API 網關

維護方式

由個人維護的項目

由阿里云 API 網關團隊維護的項目

系統(tǒng)安全

易受安全漏洞影響,如 DockerHub 鏡像被注入加密挖礦腳本

商業(yè)版由阿里云托管,無此風險;開源版本集成了阿里云容器鏡像服務以存儲鏡像,提供安全掃描和自動阻止風險鏡像的功能

內容安全

通過集成阿里云內容安全實現(xiàn)實時內容過濾,同時支持數(shù)據(jù)脫敏等功能

模型管理

只有模型和 API Key 配置管理

支持 API Key 管理(多密鑰輪詢、屏蔽不可用密鑰)、消費者管理(API Key 二級分發(fā)、訪問控制)、兜底模型以及模型灰度發(fā)布。

可觀測性

提供監(jiān)控儀表板用于查看模型及消費者令牌消耗和調用延遲。提供全面的可觀測性,包括內容安全、速率限制和緩存的監(jiān)控。

可擴展性

插件市場提供了現(xiàn)成插件(提示詞模板、AI緩存、數(shù)據(jù)脫敏、內容安全),支持自定義插件開發(fā)及熱加載。

云集成

可以和阿里云上的各類云產品集成,例如借助 SLS 實現(xiàn) AI 數(shù)據(jù)分析能力

Higress 作為 AI 網關的優(yōu)勢

Higress 作為 AI 網關,具備以下幾大優(yōu)勢:

  • 統(tǒng)一管理與靈活擴展:Higress 提供一個集中的入口,能夠統(tǒng)一管理多個大型語言模型(LLMs),簡化了與不同供應商模型的接入和配置,支持靈活擴展,方便在需求變化時加入新的模型。
  • 高可用性與穩(wěn)定性:Higress 通過自動故障轉移機制,確保當某個 AI 模型服務不可用時,能夠快速切換到備選模型,保持系統(tǒng)的高可用性和穩(wěn)定性,極大減少了服務中斷的風險。
  • AI 緩存:Higress 支持將 AI 模型的結果緩存在 Elasticsearch、Redis、Weaviate 等數(shù)據(jù)庫中。這樣不僅可以在后續(xù)處理相似問題的請求時快速返回結果,還能減少 LLM 調用的費用開銷。
  • 意圖識別:Higress 能根據(jù)用戶需求智能地選擇最合適的 LLM,從而在不同場景下提供最佳響應。
  • API Key 治理:支持配置 API Key 池實現(xiàn)多 Key 均衡,API Key 被限流等不可用情況會自動屏蔽,并在可用時自動恢復。
  • 消費者管理:可以通過創(chuàng)建消費者,實現(xiàn) API Key 的二次分租,無需將真正的供應商 API Key 暴露給調用方,并且可以精細化管理不同消費者的調用權限和調用額度。
  • 強大的可觀測性:Higress 提供關于模型性能、令牌使用情況及安全相關指標的詳細洞察,幫助團隊全面監(jiān)控系統(tǒng)健康狀況。
  • 云原生集成:與阿里云服務緊密集成,Higress 提供了托管的云原生 API 網關選項,簡化了云環(huán)境中的部署與管理。
  • 內容安全:Higress 集成了阿里云內容安全技術,為 AI 內容提供強大的安全保障。

快速體驗 Higress AI 網關

Higress AI 網關支持一行命令安裝:

curl -sS https://higress.cn/ai-gateway/install.sh | bash

執(zhí)行完命令后可以通過命令行初始化配置,可以看到,Higress 的 AI 網關能力支持對接國內外所有主流 LLM 模型供應商:

圖片圖片

也可以選擇跳過這個步驟,到 Higress 的控制臺進行配置對應供應商的 API Key:

圖片圖片

配置后,就可以直接使用了,例如使用 OpenAI 的 SDK:

import json
from openai import OpenAI

client = OpenAI(
    api_key=xxxxx, # ?? 可以通過 Higress 生成消費者 Key 實現(xiàn) API Key 的二次分租
    base_url="http://127.0.0.1:8080/v1"
)

completion = client.chat.completions.create(
    model="deepseek-chat", # ?? 可以填寫任意模型名稱,Higress 會根據(jù)模型名稱路由到對應的 LLM 供應商
    messages=[
        {"role": "user", "content": "你好"}
    ],
    stream=True
)

for chunk in completion:
    print(chunk.choices[0].delta)

可以在監(jiān)控面板看到每個模型,以及每個消費者的 token 消耗情況以及調用延時:

圖片圖片

參考鏈接

  • Higress:https://github.com/alibaba/higress
  • OneAPI:https://github.com/songquanpeng/one-api
責任編輯:武曉燕 來源: Se7en的架構筆記
相關推薦

2023-09-14 22:57:52

2010-04-26 13:48:17

iPhone OSiOSWindows Pho

2010-03-09 19:39:37

python程序調試

2017-04-13 15:15:17

Netflix ZuuNginx性能

2010-02-03 15:11:53

C++內存區(qū)域

2009-11-06 17:10:34

ChromeFirefox功能對比

2010-09-14 13:10:36

2015-07-13 10:07:43

Java.NET

2011-08-05 13:21:18

VistaLeopard

2009-03-16 12:10:02

Windows 7微軟對比

2010-07-19 09:01:54

.NET 4.0緩存

2013-03-22 13:31:52

App制作工具非編程

2014-09-24 19:47:24

App研發(fā)監(jiān)控

2024-04-22 07:28:56

Higress云原生網關

2025-01-02 14:10:41

2011-10-11 11:14:17

筆記本評測

2017-11-21 15:50:09

FlinkStorm性能

2012-09-24 10:07:56

微軟虛擬化

2021-06-28 10:09:59

架構網關技術
點贊
收藏

51CTO技術棧公眾號