自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<button id="nesul"></button>

<sup id="nesul"></sup>

<center id="nesul"></center>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

大數(shù)據(jù)實時分析：Flink中的Table API

作者：demo123567 2024-06-06 08:58:08

大數(shù)據(jù) 數(shù)據(jù)分析

雖然大多數(shù)基于 Flink SQL 的在線編輯和任務(wù)執(zhí)行引擎都是通過 Table API 實現(xiàn)的，但還有其他方法可以實現(xiàn)類似的功能，包括直接使用 SQL API、Flink SQL CLI、REST API、Flink Dashboard 和 Flink SQL Gateway 等。

TableAPI

Apache Flink 的 Table API 是一個統(tǒng)一的關(guān)系式 API，適用于流處理和批處理。它提供了一種高級別的、聲明式的方式來處理數(shù)據(jù)流和批量數(shù)據(jù)，使得數(shù)據(jù)處理變得更加直觀和簡潔。Table API 和 SQL API 緊密集成，可以相互轉(zhuǎn)換，提供了強大的靈活性和功能。

Table API 的主要特性

統(tǒng)一的批處理和流處理

Table API 支持批處理和流處理，可以對動態(tài)數(shù)據(jù)流和靜態(tài)數(shù)據(jù)集使用相同的 API。

聲明式查詢

用戶可以使用類似 SQL 的語法編寫查詢，而不需要關(guān)注底層的執(zhí)行細(xì)節(jié)。

多種數(shù)據(jù)源和目標(biāo)

支持多種數(shù)據(jù)源和數(shù)據(jù)匯，包括 Kafka、文件系統(tǒng)、JDBC、Elasticsearch 等。

與 SQL 集成

可以在 Table API 中使用 SQL 查詢，或者將 Table API 查詢結(jié)果轉(zhuǎn)換為 SQL 查詢。

基本使用流程

設(shè)置執(zhí)行環(huán)境

創(chuàng)建 StreamExecutionEnvironment 或 ExecutionEnvironment 作為基礎(chǔ)環(huán)境。
創(chuàng)建 StreamTableEnvironment 或 TableEnvironment 進行 Table API 操作。

定義表

通過連接器定義源表和目標(biāo)表。

編寫查詢

使用 Table API 編寫查詢，包括過濾、選擇、聚合、連接等操作。

執(zhí)行查詢

將查詢結(jié)果寫入目標(biāo)表，或者直接觸發(fā)查詢執(zhí)行。

示例代碼

以下是一個基本的 Flink Table API 示例，包括設(shè)置環(huán)境、定義表和執(zhí)行查詢。

// 設(shè)置執(zhí)行環(huán)境
StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
StreamTableEnvironment tableEnv = StreamTableEnvironment.create(env);
// 定義 Kafka 源表
String sourceDDL = "CREATE TABLE kafka_source ("
        + " user_id STRING,"
        + " action STRING,"
        + " timestamp TIMESTAMP(3),"
        + " WATERMARK FOR timestamp AS timestamp - INTERVAL '5' SECOND"
        + ") WITH ("
        + " 'connector' = 'kafka',"
        + " 'topic' = 'input_topic',"
        + " 'properties.bootstrap.servers' = 'localhost:9092',"
        + " 'format' = 'json'"
        + ")";
tableEnv.executeSql(sourceDDL);
// 定義 Kafka 目標(biāo)表
String sinkDDL = "CREATE TABLE kafka_sink ("
        + " user_id STRING,"
        + " action STRING,"
        + " action_count BIGINT,"
        + " window_start TIMESTAMP(3),"
        + " window_end TIMESTAMP(3)"
        + ") WITH ("
        + " 'connector' = 'kafka',"
        + " 'topic' = 'output_topic',"
        + " 'properties.bootstrap.servers' = 'localhost:9092',"
        + " 'format' = 'json'"
        + ")";
tableEnv.executeSql(sinkDDL);
// 使用 Table API 進行查詢
Table result = tableEnv
    .from("kafka_source")
    .window(Tumble.over(lit(10).minutes()).on($("timestamp")).as("w"))
    .groupBy($("w"), $("user_id"))
    .select(
        $("user_id"),
        $("action"),
        $("w").start().as("window_start"),
        $("w").end().as("window_end"),
        $("action").count().as("action_count")
    );
// 將查詢結(jié)果寫入目標(biāo)表
result.executeInsert("kafka_sink");

Table API 常用操作

選擇（Select）

Table result = tableEnv.from("kafka_source")
                         .select($("user_id"), $("action"), $("timestamp"));

過濾（Filter）

Table filtered = tableEnv.from("kafka_source")
                            .filter($("action").isEqual("purchase"));

聚合（Aggregation）

Table aggregated = tableEnv.from("kafka_source")
                              .groupBy($("user_id"))
                              .select($("user_id"), $("action").count().as("action_count"));

連接（Join）

Table joined = tableEnv.from("kafka_source")
                          .join(tableEnv.from("another_table"))
                          .where($("kafka_source.user_id").isEqual($("another_table.user_id")))
                          .select($("kafka_source.user_id"), $("kafka_source.action"), $("another_table.info"));

窗口操作（Windowing）

Table windowed = tableEnv.from("kafka_source")
                            .window(Tumble.over(lit(10).minutes()).on($("timestamp")).as("w"))
                            .groupBy($("w"), $("user_id"))
                            .select($("user_id"), $("w").start().as("window_start"), $("w").end().as("window_end"), $("action").count().as("action_count"));

總結(jié)

Flink 的 Table API 提供了一種聲明式的、類似 SQL 的方式來進行數(shù)據(jù)流和批處理。它使用戶能夠使用高層次的查詢語言進行數(shù)據(jù)處理，而不需要關(guān)心底層的實現(xiàn)細(xì)節(jié)。通過與 SQL 的緊密集成，Table API 既保留了 SQL 的易用性，又提供了更強大的編程靈活性，是構(gòu)建 Flink 應(yīng)用的強大工具。

使用Table API調(diào)用完整的分析SQL

使用 Flink 的 Table API 可以調(diào)用和執(zhí)行完整的 Flink SQL 查詢。Flink 提供了將 SQL 查詢嵌入到 Table API 中的方法，使得用戶可以在程序中編寫和執(zhí)行 SQL 語句。

下面是一個完整的示例，演示如何使用 Table API 調(diào)用和執(zhí)行從 Kafka 讀取數(shù)據(jù)、進行分析并將結(jié)果寫回 Kafka 的 Flink SQL 查詢。

步驟：

設(shè)置執(zhí)行環(huán)境。
定義 Kafka 源表和目標(biāo)表。
編寫和執(zhí)行 SQL 查詢。
將結(jié)果寫入目標(biāo)表。

示例代碼：

import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.table.api.*;
import org.apache.flink.table.api.bridge.java.StreamTableEnvironment;
public class FlinkSqlExample {
    public static void main(String[] args) {
        // 設(shè)置執(zhí)行環(huán)境
        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
        StreamTableEnvironment tableEnv = StreamTableEnvironment.create(env);
        // 定義 Kafka 源表
        String sourceDDL = "CREATE TABLE kafka_source ("
                + " user_id STRING,"
                + " action STRING,"
                + " timestamp TIMESTAMP(3),"
                + " WATERMARK FOR timestamp AS timestamp - INTERVAL '5' SECOND"
                + ") WITH ("
                + " 'connector' = 'kafka',"
                + " 'topic' = 'input_topic',"
                + " 'properties.bootstrap.servers' = 'localhost:9092',"
                + " 'format' = 'json'"
                + ")";
        tableEnv.executeSql(sourceDDL);
        // 定義 Kafka 目標(biāo)表
        String sinkDDL = "CREATE TABLE kafka_sink ("
                + " user_id STRING,"
                + " action_count BIGINT,"
                + " window_start TIMESTAMP(3),"
                + " window_end TIMESTAMP(3)"
                + ") WITH ("
                + " 'connector' = 'kafka',"
                + " 'topic' = 'output_topic',"
                + " 'properties.bootstrap.servers' = 'localhost:9092',"
                + " 'format' = 'json'"
                + ")";
        tableEnv.executeSql(sinkDDL);
        // 編寫 SQL 查詢
        String query = "INSERT INTO kafka_sink "
                + "SELECT "
                + " user_id, "
                + " COUNT(action) AS action_count, "
                + " TUMBLE_START(timestamp, INTERVAL '10' MINUTE) AS window_start, "
                + " TUMBLE_END(timestamp, INTERVAL '10' MINUTE) AS window_end "
                + "FROM kafka_source "
                + "GROUP BY "
                + " user_id, "
                + " TUMBLE(timestamp, INTERVAL '10' MINUTE)";
        // 執(zhí)行 SQL 查詢
        tableEnv.executeSql(query);
    }
}

詳細(xì)說明：

設(shè)置執(zhí)行環(huán)境

創(chuàng)建 StreamExecutionEnvironment 和 StreamTableEnvironment，用于流處理和 Table API 操作。

定義 Kafka 源表

使用 CREATE TABLE 語句定義源表 kafka_source，指定數(shù)據(jù)的字段和數(shù)據(jù)源的連接配置。

定義 Kafka 目標(biāo)表

使用 CREATE TABLE 語句定義目標(biāo)表 kafka_sink，指定數(shù)據(jù)的字段和數(shù)據(jù)匯的連接配置。

編寫 SQL 查詢

編寫一個 SQL 查詢，將源表的數(shù)據(jù)進行窗口聚合，計算每個用戶在10分鐘窗口內(nèi)的操作次數(shù)。

執(zhí)行 SQL 查詢

使用 tableEnv.executeSql(query) 執(zhí)行 SQL 查詢，將結(jié)果寫入目標(biāo)表。

總結(jié)

通過使用 Flink 的 Table API，可以在 Java 程序中嵌入和執(zhí)行完整的 Flink SQL 查詢。這種方式結(jié)合了 SQL 的聲明式編程和 Table API 的靈活性，使得開發(fā)復(fù)雜的流處理和批處理應(yīng)用變得更加簡潔和高效。

Table API的應(yīng)用

目前市面上很多基于 Flink SQL 的在線編輯和任務(wù)執(zhí)行引擎主要是通過 Flink 的 Table API 實現(xiàn)的。通過 Table API，用戶可以在運行時動態(tài)地解析和執(zhí)行 SQL 查詢。這種方法提供了靈活性和高效性，使得在交互式環(huán)境中執(zhí)行流式和批處理查詢變得非常方便。

基于 Table API 實現(xiàn)的在線編輯任務(wù)執(zhí)行引擎

Flink 的 Table API 是一個高級別的 API，可以輕松地將 SQL 查詢轉(zhuǎn)換為 Flink 程序，并且在執(zhí)行環(huán)境中運行這些程序。這使得許多在線 SQL 編輯器和執(zhí)行引擎可以動態(tài)地接受用戶輸入的 SQL 查詢，并將其轉(zhuǎn)換為 Flink 的作業(yè)進行執(zhí)行。

其他方法

除了使用 Table API，還有其他幾種方法可以實現(xiàn)基于 Flink SQL 的在線編輯任務(wù)執(zhí)行：

直接使用 SQL API

Flink 的 SQL API 允許直接編寫 SQL 查詢，并在執(zhí)行環(huán)境中運行這些查詢。SQL API 和 Table API 是緊密集成的，很多情況下是可以互換使用的。

Flink SQL CLI

Flink 提供了一個命令行工具（SQL CLI），可以用于交互式地執(zhí)行 SQL 查詢。這適用于需要手動輸入 SQL 并立即查看結(jié)果的場景。

REST API

使用 Flink 提供的 REST API，可以將 SQL 查詢提交到 Flink 集群進行執(zhí)行。通過自定義的 Web 界面或應(yīng)用程序，用戶可以在線編輯和提交 SQL 查詢到 Flink 集群。
自定義的 REST 服務(wù)可以解析用戶輸入的 SQL，調(diào)用 Flink 的 REST API 提交作業(yè)，并將結(jié)果返回給用戶。

Flink Dashboard

Flink 的 Web Dashboard 提供了一些交互式功能，可以查看和管理作業(yè)狀態(tài)。雖然不直接支持 SQL 編輯和執(zhí)行，但可以集成其他工具以實現(xiàn)此功能。

Flink SQL Gateway

Flink SQL Gateway 是一個面向 SQL 的接口層，允許用戶通過 JDBC 或 REST API 提交 SQL 查詢。SQL Gateway 可以作為一個中間層，解析用戶的 SQL 查詢，并將其轉(zhuǎn)換為 Flink 作業(yè)進行執(zhí)行。

示例：使用 REST API 提交 SQL 查詢

假設(shè)我們有一個自定義的 Web 應(yīng)用，用戶可以在界面上輸入 SQL 查詢，并提交到 Flink 集群執(zhí)行。以下是一個簡單的 REST 服務(wù)示例，展示如何通過 REST API 提交 SQL 查詢：

import org.springframework.web.bind.annotation.*;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.http.ResponseEntity;
import org.springframework.web.client.RestTemplate;
import java.util.HashMap;
import java.util.Map;
@RestController
@RequestMapping("/flink-sql")
public class FlinkSqlController {
    @Autowired
    private RestTemplate restTemplate;
    @PostMapping("/execute")
    public ResponseEntity<String> executeSql(@RequestBody String sqlQuery) {
        String flinkUrl = "http://localhost:8081/v1/sql/execute";
        Map<String, String> request = new HashMap<>();
        request.put("statement", sqlQuery);
        ResponseEntity<String> response = restTemplate.postForEntity(flinkUrl, request, String.class);
        return ResponseEntity.ok(response.getBody());
    }
}

在這個示例中，我們創(chuàng)建了一個簡單的 Spring Boot REST 服務(wù)，允許用戶通過 POST 請求提交 SQL 查詢，并將其轉(zhuǎn)發(fā)到 Flink 集群進行執(zhí)行。

總結(jié)

雖然大多數(shù)基于 Flink SQL 的在線編輯和任務(wù)執(zhí)行引擎都是通過 Table API 實現(xiàn)的，但還有其他方法可以實現(xiàn)類似的功能，包括直接使用 SQL API、Flink SQL CLI、REST API、Flink Dashboard 和 Flink SQL Gateway 等。這些方法各有優(yōu)劣，可以根據(jù)具體需求選擇合適的方案。

責(zé)任編輯：武曉燕來源：海燕技術(shù)棧

大數(shù)據(jù)SQL API

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營