自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

在瀏覽器中使用TensorFlow.js和Python構(gòu)建機(jī)器學(xué)習(xí)模型

開(kāi)發(fā) 前端 后端 機(jī)器學(xué)習(xí)
本文首先介紹了TensorFlow.js的重要性及其組件,并介紹使用其在瀏覽器中構(gòu)建機(jī)器學(xué)習(xí)模型的方法。然后,構(gòu)建使用計(jì)算機(jī)的網(wǎng)絡(luò)攝像頭檢測(cè)身體姿勢(shì)的應(yīng)用程序。

概述

  •  TensorFlow.js (deeplearn.js)使我們能夠在瀏覽器中構(gòu)建機(jī)器學(xué)習(xí)和深度學(xué)習(xí)模型,而無(wú)需任何復(fù)雜的安裝步驟。
  •  TensorFlow.js的兩個(gè)組件——Core API和Layer API。
  •  了解如何構(gòu)建一個(gè)很棒的使用Tensorflow.js對(duì)網(wǎng)絡(luò)攝像頭中的圖像進(jìn)行分類(lèi)的模型。

介紹

你喜歡用什么工具來(lái)編寫(xiě)機(jī)器學(xué)習(xí)模型?數(shù)據(jù)科學(xué)家們對(duì)這個(gè)永恒的問(wèn)題會(huì)給出各種不同的答案。一些人喜歡RStudio,另一些人更喜歡Jupyter Notebooks。我絕對(duì)屬于后者。

所以,當(dāng)我第一次遇到TensorFlow.js(以前是deeplearn.js)時(shí),我的心都要炸開(kāi)了。在瀏覽器中構(gòu)建機(jī)器學(xué)習(xí)模型?使用JavaScript?聽(tīng)起來(lái)好得令人難以置信!

超過(guò)43億人使用網(wǎng)絡(luò)瀏覽器——約占世界人口的55%。——維基百科(2019年3月)

谷歌的TensorFlow.js不僅將機(jī)器學(xué)習(xí)引入瀏覽器中,使機(jī)器學(xué)習(xí)大眾化,而且對(duì)于經(jīng)常使用JavaScript的開(kāi)發(fā)人員來(lái)說(shuō),它也是一個(gè)完美的機(jī)器學(xué)習(xí)門(mén)戶。

[[271482]]

我們的網(wǎng)絡(luò)瀏覽器是最容易訪問(wèn)的平臺(tái)之一。這就是為什么構(gòu)建不僅能夠訓(xùn)練機(jī)器學(xué)習(xí)模型而且能夠在瀏覽器本身中“學(xué)習(xí)”或“遷移學(xué)習(xí)”的應(yīng)用程序是有意義的。

在本文中,我們將首先了解使用TensorFlow.js的重要性及其它的不同組件。然后,我們將深入討論使用TensorFlow.js在瀏覽器中構(gòu)建我們自己的機(jī)器學(xué)習(xí)模型。然后我們將構(gòu)建一個(gè)應(yīng)用程序,來(lái)使用計(jì)算機(jī)的網(wǎng)絡(luò)攝像頭檢測(cè)你的身體姿勢(shì)!

如果你是TensorFlow的新手,你可以在下面文章中了解更多:

  •  TensorFlow 101: Understanding Tensors and Graphs to get you Started with Deep Learning
  •  Introduction to Implementing Neural Networks using TensorFlow

目錄

一、為什么你應(yīng)該使用TensorFlow.js?

1.1 使用網(wǎng)絡(luò)攝像頭在瀏覽器中進(jìn)行圖像分類(lèi)

1.2 TensorFlow.js的特征

二、了解瀏覽器中的機(jī)器學(xué)習(xí)

2.1 Core API:使用Tensors工作

2.2 Layer API:像Keras一樣構(gòu)建模型

三、利用谷歌的預(yù)訓(xùn)練模型:PoseNet

一、為什么要使用TensorFlow.js?

我將用一種獨(dú)特的方法來(lái)回答這個(gè)問(wèn)題。我不會(huì)深入研究TensorFlow.js的理論方面,也不會(huì)列出它為什么是一個(gè)如此不可思議的工具。

相反,我將簡(jiǎn)單地向你展示如果不使用TensorFlow.js將會(huì)錯(cuò)過(guò)什么。那么,讓我們?cè)?分鐘內(nèi)構(gòu)建一個(gè)應(yīng)用程序,來(lái)使用你的網(wǎng)絡(luò)攝像頭對(duì)圖像進(jìn)行分類(lèi)。沒(méi)錯(cuò)——我們將直接進(jìn)入代碼部分!

這是最好的部分——你不需要安裝任何東西來(lái)做這個(gè)!只要一個(gè)文本編輯器和一個(gè)網(wǎng)絡(luò)瀏覽器即可。下面的動(dòng)圖展示了我們將要構(gòu)建的應(yīng)用程序:

 

在瀏覽器中使用TensorFlow.js和Python構(gòu)建機(jī)器學(xué)習(xí)模型

這多酷?。∥以跒g覽器里幾分鐘就完成了。那么,讓我們看一下步驟和代碼,以幫助你在Web瀏覽器中構(gòu)建自己的圖像分類(lèi)模型。

1.1 使用網(wǎng)絡(luò)攝像頭在瀏覽器中構(gòu)建圖像分類(lèi)模型

打開(kāi)你選擇的文本編輯器并創(chuàng)建一個(gè)文件index.html。將以下代碼保存于此文件內(nèi): 

  1. <!DOCTYPE html>   
  2. <html>   
  3. <head>   
  4.  <meta charset="UTF-8">   
  5.  <meta http-equiv="X-UA-Compatible" content="IE=edge">   
  6.  <meta name="viewport" content="width=device-width, initial-scale=1">   
  7.  <!-- title of the page -->   
  8.  <title>image_classification</title>   
  9.  <!-- load processing library-->   
  10.  <script src="https://cdnjs.cloudflare.com/ajax/libs/p5.js/0.8.0/p5.min.js"></script>   
  11.  <script src="https://cdnjs.cloudflare.com/ajax/libs/p5.js/0.8.0/addons/p5.dom.min.js"></script>   
  12.  <!-- load ml5.js -->   
  13.  <script src="https://unpkg.com/ml5@0.1.1/dist/ml5.min.js"></script>   
  14.  <!-- load index.js -->   
  15.  <script src="index.js"></script>   
  16. </head>   
  17. <body>   
  18.  <!-- this is where the video will be shown -->   
  19.  <video id="video"></video>   
  20. </body>   
  21. </html>  

接下來(lái),創(chuàng)建另一個(gè)文件index.js并在其中編寫(xiě)以下代碼: 

  1.  let mobilenet;   
  2.  let video;   
  3.  let label = '';   
  4.  // when model is ready make predictions   
  5.  function modelReady() {   
  6.  console.log('Model is ready!!!');   
  7.  mobilenet.predict(gotResults);   
  8.  }   
  9. function gotResults(error, results) {   
  10.  if (error) {   
  11.  console.error(error);   
  12.  } else {   
  13.  label = results[0].className;   
  14.  // loop the inference by calling itself   
  15.  mobilenet.predict(gotResults);   
  16.  }   
  17. }   
  18. // setup function   
  19. function setup() {   
  20.  createCanvas(640, 550);   
  21.  // ml5 to create video capture   
  22.  video = createCapture(VIDEO);   
  23.  video.hide();   
  24.  background(0);   
  25.  // load the MobileNet and apply it on video feed   
  26.  mobilenet = ml5.imageClassifier('MobileNet', video, modelReady);   
  27. }   
  28. function draw() {   
  29.  background(0);   
  30.  // show video   
  31.  image(video, 0, 0);   
  32.  fill(255);   
  33.  textSize(32);   
  34.  // show prediction label   
  35.  text(label, 10, height - 20);   
  36. }  

保存這兩個(gè)文件,然后在谷歌Chrome或Mozilla Firefox等瀏覽器中打開(kāi)index.html文件。就是這樣!你現(xiàn)在已經(jīng)創(chuàng)建了一個(gè)可以使用你的網(wǎng)絡(luò)攝像頭在瀏覽器本身實(shí)時(shí)分類(lèi)圖像的應(yīng)用程序!下面是它在我的計(jì)算機(jī)上的樣子:

視頻連接:   

  1. https://s3-ap-south-1.amazonaws.com/av-blog-media/wp-content/uploads/2019/05/mobilenet_demo.mp4?_=1 

在這個(gè)例子中需要注意的要點(diǎn):

  •  在上面的例子中,我們使用了一個(gè)預(yù)先訓(xùn)練的圖像分類(lèi)模型MobileNet(https://ai.googleblog.com/2017/06/mobilenets-open-source-models-for.html)
  •  我們使用ml5.js(https://ml5js.org/)一個(gè)構(gòu)建在TensorFlow之上的庫(kù)。它將MobileNet模型加載到瀏覽器中,并對(duì)視頻提要執(zhí)行推理。
  •  我們還利用P5.js(https://p5js.org/)庫(kù)來(lái)處理視頻輸入并在視頻本身上顯示標(biāo)簽。

我不需要在電腦上安裝任何東西。這個(gè)例子應(yīng)該適用于任何現(xiàn)代系統(tǒng),不管它是Linux、Windows還是MacOS——這就是使用JavaScript在web上構(gòu)建模型的強(qiáng)大功能。

現(xiàn)在,讓我們看看TensorFlow.js提供的強(qiáng)大功能,以及如何利用它們?cè)跒g覽器中部署機(jī)器學(xué)習(xí)模型。

1.2 TensorFlow.js的特征

TensorFlow.js是一個(gè)庫(kù),用于JavaScript開(kāi)發(fā)和訓(xùn)練ML模型,并在瀏覽器或Node.js上部署。

TensorFlow.js提供了許多的功能來(lái)供我們使用。

它是TensorFlow在JavaScript中的擴(kuò)展,JavaScript是我們?cè)诨ヂ?lián)網(wǎng)上使用的幾乎所有網(wǎng)站、瀏覽器或應(yīng)用程序邏輯背后的編程語(yǔ)言。JavaScript和Python一樣用途廣泛,所以使用它來(lái)開(kāi)發(fā)機(jī)器學(xué)習(xí)模型給我們帶來(lái)了很多好處:

    如果ML模型是用web語(yǔ)言編寫(xiě)的,則更容易部署。

  •  由于所有主流瀏覽器都支持JavaScript,所以你可以無(wú)處不在地使用它,而不必?fù)?dān)心平臺(tái)類(lèi)型或其他兼容性問(wèn)題。對(duì)于你的用戶也是如此。
  •  TensorFlow.js是一個(gè)客戶端庫(kù),這意味著它可以在用戶的瀏覽器中訓(xùn)練或運(yùn)行ML模型。這減輕了與數(shù)據(jù)隱私有關(guān)的任何擔(dān)憂。
  •  在你的客戶端上運(yùn)行實(shí)時(shí)推斷可使你的應(yīng)用程序更具交互性,因?yàn)樗鼈兛梢粤⒓错憫?yīng)用戶輸入(例如我們前面構(gòu)建的webcam應(yīng)用程序)。

TensorFlow.js以其當(dāng)前的形式提供了以下主要功能:

  •  瀏覽器中的機(jī)器學(xué)習(xí):你可以使用TensorFlow.js在瀏覽器中創(chuàng)建和訓(xùn)練ML模型。
  •  谷歌的預(yù)訓(xùn)練模型:TensorFlow.js配備了一套由谷歌預(yù)訓(xùn)練的模型,用于對(duì)象檢測(cè)、圖像分割、語(yǔ)音識(shí)別、文本毒性分類(lèi)等任務(wù)。
  •  遷移學(xué)習(xí):你可以通過(guò)對(duì)已經(jīng)訓(xùn)練過(guò)的模型的部分進(jìn)行再訓(xùn)練來(lái)執(zhí)行轉(zhuǎn)移學(xué)習(xí),比如TensorFlow.js中的MobileNet。
  •  部署python模型:使用Keras或TensorFlow訓(xùn)練的模型可以很容易地導(dǎo)入瀏覽器/使用TensorFlow.js的部署。

在本文中,我們將關(guān)注前兩個(gè)功能。在本系列的第二部分(即將推出!)中,我們將討論如何在Python中轉(zhuǎn)移學(xué)習(xí)和部署我們的模型。

二、瀏覽器中的機(jī)器學(xué)習(xí)

TensorFlow.js提供了兩種方法來(lái)訓(xùn)練模型(非常類(lèi)似于TensorFlow):

  •  第一種方法是使用Core API使用低級(jí)張量操作來(lái)定義模型。
  •  第二種方法是使用Layers API定義模型,類(lèi)似于Keras。

讓我們通過(guò)幾個(gè)例子來(lái)理解這兩種方法。畢竟,學(xué)習(xí)一個(gè)概念最好的方法就是把它付諸實(shí)踐!

首先,設(shè)置你的HTML文件:

在你的電腦上建立一個(gè)新的index.html文件,并在其中編寫(xiě)以下代碼: 

  1. <html lang="en">  
  2. <head>  
  3.  <meta charset="UTF-8">  
  4.  <meta name="viewport" content="width=device-width, initial-scale=1.0">  
  5.  <meta http-equiv="X-UA-Compatible" content="ie=edge">  
  6.  <!-- load Tensorflow.js -->  
  7.  <script src="https://cdn.jsdelivr.net/npm/@tensorflow/tfjs@1.0.0/dist/tf.min.js"></script>  
  8. </head>  
  9. <body>  
  10.  <h1>Tensorflow.js Core API</h1>  
  11.  <!-- <script src="index.js"></script> -->  
  12.  <script type="text/javascript">  
  13. </script>  
  14. </body>  
  15. </html> 

我們創(chuàng)建了一個(gè)基本的HTML頁(yè)面,并從云URL中加載了Tensorflow.js(第7行)。

關(guān)于安裝TensorFlow.js(deeplearn.js)的說(shuō)明:

由于TensorFlow.js是為瀏覽器而設(shè)計(jì)的,所以安裝和使用TensorFlow.js最簡(jiǎn)單的方法就是根本不安裝它。你可以簡(jiǎn)單地從HTML中的URL加載它即可。

如果你想在本地工作怎么辦呢?實(shí)際上,你可以在Jupyter Notebook中使用TensorFlow.js,就像你在Python或R中通常做的那樣。這是一個(gè)適合每個(gè)人的解決方案!

這種本地方法稍微長(zhǎng)一些,并且需要一些時(shí)間,所以本文不會(huì)使用它。如果你確實(shí)想學(xué)習(xí)如何操作,可以從為Jupyter安裝ijavascript內(nèi)核開(kāi)始。下面是我的Jupyter Notebook的截圖:

現(xiàn)在,使用TensorFlow.js的推薦方法是使用庫(kù)的官方URL直接加載它。你只需將以下行添加到HTML文件中: 

  1. <scriptsrcscriptsrc="https://cdn.jsdelivr.net/npm/@tensorflow/tfjs@1.0.0/dist/tf.min.js"></script> 

完成了!這真的很簡(jiǎn)單。

2.1 Core API:使用Tensors工作

Core API與TensorFlowCore非常相似,我們可以使用低級(jí)張量運(yùn)算和線性代數(shù)定義模型。

如果我們想要構(gòu)建自定義模型或想要從頭開(kāi)始構(gòu)建神經(jīng)網(wǎng)絡(luò),這非常有用。讓我們舉一個(gè)在瀏覽器中使用張量的例子。

首先在index.html文件中的<script> </ script>標(biāo)記之間添加以下代碼: 

  1. const a = tf.tensor([1, 2, 3, 4]);  
  2. const b = tf.tensor([10, 20, 30, 40]);  
  3. const y = a.add(b); // equivalent to tf.add(a, b)  
  4. const z = a.mul(b);  
  5. y.print();  
  6. z.print(); 

<script>標(biāo)簽基本上表示JavaScript。我們?cè)谶@些標(biāo)簽之間寫(xiě)的任何內(nèi)容都將作為JavaScript代碼執(zhí)行。以下是index.html現(xiàn)在的樣子: 

  1. <html lang="en">  
  2. <head>  
  3.  <meta charset="UTF-8">  
  4.  <meta name="viewport" content="width=device-width, initial-scale=1.0">  
  5.  <meta http-equiv="X-UA-Compatible" content="ie=edge">  
  6.  <!-- load Tensorflow.js -->  
  7.  <script src="https://cdn.jsdelivr.net/npm/@tensorflow/tfjs@1.0.0/dist/tf.min.js"></script>  
  8. </head>  
  9. <body>  
  10.  <h1>Tensorflow.js Core API</h1>  
  11.  <!-- <script src="index.js"></script> -->  
  12.  <script type="text/javascript">  
  13.  const a = tf.tensor([1, 2, 3, 4]);  
  14.  const b = tf.tensor([10, 20, 30, 40]);  
  15.  const y = a.add(b); // equivalent to tf.add(a, b)  
  16.  const z = a.mul(b); // equivalent to tf.mul(a, b)  
  17.  y.print();  
  18.  z.print();  
  19. </script>  
  20. </body>  
  21. </html> 

在上面的代碼中,我們?cè)趦蓚€(gè)張量a和b上執(zhí)行基本的加法和乘法運(yùn)算,并將結(jié)果打印在瀏覽器中?,F(xiàn)在,轉(zhuǎn)到終端,打開(kāi)項(xiàng)目文件夾,然后使用以下命令啟動(dòng)Python服務(wù)器: 

  1. python3 -m http.server 

然后在你的瀏覽器打開(kāi)以下地址: 

  1. http://localhost:8000/ 

當(dāng)你看到一個(gè)頁(yè)面顯示“Tensorflow.js Core API”時(shí),使用Ctrl+Shift+I鍵打開(kāi)控制臺(tái)(console)。這應(yīng)該在Chrome和Firefox都適用。我們?cè)诳刂婆_(tái)得到上述操作的輸出:

如果你想深入閱讀有關(guān)Core API的更多信息,那么我建議你閱讀CoreAPI官方文檔。

CoreAPI文檔:   

  1. https://www.tensorflow.org/js/guide/tensors_operations 

2.2 Layer API:像Keras一樣構(gòu)建模型

Layers API與Python中的Keras非常相似。就像Keras一樣,你可以使用序列的和函數(shù)的方法創(chuàng)建模型。

讓我們通過(guò)一個(gè)例子仔細(xì)研究序列方法。我們將在這些數(shù)據(jù)點(diǎn)上訓(xùn)練回歸模型:

這里,X和Y有一個(gè)線性關(guān)系——每個(gè)Y對(duì)應(yīng)于X + i(其中i是0、1、2、3……n+1)。讓我們?cè)谶@個(gè)數(shù)據(jù)集上訓(xùn)練一個(gè)基本的回歸模型。你可以在index.html文件中的<script></script>標(biāo)記之間編寫(xiě)以下代碼: 

  1. const callbacks = {  
  2.  onEpochEnd: async (epoch, logs) => {  
  3.  console.log("epoch: " + epoch + JSON.stringify(logs))  
  4.  }  
  5.  };  
  6.  // Generate some synthetic data for training.  
  7.  const xs = tf.tensor2d([[1], [2], [3], [4]], [4, 1]);  
  8.  const ys = tf.tensor2d([[1], [3], [5], [7]], [4, 1]);  
  9.  // Build and compile model.  
  10.  async function basicRegression(){  
  11.  // Build a sequential model  
  12.  const model = tf.sequential();  
  13.  model.add(tf.layers.dense({units: 1, inputShape: [1]}));  
  14.  model.add(tf.layers.dense({units: 1, inputShape: [1]}));  
  15.  model.compile({optimizer: 'sgd', loss: 'meanSquaredError'});  
  16.  // Train model with fit().  
  17.  await model.fit(xs, ys, {epochs: 100, validationSplit: 0.1, callbacks: callbacks});  
  18.  // Run inference with predict().  
  19.  model.predict(tf.tensor2d([[5]], [1, 1])).print();  
  20.  }  
  21.  // Create a basic regression model  
  22.  basicRegression(); 

敏銳的讀者一定注意到,上面的語(yǔ)法與用Python構(gòu)建順序模型的Keras語(yǔ)法非常相似。我們回到瀏覽器控制臺(tái)(console)時(shí)會(huì)得到預(yù)測(cè)。

我們的簡(jiǎn)單回歸模型預(yù)測(cè)7.556,非常接近8的期望值。這是一個(gè)基本的例子,但我們可以清楚地看到,在瀏覽器中直接構(gòu)建機(jī)器學(xué)習(xí)模型是多么容易和有用。

TensorFlow.js能夠在瀏覽器中構(gòu)建機(jī)器學(xué)習(xí)和深度學(xué)習(xí)模型。它還自動(dòng)利用GPU(s)的強(qiáng)大功能,如果在你的系統(tǒng)模型訓(xùn)練期間可用。

下面是一些使用TensorFlow.js在一些標(biāo)準(zhǔn)數(shù)據(jù)集上訓(xùn)練的深度學(xué)習(xí)模型的例子:

你可以在tfjs-examples repository中瀏覽這些示例。

tfjs-examples repository: 

  1. https://github.com/tensorflow/tfjs-examples 

三、利用谷歌的預(yù)訓(xùn)練模型:PoseNet

TensorFlow.js提供了大量來(lái)自谷歌的預(yù)訓(xùn)練模型,用于許多有用的任務(wù),如目標(biāo)檢測(cè)、語(yǔ)音識(shí)別、圖像分割等。預(yù)先訓(xùn)練的模型的優(yōu)點(diǎn)是,我們可以使用它們而不需要任何重大的依賴(lài)關(guān)系或安裝,并且可以開(kāi)箱即用。

人們普遍預(yù)計(jì)谷歌將在未來(lái)幾個(gè)月推出更多模型。你可以在下面鏈接查看可用的預(yù)訓(xùn)練模型:

相關(guān)鏈接:   

  1. https://www.tensorflow.org/js/models 

我們將在本文中使用PoseNet。PoseNet是一種視覺(jué)模型,可以通過(guò)估計(jì)人體關(guān)鍵關(guān)節(jié)的位置來(lái)估計(jì)一個(gè)人在圖像或視頻中的姿勢(shì)。

PoseNet是如何工作的?

這是一個(gè)迷人的概念。姿勢(shì)估計(jì)是一種計(jì)算機(jī)視覺(jué)技術(shù),用于檢測(cè)圖像和視頻中的人物。例如,這可以幫助我們確定某人的肘部在圖像中出現(xiàn)的位置。

只是要清楚-姿勢(shì)估計(jì)不是關(guān)于識(shí)別誰(shuí)在一個(gè)圖像中。該算法只是簡(jiǎn)單地估計(jì)關(guān)鍵身體關(guān)節(jié)的位置。

檢測(cè)到的關(guān)鍵點(diǎn)設(shè)置為“Part”和“ID”索引,置信度得分在0.0和1.0之間(1.0是最高的)。

以下是PoseNet給出的輸出類(lèi)型的示例:

難以置信,對(duì)吧?!我們將使用ml5.js庫(kù)來(lái)使用PoseNet。ml5.js是一個(gè)基于TensorFlow.js和p5.js的庫(kù)。p5.js是另一個(gè)庫(kù)可以使你更容易在瀏覽器中訪問(wèn)網(wǎng)絡(luò)攝像頭。

ml5.js旨在使機(jī)器學(xué)習(xí)對(duì)廣大的藝術(shù)家,創(chuàng)意編碼員和學(xué)生來(lái)說(shuō)變得平易近人。該庫(kù)以TensorFlow.js為基礎(chǔ),通過(guò)簡(jiǎn)單的語(yǔ)法在瀏覽器中提供對(duì)機(jī)器學(xué)習(xí)算法和模型的訪問(wèn)。

例如,你可以使用ml5.js在5行代碼中使用MobileNet創(chuàng)建圖像分類(lèi)模型,如下所示:

正是由于Ml5.js的簡(jiǎn)單性,使得它非常適合在瀏覽器中快速構(gòu)建原型,這也是我們?cè)陧?xiàng)目中使用它的原因。

讓我們回到PoseNet。創(chuàng)建一個(gè)新文件index.html并添加以下代碼: 

  1. <html lang="en">  
  2. <head>  
  3.  <meta charset="UTF-8">  
  4.  <meta name="viewport" content="width=device-width, initial-scale=1.0">  
  5.  <meta http-equiv="X-UA-Compatible" content="ie=edge">  
  6.  <!-- load p5.js -->  
  7.  <script src="https://cdnjs.cloudflare.com/ajax/libs/p5.js/0.7.3/p5.min.js"></script>  
  8.  <script src="https://cdnjs.cloudflare.com/ajax/libs/p5.js/0.7.3/addons/p5.dom.min.js"></script>  
  9.  <!-- load ml5.js -->  
  10.  <script src="https://unpkg.com/ml5@0.2.3/dist/ml5.min.js" type="text/javascript"></script>  
  11.  <!-- keep the video in center of browser -->  
  12.  <style type="text/css">  
  13.  body{  
  14.  text-align: center;  
  15.  }  
  16. </style>  
  17. </head>  
  18. <body>  
  19.  <h1>PoseNet demo with Ml5.js</h1>  
  20.  <p id="status">Loading Model...</p>  
  21.  <div id="videoContainer"></div>  
  22.  <!-- load the posenet.js file -->  
  23.  <script src="posenet.js"></script>  
  24. </body>  
  25. </html> 

這將創(chuàng)建一個(gè)基本的HTML網(wǎng)頁(yè)并加載必要的文件。

  •  ml5.js和p5.js是通過(guò)其官方URL加載的。
  •  posenet.js是我們將編寫(xiě)用于使用PoseNet的代碼的文件。

現(xiàn)在,我們將編寫(xiě)用于使用PoseNet的JavaScript代碼。在與index.html相同的文件夾中創(chuàng)建一個(gè)新文件posenet.js。以下是完成此項(xiàng)工作所需的步驟:

  1.  加載PoseNet模型并從網(wǎng)絡(luò)攝像頭捕獲視頻
  2.  檢測(cè)身體關(guān)節(jié)的關(guān)鍵點(diǎn)
  3.  顯示檢測(cè)到的身體關(guān)節(jié)
  4.  繪制估計(jì)的身體骨骼

讓我們從第一步開(kāi)始。

步驟1:加載PoseNet模型并從網(wǎng)絡(luò)攝像頭捕獲視頻

我們將使用ml5.js加載PoseNet。與此同時(shí),p5.js使我們可以用幾行代碼從網(wǎng)絡(luò)攝像頭捕獲視頻: 

  1. let video;  
  2. let poseNet;  
  3. let poses = [];  
  4. function setup() {  
  5.  const canvas = createCanvas(640, 480);  
  6.  canvas.parent('videoContainer');  
  7.  // Video capture  
  8.  video = createCapture(VIDEO);  
  9.  video.size(width, height);  
  10.  // Create a new poseNet method with a single detection  
  11.  poseNet = ml5.poseNet(video, modelReady);  
  12.  // This sets up an event that fills the global variable "poses"  
  13.  // with an array every time new poses are detected  
  14.  poseNet.on('pose', function(results) {  
  15.  poses = results 
  16.  });  
  17.  function modelReady(){  
  18.  select('#status').html('model Loaded')  

以上代碼塊中最重要的是:

  •  createCapture(VIDEO):它是一個(gè)p5.js函數(shù),用于通過(guò)攝像頭捕獲視頻來(lái)創(chuàng)建視頻元素。
  •  ml5.poseNet(video,modelRead):我們使用ml5.js加載poseNet模式。通過(guò)傳入視頻,我們告訴模型處理視頻輸入。
  •  PoseNet.on():每當(dāng)檢測(cè)到一個(gè)新的姿勢(shì)時(shí),就執(zhí)行這個(gè)函數(shù)。
  •  modelReady():當(dāng)PoseNet完成加載時(shí),我們調(diào)用這個(gè)函數(shù)來(lái)顯示模型的狀態(tài)。

步驟2:檢測(cè)身體關(guān)節(jié)的關(guān)鍵點(diǎn)

下一步是檢測(cè)姿勢(shì)。你可能已經(jīng)注意到,在前面的步驟中,我們通過(guò)調(diào)用poseNet.on()將每個(gè)檢測(cè)到的位姿保存到pose變量中。這個(gè)函數(shù)在后臺(tái)連續(xù)運(yùn)行。無(wú)論何時(shí)找到一個(gè)新的姿勢(shì),它都會(huì)以以下格式給出身體關(guān)節(jié)的位置:

  •  'score'是指模型的置信度
  •  'part'表示檢測(cè)到的身體關(guān)節(jié)/關(guān)鍵點(diǎn)
  •  'position'包含檢測(cè)到的部分的x和y位置

我們不必為此部分編寫(xiě)代碼,因?yàn)樗亲詣?dòng)生成的。

步驟3:顯示檢測(cè)到的人體關(guān)節(jié)

我們知道被檢測(cè)到的人體關(guān)節(jié)及其x和y位置?,F(xiàn)在,我們只需要在視頻上畫(huà)出它們來(lái)顯示檢測(cè)到的人體關(guān)節(jié)。我們已經(jīng)看到,PoseNet給出了一個(gè)檢測(cè)到的人體關(guān)節(jié)列表,每個(gè)關(guān)節(jié)及其x和y位置的置信度評(píng)分。

我們將使用20%的閾值(keypoint.score > 0.2)置信度得分,以便繪制一個(gè)關(guān)鍵點(diǎn)。下面是實(shí)現(xiàn)這一操作的代碼: 

  1. // A function to draw ellipses over the detected keypoints  
  2. function drawKeypoints() {  
  3.  // Loop through all the poses detected  
  4.  for (let i = 0; i < poses.length; i++) {  
  5.  // For each pose detected, loop through all the keypoints  
  6.  let pose = poses[i].pose;  
  7.  for (let j = 0; j < pose.keypoints.length; j++) {  
  8.  // A keypoint is an object describing a body part (like rightArm or leftShoulder)  
  9.  let keypoint = pose.keypoints[j];  
  10.  // Only draw an ellipse is the pose probability is bigger than 0.2  
  11.  if (keypoint.score > 0.2) {  
  12.  fill(255, 0, 0);  
  13.  noStroke();  
  14.  ellipse(keypoint.position.x, keypoint.position.y, 10, 10);  
  15.  }  
  16.  }  
  17.  }  

步驟4:繪制估計(jì)的身體骨架

除了關(guān)鍵點(diǎn)或身體關(guān)節(jié),PoseNet還可以檢測(cè)估計(jì)的身體骨架。我們可以使用pose變量來(lái)繪制骨架: 

  1. // A function to draw the skeletons  
  2. function drawSkeleton() {  
  3.  // Loop through all the skeletons detected  
  4.  for (let i = 0; i < poses.length; i++) {  
  5.  let skeleton = poses[i].skeleton;  
  6.  // For every skeleton, loop through all body connections  
  7.  for (let j = 0; j < skeleton.length; j++) {  
  8.  let partA = skeleton[j][0];  
  9.  let partB = skeleton[j][1];  
  10.  stroke(255, 0, 0);  
  11.  line(partA.position.x, partA.position.y, partB.position.x, partB.position.y);  
  12.  }  
  13.  }  

在這里,我們遍歷檢測(cè)到的骨架并創(chuàng)建連接關(guān)鍵點(diǎn)的線。代碼還是相當(dāng)簡(jiǎn)單。

現(xiàn)在,最后一步是重復(fù)調(diào)用drawSkeleton()和drawKeypoints()函數(shù),以及我們從網(wǎng)絡(luò)攝像頭捕獲的視頻源。我們可以使用p5.js的draw()函數(shù)來(lái)實(shí)現(xiàn),該函數(shù)在setup()之后直接調(diào)用,并重復(fù)執(zhí)行: 

  1. function draw() {  
  2.  image(video, 0, 0, width, height);  
  3.  // We can call both functions to draw all keypoints and the skeletons  
  4.  drawKeypoints();  
  5.  drawSkeleton();  

接下來(lái),轉(zhuǎn)到終端窗口,進(jìn)入項(xiàng)目文件夾,然后啟動(dòng)Python服務(wù)器: 

  1. python3 -m http.server 

然后轉(zhuǎn)到你的瀏覽器并打開(kāi)以下地址: 

  1. http://localhost:8000/ 

瞧!你的PoseNet應(yīng)該很好地檢測(cè)到了你的身體姿勢(shì)(如果你已經(jīng)正確地遵循了所有步驟)。以下是我的模型的情況:

尾記

你可以看到我為什么喜歡TensorFlow.js。它非常有效率,甚至不需要你在構(gòu)建模型時(shí)擔(dān)心復(fù)雜的安裝步驟。

TensorFlow.js展示了通過(guò)將機(jī)器學(xué)習(xí)帶到瀏覽器中使機(jī)器學(xué)習(xí)更容易訪問(wèn)的許多前景。同時(shí),它還具有數(shù)據(jù)隱私、交互性等優(yōu)點(diǎn)。這種組合使得它成為數(shù)據(jù)科學(xué)家工具箱中的一個(gè)非常強(qiáng)大的工具,特別是如果你想部署你的機(jī)器學(xué)習(xí)應(yīng)用程序的話。

在下一篇文章中,我們將探討如何在瀏覽器中應(yīng)用遷移學(xué)習(xí),并使用TensorFlow.js部署機(jī)器學(xué)習(xí)或深度學(xué)習(xí)模型。

我們用PoseNet做的項(xiàng)目可以更進(jìn)一步,通過(guò)訓(xùn)練另一個(gè)分類(lèi)器來(lái)構(gòu)建一個(gè)姿態(tài)識(shí)別應(yīng)用程序。我鼓勵(lì)你去嘗試一下!    

 

責(zé)任編輯:龐桂玉 來(lái)源: 今日頭條
相關(guān)推薦

2022-12-27 10:35:20

TensorFlow

2020-09-09 07:00:00

TensorFlow神經(jīng)網(wǎng)絡(luò)人工智能

2018-09-10 14:38:16

編程語(yǔ)言TensorFlow.機(jī)器學(xué)習(xí)

2021-11-02 09:40:50

TensorFlow機(jī)器學(xué)習(xí)人工智能

2017-07-24 13:37:42

深度學(xué)習(xí)KerasTensorFlow

2017-07-07 14:41:13

機(jī)器學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)JavaScript

2011-05-18 09:30:40

Linux瀏覽器

2022-05-03 09:59:43

網(wǎng)絡(luò)釣魚(yú)數(shù)據(jù)集機(jī)器學(xué)習(xí)

2025-03-04 08:00:00

機(jī)器學(xué)習(xí)Rust開(kāi)發(fā)

2020-07-17 07:21:36

TensorFlow機(jī)器學(xué)習(xí)計(jì)算機(jī)視覺(jué)

2010-09-16 11:21:54

FirefoxJS

2018-06-26 15:40:49

Tensorflow.MNIST圖像數(shù)據(jù)

2017-11-20 15:12:42

PythonTensorFlowWord2Vec

2022-02-10 09:30:00

VRARWeb應(yīng)用程序

2018-08-30 09:36:10

編程語(yǔ)言Python機(jī)器學(xué)習(xí)

2018-08-02 08:45:48

物聯(lián)網(wǎng)機(jī)器學(xué)習(xí)Tensorflow

2014-01-16 10:48:29

瀏覽器ChromeOS

2019-07-24 15:25:29

框架AI開(kāi)發(fā)

2020-03-26 08:00:00

機(jī)器學(xué)習(xí)人工智能AI

2022-04-25 10:26:11

Python代碼瀏覽器
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)