向量——人工智能技術(shù)的基石結(jié)構(gòu) 原創(chuàng)
“ 向量,人工智能技術(shù)的基礎(chǔ)結(jié)構(gòu)?!?/strong>
了解過人工智能技術(shù)的人應(yīng)該都聽說過向量,向量可以說是人工智能的數(shù)據(jù)基礎(chǔ)。
那么什么是向量,為什么選擇向量呢?
什么是向量?
向量其實(shí)來源于數(shù)學(xué),是幾何學(xué)中的一種,指的是具有大小和方向的量,一般用有向線段表示,在中學(xué)數(shù)學(xué)中向量是絕對(duì)值為1的,具有方向的量。
而用代數(shù)的方式表示向量,則是一個(gè)有序數(shù)組,包含n個(gè)元素(n在多維空間中)。
但向量并不只是數(shù)學(xué)獨(dú)有的東西,在物理學(xué),工程學(xué)中都有使用。從數(shù)學(xué)的角度來說,向量可以進(jìn)行數(shù)學(xué)運(yùn)算,并且具有一定的數(shù)學(xué)性質(zhì),比如平移不變,方向唯一等。
向量有幾個(gè)特性,維數(shù)是其包含的元素?cái)?shù)量,例如:v=[1,2,3]是一個(gè)三維向量。其次就是大小和方向,向量的大小可以通過歐幾里得范數(shù)計(jì)算;而其方向是由各分量的比率決定。
向量在人工智能領(lǐng)域的應(yīng)用
說到人工智能,向量就是一個(gè)繞不過去的坎。
我們知道,數(shù)學(xué)是一切學(xué)科的基礎(chǔ),而計(jì)算機(jī)技術(shù)也是建立在數(shù)學(xué)的理論之上,而人工智能技術(shù)作為目前計(jì)算機(jī),數(shù)學(xué)等多學(xué)科集大成的技術(shù),當(dāng)然也離不開數(shù)學(xué)的理論基礎(chǔ)。
而向量就是目前人工智能領(lǐng)域,最基礎(chǔ)的數(shù)據(jù)結(jié)構(gòu)。
首先,人工智能技術(shù)中數(shù)據(jù)的表示采用的是向量,比如文本——詞嵌入(Word2Vec, GloVe),圖片——卷積神經(jīng)網(wǎng)絡(luò)提取圖像特征,使用向量表示,音頻——音頻信號(hào)通過傅立葉變換等方法轉(zhuǎn)化為頻譜。
其次,在機(jī)器學(xué)習(xí)等模型中,輸入與輸出采用的都是向量的格式;在大模型的訓(xùn)練過程中,第一件事就是數(shù)據(jù)處理,然后轉(zhuǎn)化為向量形式,只有這樣才能被模型所處理。
再者,向量相似性計(jì)算在推薦系統(tǒng),信息檢索等領(lǐng)域被廣泛應(yīng)用,比如常見的向量數(shù)據(jù)庫。
向量數(shù)據(jù)庫是一種能夠進(jìn)行語義查詢等數(shù)據(jù)庫,而不是普通的關(guān)系型數(shù)據(jù)庫只能進(jìn)行字符匹配,包括精確匹配和模糊匹配。
而具體的計(jì)算方式,如余弦相似度,歐式距離,曼哈頓距離等都是采用的向量形式。
在人工智能領(lǐng)域中,對(duì)高緯向量進(jìn)行降維計(jì)算,以及神經(jīng)網(wǎng)絡(luò)模型中,隱藏層的數(shù)據(jù)處理都離不開向量(張量)計(jì)算。
向量是人工智能中基本且重要的數(shù)據(jù)表示形式。它在數(shù)據(jù)表示、模型輸入輸出、相似性計(jì)算、特征提取等方面有廣泛應(yīng)用,支持了人工智能技術(shù)的發(fā)展和應(yīng)用。通過向量化操作,復(fù)雜的數(shù)據(jù)處理和分析變得更加高效和統(tǒng)一。
雖然說,在現(xiàn)有的人工智能理論中,并不能完全明白為什么大規(guī)模的參數(shù)通過向量運(yùn)算可以得到近似“智能”的結(jié)果,但這并不耽誤人工智能技術(shù)的演化過程。
本文轉(zhuǎn)載自公眾號(hào)AI探索時(shí)代 作者:DFires
原文鏈接:??https://mp.weixin.qq.com/s/Jyf1gEVVgxEmMwk4j5yRYw??