自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<sub id="nk68s"><p id="nk68s"></p></sub>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

每張圖片自帶BGM？牛津小哥開(kāi)源神器，實(shí)現(xiàn)任意圖像轉(zhuǎn)換聲譜圖

作者：十三 2020-01-13 13:20:01

新聞開(kāi)源

給你一張圖片，你能想象它的聲音嗎？一個(gè)叫SpectroGraphic的神器就能做到這點(diǎn)。

本文經(jīng)AI新媒體量子位（公眾號(hào)ID:QbitAI）授權(quán)轉(zhuǎn)載，轉(zhuǎn)載請(qǐng)聯(lián)系出處。

給你一張圖片，你能想象它的聲音嗎？

一個(gè)叫SpectroGraphic的神器就能做到這點(diǎn)。

每張圖片自帶BGM？牛津小哥開(kāi)源神器，實(shí)現(xiàn)任意圖像轉(zhuǎn)換聲譜圖

例如，給定一個(gè)“怪物史萊克”的照片，通過(guò)這個(gè)工具，就能生成其對(duì)應(yīng)的聲譜圖。

每張圖片自帶BGM？牛津小哥開(kāi)源神器，實(shí)現(xiàn)任意圖像轉(zhuǎn)換聲譜圖

圖像嵌入聲譜圖

大多數(shù)聲音是許多聲波的復(fù)雜組合，而每一種聲波都有不同的頻率和強(qiáng)度。

聲譜圖(spectrogram)是一種表示聲音的方法，它的橫軸是時(shí)間，縱軸是頻譜。

每張圖片自帶BGM？牛津小哥開(kāi)源神器，實(shí)現(xiàn)任意圖像轉(zhuǎn)換聲譜圖

△聲譜圖示例

而SpectroGraphic所做的工作就是獲取一張圖像，簡(jiǎn)單地把它解釋成一張聲譜圖。

這樣，就可以通過(guò)產(chǎn)生的聲音，便將圖像嵌入到了聲譜圖中。

是不是非?？犰牛?/p>

現(xiàn)在，項(xiàng)目已開(kāi)源，每個(gè)人都可以體驗(yàn)了！

項(xiàng)目安裝

首先，運(yùn)行如下代碼來(lái)獲取命令行工具spectrographic：

pipinstallspectrographic

也可以直接把stand-alone\文件夾里的spectrographic.py文件，作為命令行工具使用。

每張圖片自帶BGM？牛津小哥開(kāi)源神器，實(shí)現(xiàn)任意圖像轉(zhuǎn)換聲譜圖

此外，還需要確保滿足 requirements.txt 文件中涉及的所有依賴項(xiàng)。

可以通過(guò)如下命令來(lái)進(jìn)行安裝：

pipinstallrequirements.txt

在使用 pip 進(jìn)行安裝之后，只需要在控制臺(tái)中運(yùn)行 spectrographic […]。

在使用stand-alone腳本時(shí)，必須使用 python spectrographic.py […]。

還可以簡(jiǎn)單地從 SpectroGraphic.base 中導(dǎo)入 SpectroGraphic 類。

命令行工具的使用

usage:spectrographic[-h][--version]-iPATH_TO_IMAGE[-dDURATION][-mMIN_FREQ][-MMAX_FREQ][-rRESOLUTION][-cCONTRAST][-p][-sSAVE_FILE]Turnanyimageintosound.optionalarguments:-h,--helpshowthishelpmessageandexit--versionshowprogram'sversionnumberandexit-iPATH_TO_IMAGE,--imagePATH_TO_IMAGEPathofimagethatwewanttoembedinaspectrogram.-dDURATION,--durationDURATIONDurationofgeneratedsound.-mMIN_FREQ,--min_freqMIN_FREQSmallestfrequencyusedfordrawingtheimage.-MMAX_FREQ,--max_freqMAX_FREQLargestfrequencyusedfordrawingtheimage.-rRESOLUTION,--resolutionRESOLUTIONVerticalresolutionoftheimageinthespectrogram.-cCONTRAST,--contrastCONTRASTContrastoftheimageinthespectrogram.-p,--playDirectlyplaytheresultingsound.-sSAVE_FILE,--saveSAVE_FILEPathto.wavfileinwhichtosavetheresultingsound.

如果你的源圖像在./source.png，想要生成10s的音頻，頻率范圍為10kHz到20kHz，還希望保存為sound.wav，最終還要播放音頻。

那么就運(yùn)行如下代碼：

spectrographic--image./source.png--min_freq10000--max_freq20000--duration10--savesound.wav--play

如果你正在使用stand-alone腳本：

pythonspectrographic.py--image./source.png--min_freq10000--max_freq20000--duration10--savesound.wav--play

作者簡(jiǎn)介

△右：Levi Borodenko

Levi Borodenko，目前在牛津大學(xué)攻讀數(shù)學(xué)和統(tǒng)計(jì)學(xué)碩士學(xué)位。學(xué)術(shù)研究重點(diǎn)是隨機(jī)分析和機(jī)器學(xué)習(xí)。

本科也就讀于牛津大學(xué)，2017-2018擔(dān)任PROMYS Oxford的輔導(dǎo)員，2018-2019年擔(dān)任PROMYS Boston的首席輔導(dǎo)員。

更多開(kāi)源項(xiàng)目可訪問(wèn)如下鏈接：
https://github.com/LeviBorodenko

傳送門(mén)

項(xiàng)目地址：
https://github.com/LeviBorodenko/spectrographic

責(zé)任編輯：張燕妮來(lái)源：量子位

開(kāi)源技術(shù) 軟件

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

<sub id="iix1a"><p id="iix1a"></p></sub>