自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

每張圖片自帶BGM?牛津小哥開(kāi)源神器,實(shí)現(xiàn)任意圖像轉(zhuǎn)換聲譜圖

新聞 開(kāi)源
給你一張圖片,你能想象它的聲音嗎?一個(gè)叫SpectroGraphic的神器就能做到這點(diǎn)。

本文經(jīng)AI新媒體量子位(公眾號(hào)ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)聯(lián)系出處。

 給你一張圖片,你能想象它的聲音嗎?

一個(gè)叫SpectroGraphic的神器就能做到這點(diǎn)。

每張圖片自帶BGM?牛津小哥開(kāi)源神器,實(shí)現(xiàn)任意圖像轉(zhuǎn)換聲譜圖

例如,給定一個(gè)“怪物史萊克”的照片,通過(guò)這個(gè)工具,就能生成其對(duì)應(yīng)的聲譜圖。

每張圖片自帶BGM?牛津小哥開(kāi)源神器,實(shí)現(xiàn)任意圖像轉(zhuǎn)換聲譜圖

圖像嵌入聲譜圖

大多數(shù)聲音是許多聲波的復(fù)雜組合,而每一種聲波都有不同的頻率和強(qiáng)度。

聲譜圖(spectrogram)是一種表示聲音的方法,它的橫軸是時(shí)間,縱軸是頻譜。

每張圖片自帶BGM?牛津小哥開(kāi)源神器,實(shí)現(xiàn)任意圖像轉(zhuǎn)換聲譜圖
△聲譜圖示例

SpectroGraphic所做的工作就是獲取一張圖像,簡(jiǎn)單地把它解釋成一張聲譜圖。

這樣,就可以通過(guò)產(chǎn)生的聲音,便將圖像嵌入到了聲譜圖中。

是不是非??犰牛?/p>

現(xiàn)在,項(xiàng)目已開(kāi)源,每個(gè)人都可以體驗(yàn)了!

項(xiàng)目安裝

首先,運(yùn)行如下代碼來(lái)獲取命令行工具spectrographic:

  1. pipinstallspectrographic 

也可以直接把stand-alone\文件夾里的spectrographic.py文件,作為命令行工具使用。

每張圖片自帶BGM?牛津小哥開(kāi)源神器,實(shí)現(xiàn)任意圖像轉(zhuǎn)換聲譜圖

此外,還需要確保滿足 requirements.txt 文件中涉及的所有依賴項(xiàng)。

可以通過(guò)如下命令來(lái)進(jìn)行安裝:

  1. pipinstallrequirements.txt 

在使用 pip 進(jìn)行安裝之后,只需要在控制臺(tái)中運(yùn)行 spectrographic […]。

在使用stand-alone腳本時(shí),必須使用 python spectrographic.py […]。

還可以簡(jiǎn)單地從 SpectroGraphic.base 中導(dǎo)入 SpectroGraphic 類。

命令行工具的使用

  1. usage:spectrographic[-h][--version]-iPATH_TO_IMAGE[-dDURATION][-mMIN_FREQ][-MMAX_FREQ][-rRESOLUTION][-cCONTRAST][-p][-sSAVE_FILE]Turnanyimageintosound.optionalarguments:-h,--helpshowthishelpmessageandexit--versionshowprogram'sversionnumberandexit-iPATH_TO_IMAGE,--imagePATH_TO_IMAGEPathofimagethatwewanttoembedinaspectrogram.-dDURATION,--durationDURATIONDurationofgeneratedsound.-mMIN_FREQ,--min_freqMIN_FREQSmallestfrequencyusedfordrawingtheimage.-MMAX_FREQ,--max_freqMAX_FREQLargestfrequencyusedfordrawingtheimage.-rRESOLUTION,--resolutionRESOLUTIONVerticalresolutionoftheimageinthespectrogram.-cCONTRAST,--contrastCONTRASTContrastoftheimageinthespectrogram.-p,--playDirectlyplaytheresultingsound.-sSAVE_FILE,--saveSAVE_FILEPathto.wavfileinwhichtosavetheresultingsound. 

如果你的源圖像在./source.png,想要生成10s的音頻,頻率范圍為10kHz到20kHz,還希望保存為sound.wav,最終還要播放音頻。

那么就運(yùn)行如下代碼:

  1. spectrographic--image./source.png--min_freq10000--max_freq20000--duration10--savesound.wav--play 

如果你正在使用stand-alone腳本:

  1. pythonspectrographic.py--image./source.png--min_freq10000--max_freq20000--duration10--savesound.wav--play 

作者簡(jiǎn)介

[[312724]]
△右:Levi Borodenko

Levi Borodenko,目前在牛津大學(xué)攻讀數(shù)學(xué)和統(tǒng)計(jì)學(xué)碩士學(xué)位。學(xué)術(shù)研究重點(diǎn)是隨機(jī)分析和機(jī)器學(xué)習(xí)。

本科也就讀于牛津大學(xué),2017-2018擔(dān)任PROMYS Oxford的輔導(dǎo)員,2018-2019年擔(dān)任PROMYS Boston的首席輔導(dǎo)員。

更多開(kāi)源項(xiàng)目可訪問(wèn)如下鏈接:
https://github.com/LeviBorodenko

傳送門(mén)

項(xiàng)目地址:
https://github.com/LeviBorodenko/spectrographic

 

責(zé)任編輯:張燕妮 來(lái)源: 量子位
相關(guān)推薦

2012-06-20 13:46:23

CSS

2023-07-18 17:59:38

2023-12-01 08:09:45

開(kāi)源圖片編輯器

2022-06-27 22:03:04

CSS技巧前端

2020-05-22 15:45:30

Linuxlogrotate神器

2025-04-24 08:23:59

2021-08-16 11:59:32

Linuxlogrotate日志文件

2025-03-26 00:35:00

Javaweb開(kāi)發(fā)

2024-02-05 12:45:33

AI訓(xùn)練

2025-02-17 07:48:45

2024-07-26 09:19:41

2021-02-21 09:25:41

開(kāi)源技術(shù) 工具

2021-05-25 09:10:54

工具代碼開(kāi)發(fā)

2024-10-25 11:56:33

OCRVisRAGRAG

2009-08-13 09:07:36

Java多線程

2023-03-20 13:43:00

AI論文

2015-08-21 17:52:52

逆向分析BinNavi

2024-05-06 09:26:06

Rust語(yǔ)言編碼

2019-07-09 12:30:50

開(kāi)源技術(shù) 軟件

2019-12-23 10:22:05

AI 數(shù)據(jù)人工智能
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)