自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

DeepMind新模型自動生成CAD草圖,網(wǎng)友:建筑設(shè)計要起飛了

新聞 人工智能
在最近的一項研究中,DeepMind 提出了一種機(jī)器學(xué)習(xí)模型,能夠自動生成此類草圖,且結(jié)合了通用語言建模技術(shù)以及現(xiàn)成的數(shù)據(jù)序列化協(xié)議,具有足夠的靈活性來適應(yīng)各領(lǐng)域的復(fù)雜性,并且對于無條件合成和圖像到草圖的轉(zhuǎn)換都表現(xiàn)良好。

 [[399928]]

在制造業(yè)中,CAD 的應(yīng)用十分廣泛。憑借著精準(zhǔn)、靈活、快速的特性,CAD 已經(jīng)取代了紙筆畫圖,并且不再只是應(yīng)用于汽車制造、航空航天等領(lǐng)域,哪怕小到一個咖啡杯,生活中幾乎每個物件都由 CAD 畫圖建模。

CAD 模型中最難制作的部件之一就是高度結(jié)構(gòu)化的 2D 草圖,即每一個 3D 構(gòu)造的核心。盡管時代不同了,但 CAD 工程師仍然需要多年的培訓(xùn)和經(jīng)驗,并且像紙筆畫圖設(shè)計的前輩們一樣關(guān)注所有的設(shè)計細(xì)節(jié)。下一步,CAD 技術(shù)將融合機(jī)器學(xué)習(xí)技術(shù)來自動化可預(yù)測的設(shè)計任務(wù),使工程師可以專注于更大層面的任務(wù),以更少的精力來打造更好的設(shè)計。

在最近的一項研究中,DeepMind 提出了一種機(jī)器學(xué)習(xí)模型,能夠自動生成此類草圖,且結(jié)合了通用語言建模技術(shù)以及現(xiàn)成的數(shù)據(jù)序列化協(xié)議,具有足夠的靈活性來適應(yīng)各領(lǐng)域的復(fù)雜性,并且對于無條件合成和圖像到草圖的轉(zhuǎn)換都表現(xiàn)良好。

論文鏈接:
https://arxiv.org/pdf/2105.02769.pdf

具體而言,研究者開展了以下工作:

使用 PB(Protocol Buffer)設(shè)計了一種描述結(jié)構(gòu)化對象的方法,并展示了其在自然 CAD 草圖領(lǐng)域的靈活性;

從最近的語言建模消除冗余數(shù)據(jù)中吸取靈感,提出了幾種捕捉序列化 PB 對象分布的技術(shù);

使用超過 470 萬精心預(yù)處理的參數(shù)化 CAD 草圖作為數(shù)據(jù)集,并使用此數(shù)據(jù)集來驗證提出的生成模型。事實上,無論是在訓(xùn)練數(shù)據(jù)量還是模型能力方面,實際的實驗規(guī)模都比這更多。

CAD 草圖展示效果圖如下:

DeepMind新模型自動生成CAD草圖,網(wǎng)友:建筑設(shè)計要起飛了

特寫鏡頭展示:

DeepMind新模型自動生成CAD草圖,網(wǎng)友:建筑設(shè)計要起飛了

對于 DeepMind 的這項研究,網(wǎng)友的評價非常高。用戶 @Theodore Galanos 表示:「非常棒的解決方案。我曾使用 SketchGraphs 作為多模態(tài)模型的候選方案,但序列的格式和長度太不容易處理了。等不及在建筑設(shè)計中也使用這種方法了?!?/p>

DeepMind新模型自動生成CAD草圖,網(wǎng)友:建筑設(shè)計要起飛了

草圖之于 CAD

2D 草圖是機(jī)械 CAD 的核心,是構(gòu)成三維形式的骨架。草圖由通過特定的約束(例如正切、垂直和對稱)相關(guān)聯(lián)的各種線、弧、樣條線和圓組成。這些約束旨在傳達(dá)設(shè)計意圖,并定義在實體的各種變換下,形狀應(yīng)該如何發(fā)生變化。下圖說明了約束是如何將不同的線、弧等幾何圖形組合創(chuàng)建成特定的形狀的。虛線顯示了丟失約束時的另一個有效的解決方案。所有的幾何實體都位于一個草圖平面上,共同形成封閉的區(qū)域,供后續(xù)操作(例如放樣和拉伸)使用,以生成復(fù)雜的 3D 幾何。

DeepMind新模型自動生成CAD草圖,網(wǎng)友:建筑設(shè)計要起飛了

約束:草圖逃不開的問題

約束( constraint )使草圖比看起來要復(fù)雜得多。它們展現(xiàn)了可以間接影響草圖中每個實體的關(guān)系。例如,在上圖中,如果在底角保持固定的狀態(tài)下向上拖動兩個圓弧相交的點,則心形的大小會增大。這種轉(zhuǎn)變看似簡單,但實際上是所有約束共同作用的結(jié)果。

這些約束確保了當(dāng)每個實體的尺寸和位置發(fā)生變化時,形狀仍保持著設(shè)計者想傳達(dá)的狀態(tài)。由于實體之間復(fù)雜的相互作用,很容易意外地指定一組約束,從而導(dǎo)致草圖無效。例如,同時滿足平行和垂直約束的兩條線是無法繪制的。在復(fù)雜的草圖中,約束依賴關(guān)系鏈會導(dǎo)致設(shè)計人員確定要添加的約束變得極為困難。此外,對于給定的一組實體,有許多等效的約束系統(tǒng)能產(chǎn)生類似的草圖。

一個高質(zhì)量的草圖通常會使用一組保留設(shè)計意圖的約束,這意味著即使更改了實體參數(shù)(例如尺寸),草圖的語義也得以保留。簡而言之,無論實體尺寸如何變化,上圖中的心形永遠(yuǎn)是心形。捕捉設(shè)計意圖與選擇一致的約束系統(tǒng)的復(fù)雜性使草圖生成變成極其困難的問題。

草圖與自然語言建模的相似性

草圖構(gòu)造的復(fù)雜性有些類似于自然語言建模。在草圖中選擇下一個約束或?qū)嶓w就像生成句子中的下一個單詞,而兩者中的的選擇又必須在語法上起作用(在草圖中形成一個一致約束系統(tǒng)),并保留設(shè)計意圖。

在生成自然語言方面,已經(jīng)有了許多成功的工具,其中表現(xiàn)最佳的無疑是在大量現(xiàn)實世界數(shù)據(jù)上進(jìn)行訓(xùn)練的機(jī)器學(xué)習(xí)模型。比如 2017 年的 Transformer 架構(gòu),展示了強(qiáng)大的連貫造句的能力。這些自然語言模型中的規(guī)律,是否可以用來繪制草圖呢?

數(shù)據(jù)

Onshape 是維度驅(qū)動設(shè)計的一個參數(shù)化實體建模軟件。但為了存儲和處理草圖,研究者使用 PB,而不是 Onshape API 提供的原始 JSON 格式。使用 PB 具有雙重的優(yōu)勢:由于移除了不必要的信息,結(jié)果數(shù)據(jù)占用的空間更少;使用 PB 語言可以輕松地為結(jié)構(gòu)各異的復(fù)雜物體定義精準(zhǔn)的規(guī)格。

一旦設(shè)定好所有必要的對象類型,就需要將數(shù)據(jù)轉(zhuǎn)換為可以通過機(jī)器學(xué)習(xí)模型來處理的表格。研究者選擇將草圖表示為 tokens 序列,以便使用語言建模生成草圖。文本格式包含了結(jié)構(gòu)和數(shù)據(jù)的內(nèi)容,這樣使用的優(yōu)勢是可以應(yīng)用任何現(xiàn)成的文本數(shù)據(jù)建模方法。不過,即使對于現(xiàn)代語言建模技術(shù),這樣做也是有代價的:模型為了生成有效的語法,將額外占用模型容量的一部分。

解決的手段就是避免使用字節(jié)格式 PB 定義的通用解析器,利用草圖格式的結(jié)構(gòu)來自定義構(gòu)建設(shè)計解釋器,即輸入一系列代表草圖創(chuàng)建過程中各個決策步驟有效選擇的 tokens。在這種 tokens 序列的格式下設(shè)計解釋器會導(dǎo)致 PB 消息有效。

在這種格式下,研究者將消息表示為 triplets 序列(,,),其中是 token 的索引。給定一系列這樣的 triplets,推斷每個 token 對應(yīng)的確切字段是可能的。實際上,第一個 token(,,)始終與 objects.kind 相關(guān)聯(lián),因為它是創(chuàng)建一個草圖消息的首選。第二個字段取決于1 的具體值。如果1= 0,那么第一個對象是一個實體,這意味著第二個 token 對應(yīng)于 entity.kind。該序列的其余部分以類似的方式關(guān)聯(lián)。字段標(biāo)識符及其在對象中的位置構(gòu)成了 token 的上下文。因為它使解釋 triplets 值的含義以及了解整體數(shù)據(jù)結(jié)構(gòu)更容易,研究者將此信息用作機(jī)器學(xué)習(xí)模型的其他輸入。

DeepMind新模型自動生成CAD草圖,網(wǎng)友:建筑設(shè)計要起飛了

如上圖所示,草圖包含了一條線實體和一個點實體。在左列的每個 triplet 中,實際使用的值以粗體顯示。右列顯示了 triplet 與對象的哪個字段有關(guān)聯(lián)。

從模型中取樣

建立模型的主要目標(biāo)是估計數(shù)據(jù)集 D 中的 2D 草圖 data 的分布。就像上文提到的,研究者將像 token 序列一樣處理草圖。在這項工作中,由于相關(guān)原始文本格式的序列長度挑戰(zhàn),只會考慮使用用字節(jié)和 triplet 來表示。

從字節(jié)模型取樣很簡單,該過程與任何典型的基于 Transformer 的語言建模過程相同,而 Triplet 模型需要更多的定制處理。

DeepMind新模型自動生成CAD草圖,網(wǎng)友:建筑設(shè)計要起飛了

上圖展示了 Triplet 的處理過程:首先將特殊的 BOS token 嵌入并提供給 Transformer。然后,Transformer 輸出一組 triplets,每個可能的 token 組一個。為了確定具體需要發(fā)出哪個 token,應(yīng)用從數(shù)據(jù)規(guī)格中自動生成的解釋器(狀態(tài)機(jī)),再選擇合適的 token 組并關(guān)聯(lián)在合成對象中具有字段的 triplet 的活動組件。填入適當(dāng)?shù)淖侄魏?,解釋器轉(zhuǎn)換到下一個狀態(tài)并生成一個輸出 token,然后將其反饋到該模型。當(dāng)狀態(tài)機(jī)收到最外層重復(fù)字段(即 object.kind)的 “end” triplet 時,停止該過程。

實驗

研究者使用了從 Onshape 平臺上公開可用的文檔庫中獲得的數(shù)據(jù)對方法進(jìn)行驗證。遵循自回歸生成模型的標(biāo)準(zhǔn)評估方法,研究者使用對數(shù)可能性作為主要的定量指標(biāo)。此外,研究者還提供了各種隨機(jī)和選定的模型樣本以進(jìn)行定性分析評估。

訓(xùn)練細(xì)節(jié)

研究者使用 128 個通道的批次訓(xùn)練模型以進(jìn)行 10^6 個權(quán)重更新。每個通道都可以在 triplet 設(shè)置中容納 1024 個 tokens 的序列,在字節(jié)設(shè)置中容納 1990 個 tokens。為了提高占用率并減少計算浪費,研究者動態(tài)地填滿了通道,在繼續(xù)前進(jìn)到下一條道之前將盡可能多的例子打包。每個批次由 32 個 TPU 內(nèi)核并行處理。

此外,研究者還使用了 Adam 優(yōu)化器,學(xué)習(xí)率為 10^−4,梯度范數(shù)為 1.0,所有實驗均采用 0.1 的失活率。

實驗結(jié)果

DeepMind新模型自動生成CAD草圖,網(wǎng)友:建筑設(shè)計要起飛了

如上圖所示,各種模型的可能性都被測試到了。第三列是草圖測試樣本中每個對象的平均字節(jié)數(shù),第四列是第三列乘以對象數(shù)。

下圖是從 triplet 模型中取樣的實體與約束。第一列節(jié)點代表了不同的實體,節(jié)點從上至下遵循生成的順序。第二列代表著不同的約束,按照序列索引排序。第三列是從頻率最高到最低的約束類型。

DeepMind新模型自動生成CAD草圖,網(wǎng)友:建筑設(shè)計要起飛了

下圖是條件模型的實體和約束。左下角是輸入位圖,下例說明了模型在分布外輸入時的表現(xiàn)。

DeepMind新模型自動生成CAD草圖,網(wǎng)友:建筑設(shè)計要起飛了

下圖顯示了從非條件模型取樣的各種草圖數(shù)據(jù)分布統(tǒng)計,而括號中的是 Nucleus 取樣的 top-p 參數(shù)。

DeepMind新模型自動生成CAD草圖,網(wǎng)友:建筑設(shè)計要起飛了

這些只是最初的概念驗證實驗。DeepMind 表示,希望能夠看到更多利用已開發(fā)接口的靈活性優(yōu)勢開發(fā)的應(yīng)用程序,比如以各種草圖屬性為條件,給定實體來推斷約束,以自動完成圖紙。

 

責(zé)任編輯:張燕妮 來源: 機(jī)器之心Pro
相關(guān)推薦

2023-04-18 11:09:05

ChatGPTDALL-E機(jī)器學(xué)習(xí)

2022-01-12 23:35:27

5G基站信號

2011-10-26 10:40:06

海爾臺式機(jī)

2009-10-15 10:03:31

綜合布線系統(tǒng)

2010-03-02 21:43:25

Mocha BSMIT運維摩卡軟件

2012-02-17 14:27:14

歐特克建筑設(shè)計套件BIM

2015-06-15 14:13:52

數(shù)據(jù)中心

2025-02-17 08:58:06

2023-09-12 16:19:37

物聯(lián)網(wǎng)人工智能

2023-07-26 15:50:44

智能技術(shù)物聯(lián)網(wǎng)

2023-07-03 10:17:41

物聯(lián)網(wǎng)IOT

2025-03-07 08:28:56

2023-08-24 16:04:40

2022-06-01 07:49:43

索引數(shù)據(jù)Mysql

2022-08-08 16:33:24

智能建筑樓宇自控物聯(lián)網(wǎng)

2013-01-29 10:07:13

建筑設(shè)計師寫程序程序員

2011-10-27 16:01:54

工作站解決方案

2015-03-12 14:24:21

CIO

2012-01-08 21:11:21

歐特克建筑設(shè)計套件
點贊
收藏

51CTO技術(shù)棧公眾號