有了新的想法,林允寧立刻合上筆記本,抓起桌上的集訓隊圖書卡,走向金陵大學圖書館。
高翔曾經跟他說過,在製備非平衡磁控濺射的多組分金屬薄膜時,想找到一種方法,只用少量的XRD數據和幾個簡單的電學指標,就能快速判斷樣品是否落在了想要的目標相區。
當時,林允寧給了他一個用貝葉斯框架搭建的,用紅、黃、綠三色燈判斷樣品相區的構思。
只是,他還沒來得及實現,就被雅努斯計劃吸引了全部注意力,將這個課題擱置了。
如今看來,用神經網絡來處理這個問題,可能比貝葉斯模型更高效。
“三色燈”項目,本質上是一個分類問題,與識別貓狗並無二致。
而裏希特教授的隨機電報噪聲 (RTN),則是一個更復雜的時域信號識別問題。
兩者有一定的共通之處,也許能用相似的方法論來解決。
林允寧決定先從簡單一些的“三色燈”項目開始做起,積累了經驗,再推廣到RTN問題中。
雅努斯計劃的實驗驗證部分,他目前毫無思路,只能先做其他課題,慢慢尋找靈感。
圖書館,計算機科學閱覽區。
林允寧在高大的書架間穿行,最終抽出了兩本厚重的英文影印書:
克裏斯託弗?畢曉普的《模式識別與機器學習》和Haykin的《神經網絡(第二版)》。
回到宿舍,他快速翻閱着那兩本書。
感知機、反向傳播、梯度下降......這些在十幾年後爛大街的概念,在2005年的此刻,對絕大多數人而言還如同天書。
但對林允寧來說,這套邏輯清晰的數學框架並不難理解。
【檢測到你已完成對《模式識別與機器學習》的首次通讀,該知識模塊已成功收錄!】
【新知識模塊:機器學習 LV.1概念認知】
林允寧沒有猶豫,直接調動了系統。
【注入模擬時長:200小時!】
【指定模塊:機器學習 LV.1->LV.2範式掌握!】
當模擬結束,林允寧睜開眼時,一個基礎的神經網絡框架已經在他腦中清晰成型。
他立刻打開電腦,開始用Python搭建一個最簡單的三層全連接神經網絡,加入到了Aether中,命名爲Aether_ML_NN。
在【模擬科研】的幫助下,他很快完成了新模塊的編寫。
喫過午飯,他帶着初步完成的Aether_ML_NN模塊,來到了材料學院高翔的實驗室。
實驗室裏還是一如既往,真空泵低沉地嗡鳴。
高翔的辦公桌上還擺着兩個泡麪桶。
他看到林允寧,佈滿血絲的眼睛裏亮起一絲期待。
“林師弟,你那邊......”
“模型做好了,可以試試。”
林允寧將自己的筆記本電腦連接到高翔的工作站上,調出了一個簡潔的界面,“我已經把你發給我的實驗數據和對應的工藝參數,還有你對樣品質量的'好'、'中'、'差”的標記,全部導入了Aether進行訓練。
“我現在需要更多的數據,進行交叉驗證。”
高翔點了點頭,立刻行動起來,將最近一個月的數據??十幾份樣品的XRD圖譜和對應的濺射功率、氣壓、時間等參數,輸入這個新模型。
“開始交叉驗證。”
林允寧點下鼠標,進度條開始緩慢移動。
十分鐘後,屏幕上彈出了一個分類準確率。
53.2%
這個準確率,和閉着眼睛瞎猜也沒什麼區別。
實驗室裏一片安靜。
高翔臉上的期待迅速褪去,最終化爲一聲無奈的嘆息。
他摘下眼鏡,用力揉了揉眉心,聲音裏帶着實驗人特有的疲憊:
“唉,我就知道沒這麼簡單。機器學習這東西,在咱們這種小樣本、高維度的材料科學裏,可能真的不適用。”
他並沒有抱怨,失敗是科研的常態,他早已習慣。
林允寧卻沒說話,只是盯着屏幕上的混淆矩陣。
那上面顯示,模型能輕易地區分出“好”和“差”的樣品,卻在“中等”和“良好”這兩個最關鍵的區間,錯得一塌糊塗。
爲什麼總在這兩個區間犯錯?
林允寧修長的手指輕輕敲擊着桌面,很快有了結論。
從XRD圖譜上看,這兩個區間區別不大,峯型和峯位確實很像。
但神經網絡只看到了相似性,卻不知道實現兩者的工藝參數,比如功率和氣壓,在物理意義上天差地別。
換句話說,問題不出在神經網絡本身,而在於他給的“信息”不夠。
“高師兄,”
林允愈抬起頭,“我們得教它物理。
“教它物理?”
高翔沒聽懂。
“對。它現在只會'看',不會“理解”。”
林允寧指着屏幕,“我們得把濺射功率、氣壓這些工藝參數,不是作爲普通數據,而是作爲強約束的‘物理規則”,強行寫進模型裏。讓它知道,功率提高1瓦,和氣壓改變1帕,對最終晶體結構的影響是完全不同的。”
一個全新的混合模型框架??“物理信息神經網絡”(PINN) ,在他腦中成型。
【注入模擬時長:50小時!】
【模擬科研啓動......】
【第15小時,你正在重構算法。你嘗試將描述原子擴散和成核過程的Arrhenius方程,作爲一個懲罰項,加入到神經網絡的損失函數中。任何不符合該物理規律的參數預測,都會受到巨大懲罰。】
【第45小時你意識到,你正在創造一種全新的模型:不再是讓機器去擬合物理,而是用物理去約束機器。】
現實中,林允寧的手指在鍵盤上翻飛。
一個小時後,Aether_ML_PINN_v1.0誕生了。
他重新導入數據,點擊了“開始訓練”。
這一次,模型不僅要擬合數據,還要滿足物理規律的約束。
訓練過程慢了很多,一直快到晚上喫飯的時候,才終於完成。
訓練完成,高翔再次導入了那份測試數據。
這一次,屏幕上彈出的最終準確率是??92.3%!
“我......我......”
高翔盯着那個數字,下意識地站了起來,身體因爲激動而微微前傾,他反覆確認自己沒看錯,聲音都有些發顫,“這......這就成了?”
這個數字雖然不是完美的,但已經相當驚人了。
可想而知,按照這個篩選方案,會極大提高實驗的進程。
“還沒完。”
林允寧的表情依舊平靜,“現在,讓它給出一個最優工藝參數的預測。”
他清空了所有數據,只在“目標”一欄裏,輸入了“最優樣品”。
然後,點擊了“工藝參數預測”。
模型開始反向推演,在龐大的參數空間中尋找最優解。
十五分鐘後,一組工藝參數被輸出到了屏幕上。
高翔只看了一眼,眉頭就緊緊皺了起來:
“林師弟,這不可能。濺射功率95瓦,氣流量2.5sccm......這個參數區間,我們試過不下十次,長出來的全是些非晶的垃圾相,根本成不了膜。這是死區。”
“模型的置信度是99.1%,值得一試。”
林允寧的語氣很平淡,卻相當自信,“而且,你之前的實驗記錄顯示,在這個參數組合下,基片溫度是300度,而模型預測的最佳溫度是325度。也許就是這25度的差別。”
高翔看着林允寧,又看了看屏幕上那組違背自己所有經驗的參數,臉上滿是掙扎。
浪費一片靶材和幾個小時的機時倒是小事,但這種希望之後再次失望的感覺,他實在不想再經歷一次了。
他猶豫了足足半分鐘,最終一咬牙:
“行!反正我也沒別的好辦法了,這個課題已經失敗了無數次,不差這一次。林師弟,我信你一次。如果能成,這篇文章咱們共同一作!”
他轉身走向那臺巨大的磁控濺射儀,開始按照屏幕上模型預測的參數,設定程序。
真空泵開始轟鳴,腔體內的真空計數字穩定在5.0×10-5 Pa。
當高壓電源開啓,靶材表面亮起一圈絢麗的紫色等離子體輝光時,高翔的內心,反而平靜了下來。
他已經做好了再次失敗的準備。
一個小時的薄膜生長過程,顯得格外漫長。
當系統提示成膜結束,腔體開始泄壓發出嗤'的一聲時,高翔甚至沒有第一時間去看。
林允寧倒是很平靜,他走上前,戴上無塵手套,用樣品託取出了那片剛生長完成的硅片。
在實驗室頂燈的照射下,那片薄膜的表面呈現出一種均勻的金屬鏡面光澤,沒有任何肉眼可見的瑕疵。
“漂亮......”
高翔喃喃自語。
但他知道,真正的考驗,在X射線衍射儀上。
他小心翼翼地將樣品固定在衍射儀的樣品臺上,關上防護鉛門,在電腦上設定好掃描程序。
房間裏只剩下衍射儀步進電機有節奏的“嗡嗡”聲。
屏幕上,衍射圖譜的數據點,一個一個地出現,逐漸匯成一條曲線。
高翔的心提到了嗓子眼。
曲線緩慢攀升,在20度附近,突然出現了一個尖銳的衍射峯!
緊接着,第二個、第三個......
所有代表着完美BCC固溶體相的特徵峯,一個不少地出現在了它們應該在的位置。
整個圖譜乾淨得像教科書裏的示例,沒有任何一個雜相峯!
“成功了......真的成功了......”
高翔盯着那張完美的圖譜,激動地渾身顫抖。
他猛地一拍桌子,從椅子上彈了起來,在狹小的實驗室裏來回踱步,嘴裏不停地唸叨着:
“怎麼可能做到......這簡直......”
壓抑了數個月的挫敗感,在這一刻盡數釋放,巨大的喜悅讓他幾乎想要大吼出聲。
就在這時,實驗室的門被猛地推開。
陳正平因爲跑得太急,踉蹌了一下,差點摔倒,懷裏緊緊抱着他的筆記本電腦。
他臉色煞白,嘴脣都在哆嗦。
“林師弟,你怎麼不接電話,我到處都找不到你。”
林允寧這纔想起自己一直在忙,手機關了靜音。
“怎麼了?”
他問道。
“出事了!”
陳正平幾步衝到林允寧面前,將自己的筆記本猛地轉向他,聲音因爲憤怒而嘶啞,“快看arxiv!墨爾本那幫......那幫人,根本沒等我們回應,直接把Comment掛到預印本網站上了!現在都已經置頂了!”
陳正平咬牙切齒,顯然對此十分憤怒。
屏幕上,是物理學預印本網站arXiv的首頁。
一篇剛剛提交、被置頂高亮的最新論文,其標題用加粗的字體呈現,措辭十分尖銳一一
(《論石墨烯中理論預言的量子反常霍爾效應之脆弱性》)