近日,蘋果機(jī)器學(xué)習(xí)團(tuán)隊(duì)聯(lián)合南京大學(xué)與香港科技大學(xué),發(fā)布了一項(xiàng)具有突破性的 AI 成果 ——Matrix3D 3D AI 模型,該模型專注于從少量 2D 照片中重建真實(shí)世界的物體和場(chǎng)景,極大地簡(jiǎn)化了 3D 重建流程。
傳統(tǒng)攝影測(cè)量技術(shù)在構(gòu)建 3D 模型或地圖時(shí),依賴姿態(tài)估計(jì)、深度預(yù)測(cè)等多個(gè)獨(dú)立模型分步處理,過程繁瑣且易出錯(cuò)。Matrix3D 則另辟蹊徑,通過統(tǒng)一架構(gòu),一次性整合圖像、相機(jī)參數(shù)(如角度、焦距)以及深度數(shù)據(jù)等元素,減少中間環(huán)節(jié),使重建過程更加流暢、可靠,有效降低了人為錯(cuò)誤風(fēng)險(xiǎn),提升整體性能。
在訓(xùn)練策略上,Matrix3D 采用掩碼學(xué)習(xí)方法,類似于早期 Transformer 基礎(chǔ) AI 系統(tǒng)以及 ChatGPT 早期版本的訓(xùn)練理念。訓(xùn)練時(shí)隨機(jī)隱藏部分輸入數(shù)據(jù),促使模型學(xué)會(huì) “填充空白”,增強(qiáng)了模型適應(yīng)性,即便面對(duì)較小或不完整的數(shù)據(jù)集,也能有效學(xué)習(xí)關(guān)鍵特征。
經(jīng)過測(cè)試,Matrix3D 展現(xiàn)出強(qiáng)大性能。用戶僅需提供三張輸入圖像,模型便能生成包括物體和整體環(huán)境在內(nèi)的詳細(xì) 3D 重建,為沉浸式技術(shù)的實(shí)際應(yīng)用帶來(lái)了新的可能。無(wú)論是在影視制作、游戲開發(fā),還是建筑設(shè)計(jì)、文物數(shù)字化等領(lǐng)域,Matrix3D 都有望憑借其便捷高效的 3D 重建能力,發(fā)揮重要作用,進(jìn)一步推動(dòng) AI 技術(shù)在多行業(yè)的深度應(yīng)用與創(chuàng)新發(fā)展
來(lái)【龍頭AI網(wǎng)】了解最新AI資訊!
暫無(wú)評(píng)論
發(fā)表評(píng)論