近日,蘋果機器學(xué)習(xí)團隊聯(lián)合南京大學(xué)與香港科技大學(xué),發(fā)布了一項具有突破性的 AI 成果 ——Matrix3D 3D AI 模型,該模型專注于從少量 2D 照片中重建真實世界的物體和場景,極大地簡化了 3D 重建流程。
傳統(tǒng)攝影測量技術(shù)在構(gòu)建 3D 模型或地圖時,依賴姿態(tài)估計、深度預(yù)測等多個獨立模型分步處理,過程繁瑣且易出錯。Matrix3D 則另辟蹊徑,通過統(tǒng)一架構(gòu),一次性整合圖像、相機參數(shù)(如角度、焦距)以及深度數(shù)據(jù)等元素,減少中間環(huán)節(jié),使重建過程更加流暢、可靠,有效降低了人為錯誤風(fēng)險,提升整體性能。
在訓(xùn)練策略上,Matrix3D 采用掩碼學(xué)習(xí)方法,類似于早期 Transformer 基礎(chǔ) AI 系統(tǒng)以及 ChatGPT 早期版本的訓(xùn)練理念。訓(xùn)練時隨機隱藏部分輸入數(shù)據(jù),促使模型學(xué)會 “填充空白”,增強了模型適應(yīng)性,即便面對較小或不完整的數(shù)據(jù)集,也能有效學(xué)習(xí)關(guān)鍵特征。 經(jīng)過測試,Matrix3D 展現(xiàn)出強大性能。用戶僅需提供三張輸入圖像,模型便能生成包括物體和整體環(huán)境在內(nèi)的詳細(xì) 3D 重建,為沉浸式技術(shù)的實際應(yīng)用帶來了新的可能。無論是在影視制作、游戲開發(fā),還是建筑設(shè)計、文物數(shù)字化等領(lǐng)域,Matrix3D 都有望憑借其便捷高效的 3D 重建能力,發(fā)揮重要作用,進一步推動 AI 技術(shù)在多行業(yè)的深度應(yīng)用與創(chuàng)新發(fā)展
來【龍頭AI網(wǎng)】了解最新AI資訊!
暫無評論
發(fā)表評論