亞馬遜發(fā)布Nova Sonic語音模型 支持32種語言實時識別,對話延遲低于300ms,客服場景準確率達98.7%,API調用成本僅為GPT-4o的20%。該模型通過亞馬遜Bedrock平臺提供服務,成為企業(yè)語音交互新標桿。
英偉達開源Llama3.1 Nemotron Ultra 253B 2530億參數(shù)模型支持128K上下文窗口,推理速度達每秒1200token,在數(shù)學推理和代碼生成任務中表現(xiàn)超越DeepSeek R1。模型開源后已在Hugging Face發(fā)布,推動長文檔分析與復雜任務處理能力提升。
UC伯克利開源60秒動畫生成技術 采用“測試時訓練”架構,可一次性生成《貓和老鼠》風格動畫,支持自定義角色動作與場景切換,已應用于獨立電影制作,解決長視頻連貫性難題。
微軟Copilot新增記憶與網(wǎng)頁操控功能 深度整合Bing搜索,支持保存用戶偏好與歷史對話,可生成帶時間戳的播客腳本,并推出個性化數(shù)字形象定制服務。
清華發(fā)布VideoScene單步生成3D場景視頻 結合動態(tài)降噪技術解決3D一致性問題,生成速度提升3倍,在自動駕駛仿真測試中實現(xiàn)毫米級場景還原精度。
谷歌第七代TPU Ironwood發(fā)布 采用3nm制程工藝,單芯片算力達4614 TFLOPS,能效比提升200%,專為AI推理設計,已部署于Google Cloud支持Gemini模型。
Meta開源Llama 4系列模型 混合專家架構(MoE)使多模態(tài)處理能力提升37%,數(shù)學推理準確率突破行業(yè)基準,但因數(shù)據(jù)清洗問題延期兩月發(fā)布。
聯(lián)影醫(yī)療“元智”大模型上線 支持CT/MRI等10種影像模態(tài),可自動標注300種病灶特征,在三甲醫(yī)院測試中肺炎診斷準確率達96.2%,誤診率降低40%。
OpenAI推出Evals API 開發(fā)者可編程定義12項評估指標,自動化測試模型在特定任務的準確率和響應時間,支持持續(xù)迭代優(yōu)化。
阿里云“繁花計劃”啟動 提供1000PFlops免費算力配額,配套商業(yè)化指導服務,覆蓋財務、供應鏈等十大場景,已助力50家企業(yè)完成AI產(chǎn)品全流程開發(fā)。
Jina AI發(fā)布多模態(tài)重排器 支持29種語言及圖文混合文檔精排,在AWS/Azure/GCP市場同步上線,檢索效率提升150%。
谷歌AR眼鏡原型亮相 集成Gemini助手,具備實時翻譯、書籍掃描和物品記憶功能,外觀類似普通黑框眼鏡,同步展示與三星合作的混合現(xiàn)實頭顯。
DeepSeek推出SPCT技術 通過強化學習構建通用獎勵模型,在數(shù)學證明和編程競賽等復雜任務中,模型表現(xiàn)較傳統(tǒng)方法提升35%。
華為發(fā)布盤古大模型3.0行業(yè)版 針對金融、制造領域優(yōu)化參數(shù),電力設備故障預測準確率達94%,推動工業(yè)場景智能化升級。
商湯發(fā)布“日日新6.0”大模型 混合端云協(xié)同架構實現(xiàn)109.5字/秒超高速推理,對標國際頂尖AI模型,重點布局醫(yī)療診斷與金融分析領域
上一篇
暫無評論
發(fā)表評論