6 月 21 日消息,Kimi 首個智能體產(chǎn)品 Kimi-Researcher 已于 20 日啟動小范圍灰度測試。作為專為深度研究任務(wù)打造的 Agent 模型,其基于端到端自主強(qiáng)化學(xué)習(xí)技術(shù)訓(xùn)練,未來月之暗面還將逐步開源該模型的基礎(chǔ)預(yù)訓(xùn)練及強(qiáng)化學(xué)習(xí)版本。

Kimi-Researcher 深度研究模型開啟內(nèi)測:萬字報告可追溯,性能超越多巨頭模型.jpg

Kimi-Researcher 在處理問題時展現(xiàn)出強(qiáng)大的自主任務(wù)規(guī)劃能力,具體流程如下:
  • 澄清問題:理解問題時主動反問,構(gòu)建更清晰的問題空間;

  • 深入思考:每個任務(wù)平均進(jìn)行 23 步推理,自主梳理并解決需求;

  • 主動搜索:每個任務(wù)平均規(guī)劃 74 個關(guān)鍵詞,找到 206 個網(wǎng)址,模型會判斷并篩選出信息質(zhì)量最高的前 3.2% 內(nèi)容,剔除冗余、低質(zhì)信息;

  • 調(diào)用工具,交付結(jié)果:自主調(diào)用瀏覽器、代碼等工具處理原始數(shù)據(jù)、自動生成分析結(jié)論,端到端完成交付。

  • Kimi-Researcher 深度研究模型開啟內(nèi)測:萬字報告可追溯,性能超越多巨頭模型.jpg

為保證輸出質(zhì)量和信息覆蓋度,Kimi-Researcher 采用異步執(zhí)行方式,用更多時間逐步推理、檢索和撰寫內(nèi)容。
用戶最終將收到兩份交付成果:
  • 一份信息詳實、可溯源的深度研究報告:報告平均長度萬字以上,平均引用約 26 個高質(zhì)量、可溯源信源,所有引用內(nèi)嵌正文,點(diǎn)擊即可跳轉(zhuǎn)并高亮原文,便于驗證與追溯。

  • 一個可交互、可分享的動態(tài)可視化報告:結(jié)構(gòu)化排版搭配思維導(dǎo)圖,讓趨勢、異常等重要信息一目了然,無需閱讀全文也能迅速把握整體結(jié)構(gòu)與核心結(jié)論,還支持在線生成鏈接分享。

在高難度 AI 基準(zhǔn)測試 “人類最后一次考試(HLE)” 中,Kimi-Researcher 在完全零結(jié)構(gòu)、無流程設(shè)計的設(shè)置下表現(xiàn)出色:Pass@1 準(zhǔn)確率達(dá) 26.9%,Pass@4 準(zhǔn)確率為 40.17%,這一成績超過了 Claude 4 Opus(10.7%)、Gemini 2.5 Pro(21.6%),略高于 OpenAI Deep Research(26.6%),和 Gemini-Pro 的 Deep Research Agent(26.9%)打平,是目前已知最高水平之一。此外,在紅杉中國發(fā)布的 xbench 基準(zhǔn)測試中,Kimi-Researcher 在 DeepSearch 任務(wù)中取得 69% 的平均通過率,領(lǐng)先該榜中其他模型。
Kimi-Researcher 的推出,為深度研究領(lǐng)域帶來了新的技術(shù)突破,其強(qiáng)大的性能和可追溯性,有望在學(xué)術(shù)研究、商業(yè)分析等多個領(lǐng)域發(fā)揮重要作用。此次內(nèi)測的開啟,也讓人們對其未來的應(yīng)用充滿期待。

來【龍頭AI網(wǎng)】了解最新AI資訊!