夸克健康大模型在 12 門國家副主任醫(yī)師職稱考試中成績超過合格線,成為國內(nèi)首個成功跨越這一門檻的大模型。這意味著大模型在嚴肅醫(yī)療場景中邁出了從 “知識記憶” 向 “臨床推理” 躍遷的關(guān)鍵一步。
此前,國內(nèi)大模型多停留在臨床執(zhí)業(yè)醫(yī)師資格考試階段,只能拿到初級職稱??淇藙t實現(xiàn)了從初級到副高級職稱的兩級跳。夸克健康大模型以通義千問為基礎(chǔ),通過海量的高質(zhì)量數(shù)據(jù)構(gòu)建和多階段后訓(xùn)練策略實現(xiàn)了此次突破。
全新的大模型能力已經(jīng)可以直接通過夸克搜索調(diào)用。用戶在使用中會發(fā)現(xiàn),對于嚴肅醫(yī)療問題夸克會通過先分析后搜索,動態(tài)檢索書籍、指南、藥品說明書、醫(yī)典論文等。這種高搜商的策略顯著地提升了復(fù)雜病例的準確率。
此次副主任醫(yī)師職稱考試評測覆蓋了 12 個常用學(xué)科,包括全科醫(yī)學(xué)、普通內(nèi)科學(xué)、普通外科學(xué)、婦產(chǎn)科學(xué)、小兒內(nèi)科學(xué)、腫瘤內(nèi)科學(xué)、口腔醫(yī)學(xué)、耳鼻咽喉科學(xué)、眼科學(xué)、皮膚與性病學(xué)、精神病學(xué)、麻醉學(xué)。在上述學(xué)科領(lǐng)域,夸克健康大模型均超過合格線,并在全科醫(yī)學(xué)、腫瘤內(nèi)科學(xué)、皮膚與性病學(xué)、精神病學(xué) 4 個學(xué)科達到主任醫(yī)師及格線。
在初級與中級職稱考試中,更小尺寸的夸克健康大模型相比滿血版基礎(chǔ)模型最高領(lǐng)先 7 分和 10 分左右。進入難度顯著提高、強調(diào)臨床綜合運用的副高職稱考試時,夸克最高領(lǐng)先幅度擴大至 30 分,在長鏈推理、診療路徑規(guī)劃上有顯著提升。這項研究驗證了垂直模型在性能提升上具備巨大潛力。
對題型維度的深入剖析顯示,多選題與病例分析題是所有模型誤判率最高的兩類。個別通用基礎(chǔ)模型在多選題上的正確率均不足 60%,而夸克借助 “醫(yī)療長思考” 機制達到 71%。在病例分析題中,夸克通過檢索增強與分步推理組合策略,將正確率提升至 53%。
夸克健康算法工程師徐健表示,“機器通過考試并不意味著可以替代醫(yī)生,但它展示了在輔助診療決策、循證檢索與患者溝通方面的巨大潛力。我們將不斷強化模型能力,幫助醫(yī)生和患者提升診療效率,為用戶在居家場景下提供更多健康管理能力”。

來【龍頭AI網(wǎng)】了解最新AI資訊!