港大經管學院公佈人工智能大語言模型評測綜合排行榜

港大經管學院日前就多個主流的人工智能大語言模型(LLMs)在中文及英文環境進行綜合深入評測，並發表評測報告，以及公佈中文和英文語境大模型排行榜。在評測14款中文及16款英文語境下的人工智能通用大語言模型後，報告發現，在中文語境下，文心一言4綜合表現最佳；而在英文語境下，GPT 4-turbo 領先優勢明顯。人工智能大語言模型技術日新月異，雖然為廣大用戶帶來新奇的使用體驗和工作便利，但用戶經常困惑於不同大模型的使用體驗，需要一個用戶視角的、系統的大模型評測。有見及此，港大經管學院創新及資訊管理學教授蔣鎮輝帶領深圳研究院人工智能研究所團隊構建一個通用大語言模型的綜合評價體系，以兩個核心評測目標，包括從用戶視角出發，全面評估主流大模型的能力，以及深入評估和分析國產大模型在英文場景中的優勢和局限性，並探究它們在英文領域的應用潛力。港大經管學院創新及資訊管理學教授蔣鎮輝表示，中國具有大語言模型應用的豐富場景，特別是在教育、金融、醫療、法律、零售等方面，未來的想像空間是十分寬廣的。推動人工智慧技術在各個領域的落地，這需要各方面共同努力。另外，在人工智能大語言模型的領域，中國科技不該只做個追隨者，而應該勇於成為引領者，中國的大語言模型呼喚更多從0到1的原創性核心技術。 (BC) #港大經管學院

<匯港通訊>

港大經管學院公佈人工智能大語言模型評測綜合排行榜

焦點新聞

天文台改發八號西南烈風或暴風信號

天文台早上7時10分改發八號烈風或暴風信號

天文台發出八號西北烈風或暴風信號

「柏瓏III」單日售出3伙套現逾2221萬元

中央氣象台發布颱風橙色預警及暴雨紅色預警