港大經管學院公佈人工智能大語言模型評測綜合排行榜 X

12/03/2024 19:12

<匯港通訊> 港大經管學院日前就多個主流的人工智能大語言模型(LLMs)在中文及英文環境進行綜合深入評測，並發表評測報告，以及公佈中文和英文語境大模型排行榜。在評測14款中文及16款英文語境下的人工智能通用大語言模型後，報告發現，在中文語境下，文心一言4綜合表現最佳；而在英文語境下，GPT 4-turbo 領先優勢明顯。

人工智能大語言模型技術日新月異，雖然為廣大用戶帶來新奇的使用體驗和工作便利，但用戶經常困惑於不同大模型的使用體驗，需要一個用戶視角的、系統的大模型評測。有見及此，港大經管學院創新及資訊管理學教授蔣鎮輝帶領深圳研究院人工智能研究所團隊構建一個通用大語言模型的綜合評價體系，以兩個核心評測目標，包括從用戶視角出發，全面評估主流大模型的能力，以及深入評估和分析國產大模型在英文場景中的優勢和局限性，並探究它們在英文領域的應用潛力。

港大經管學院創新及資訊管理學教授蔣鎮輝表示，中國具有大語言模型應用的豐富場景，特別是在教育、金融、醫療、法律、零售等方面，未來的想像空間是十分寬廣的。推動人工智慧技術在各個領域的落地，這需要各方面共同努力。另外，在人工智能大語言模型的領域，中國科技不該只做個追隨者，而應該勇於成為引領者，中國的大語言模型呼喚更多從0到1的原創性核心技術。 (BC)

#港大經管學院

本文所提供的任何資料只供參考之用。本網站概不對這些資料的準確性、完整性、合時性或對基於這些資料而作出的任何決定負責。而其他網站的轉載或翻譯,並不代表本網站推介或認可該等其他網站。本網站不對該等其他網站的內容負責,亦未核實有關內容。