百度文心一言排第二！清華發布大語言模型排名

公開日: 2023-08-10

近日，清華大學新聞與傳播學院沈陽團隊發布《大語言模型綜合性能評估報告》，報告本次評估選取了ChatGPT、文心一言、通義千問等7個大語言模型，圍繞生成質量、使用與性能、安全與合規三大維度，全面考察大語言模型中文語義理解、邏輯推理等20項指標。

在這7款大模型中，GPT-4獲得了毫無懸念的第一，第二名是百度的文心一言，其次是GPT-3.5，後面就是Claude、訊飛星火、阿里雲的通義千問及昆侖的天工。

但對國內用戶而言，中文理解能力也是關鍵指標。綜合來看，文心一言語義理解能力突出。在部分中文語義理解方面，文心一言以92%的得分率排名榜首，超越訊飛星火、GPT-4。

憑借知識增強的核心特色，文心一言對本土語言特性把握更精準，能夠更好處理與本土文化相關的主題和背景，如詩歌、方言等，具備更強的國內落地空間。