每日最新頭條.有趣資訊

百度文心一言排第二!清華發布大語言模型排名

近日,清華大學新聞與傳播學院沈陽團隊發布《大語言模型綜合性能評估報告》,報告本次評估選取了ChatGPT、文心一言、通義千問等7個大語言模型,圍繞生成質量、使用與性能、安全與合規三大維度,全面考察大語言模型中文語義理解、邏輯推理等20項指標。

遊民星空

在這7款大模型中,GPT-4獲得了毫無懸念的第一,第二名是百度的文心一言,其次是GPT-3.5,後面就是Claude、訊飛星火、阿里雲的通義千問及昆侖的天工。

遊民星空

但對國內用戶而言,中文理解能力也是關鍵指標。綜合來看,文心一言語義理解能力突出。在部分中文語義理解方面,文心一言以92%的得分率排名榜首,超越訊飛星火、GPT-4。

憑借知識增強的核心特色,文心一言對本土語言特性把握更精準,能夠更好處理與本土文化相關的主題和背景,如詩歌、方言等,具備更強的國內落地空間。

遊民星空

獲得更多的PTT最新消息
按讚加入粉絲團