本文為節(jié)選內(nèi)容
如需更多報告,聯(lián)系客服
或掃碼獲取報告

全球大模型競爭中,OpenAI 、 Anthropic 、谷歌三大廠商為第一梯隊, OpenAI 先發(fā)推出 GPT 4 ,在 2023 年基本穩(wěn)定在行業(yè)龍頭地位,而 Anthropic 憑借 Claude 、 谷歌憑借 Gemini 后發(fā),可以看到, 2024 年以來,三家大模型能力呈現(xiàn)互相追趕態(tài)勢。開源大模型廠商中, Meta AI Llama )、歐洲 Mistral AI Mistral )、 Google Gemma )等廠商的大模型性能保持前列。
此外,伴隨 Sora 推出以及 Pika 的出圈,圖像、視頻生成領(lǐng)域的超預(yù)期進展獲得極大關(guān)注,全球圖像生成大模型以Midjourney 、 Stable Diffusion 、 OpenAI 的 DALL·E 為代表,視頻生成以 Runway 的 Gen 、 Pika 和 OpenAI 的 Sora 為代表。


OpenAI發(fā)布文生視頻大模型 Sora ,在全球視頻大模型領(lǐng)域取得里程碑式進展。 今年 2 月 15 日, OpenAI 在官網(wǎng)正式發(fā)布 Sora ,根據(jù) OpenAI 官網(wǎng)介紹, Sora 可以在保持視覺質(zhì)量和遵循用戶的文本提示的情況下,生成長達 1 分鐘的視頻,遙遙領(lǐng)先于以往的視頻生成時長。
GPT4o 實現(xiàn)性能與實用性雙突破,有望加速大模型應(yīng)用落地。 5 月 14 日, OpenAI 在春季發(fā)布會上推出 GPT 4o ,并表示將免費提供給所有用戶使用。 GPT 4o 可接受文本、音頻和圖像的任意組合作為輸入、輸出,在英語文本和代碼方面的性能可對標 GPT 4 Turbo ,同時在 API 中也更快且便宜 50% 。根據(jù) OpenAI 官網(wǎng)信息,在 GPT 4o 之前,使用語音模式與 ChatGPT 對話, GPT 3.5/GPT 4 的平均延遲分別為 2.8/5.4 秒。而GPT 4o 可以在短至 232 毫秒的時間內(nèi)響應(yīng)音頻輸入,平均時長為 320 毫秒,與人類在一次談話中的響應(yīng)時間相似。
7月 18 日, OpenAI 正式推出了 GPT 4o mini ,將取代 ChatGPT 中的舊模型 GPT 3.5 Turbo ,向 ChatGPT 的免費用戶、 ChatGPT Plus 和團隊訂閱用戶開放。 OpenAI 表示, GPT 4o mini 的成本為每百萬輸入標記( token 15 美分和每百萬輸出標記 60 美分,比 GPT 3.5 Turbo 便宜超過 60% 。

Claude 3.5 Sonnet在絕大多數(shù)基準評估中都超越了競品大模型。 今年 3 月 4 日, Anthropic 發(fā)布 Claude 3 系列模型,包含 Opus 、 Sonnet 和 HaikuOpus 代表 Anthropic 最高級、最智能的模型, Sonnet 代表中等級別的模型,在性能和成本效益之間取得平衡, Haiku 代表入門級別或最基礎(chǔ)的快速模型,其中, Claude 3 Opu 為 Claude 3 系列模型的最強版本,根據(jù)官方資料其性能全面超過了 GPT 4 。值得注意的是, Claude 3 全系列模型具有與其他領(lǐng)先模型同等的復(fù)雜視覺功能,可以處理各種視覺格式,包括照片、圖表、圖形和技術(shù)圖表。 6 月 21 日, Anthropic 發(fā)布了全新大模型 Claude 3.5 Sonnet ,號稱為“迄今為止最智能的模型”。據(jù) Anthropic 介紹, Claude 3.5 Sonnet 在絕大多數(shù)基準評估中都超越了競品大模型和自家前代最強 Claude 3 Opus ,與此同時,運行速度、成本與自家前代 Claude 3 Sonnet 相當。

谷歌大模型全線升級。繼 2023 年 12 月谷歌推出其規(guī)模最大、功能最強的多模態(tài)大模型 Gemini 系列之后,今年 2 月 15 日,谷歌發(fā)布 Gemini 1.5在版本中首個登場的多模態(tài)通用模型 Gemini 1.5 Pro ,將穩(wěn)定處理上下文的上限擴大至 100 萬 tokens 。 5 月 14 日,在谷歌 IO 開發(fā)者大會上,谷歌大模型迎來多項升級,基礎(chǔ)大模型方面, Gemini 1.5 Pro 將上下文窗口長度從之前的 100 萬 tokens 進一步擴展至 200 萬 tokens ,谷歌首席執(zhí)行官Pichai 稱這是目前市場處理上下文長度規(guī)模最大的基礎(chǔ)大模型。多模態(tài)大模型方面,
谷歌發(fā)布了視頻生成模型 Veo 以及文生圖模型 Imagen 3 Veo 模型對標 Sora ,能夠根據(jù)文字、圖片和視頻的提示生成長度超過 1 分鐘、分辨率最高 1080p 的視頻; Imagen 3 文生圖模型是 Imagen 系列的升級版,從細節(jié)擬真度來看對標 Midjourney v6 。

今年4 月 18 日, Meta 推出強大的開源人工智能模型 Llama 3 ,發(fā)布包括 8B 和 70B 參數(shù)的兩個版本,作為 Llama2 的重大升級。 Meta 稱,目前正在開發(fā)的最大模型是 400B 參數(shù),將在未來幾個月內(nèi)推出,英偉達科學(xué)家 Jim Fan 認為, Llama3 400B 將成為一個分水嶺,即社區(qū)將獲得開源重量級的 GPT 4 模型,它將改變許多研究工作和草根創(chuàng)業(yè)公司的計算方式。
7月 23 日, LIama 3.1 正式發(fā)布, 405B 版本在 150 多個基準測試集上的表現(xiàn)追平或超越現(xiàn)有領(lǐng)先的基礎(chǔ)模型,包括 GPT 4 、 GPT 4o 和 Claude3.5 Sonnet 。除了與閉源模型相比具有顯著更好的成本 性能比之外, 405B 模型的開放性將使其成為微調(diào)和蒸餾更小模型的優(yōu)質(zhì)選擇。此外,Meta 也推出了 8B 和 70B 模型的升級版本,能力與同等參數(shù)下的頂尖模型基本持平,與具有相似參數(shù)數(shù)量的開閉源模型構(gòu)成強競爭力。

自2022 年 11 月底 ChatGPT 發(fā)布以來, AI 大模型在全球范圍內(nèi)掀起了有史以來規(guī)模最大的人工智能浪潮,國內(nèi)學(xué)術(shù)和產(chǎn)業(yè)界也在抓緊追趕突破。 SuperCLUE 將國內(nèi)大模型發(fā)展大致分為三個階段, 1 )準備期 2022 年 11 月 ChatGPT 發(fā)布 后,國內(nèi)產(chǎn)學(xué)研迅速形成大模型共識。 2 )成長期 2023 年初,國內(nèi)大模型數(shù)量和質(zhì)量開始逐漸增長。 3 )爆發(fā)期 2023 年底至今,各行各業(yè)開源閉源大模型層出不窮,形成百模大戰(zhàn)的競爭態(tài)勢。

從參與者來看,目前我國 AI 大模型廠商大致可以分為四類, 1 )互聯(lián)網(wǎng) 科技公司:以百度、阿里、騰訊、字節(jié)、快手、華為等為代表。 2 AI 公司:以智譜 AI 、昆侖萬維、科大訊飛、商湯科技為代表的專注于 AI 研發(fā)與應(yīng)用的科技公司。 3學(xué)術(shù)、科研機構(gòu):包括清華、北大、復(fù)旦、中科院等國內(nèi)一流高校,以及智源研究院、 IDEA 研究院等科研機構(gòu)。 4 )行業(yè)專家品牌:以月之暗面( Moonshot AI )、百川智能、 MiniMax 等由 AI 專家創(chuàng)業(yè)成立的公司為代表。

從模型能力來看,根據(jù) SuperCLUE 最新的評測結(jié)果,以開源 Llama 3 70B 、 Llama 3 8B 的模型能力為分界線,國內(nèi)大模型可以形成三大梯隊。可以看到,國內(nèi)大模型上半年發(fā)展尤為迅速,
1)開源模型 Qwen2 72B 在 SuperCLUE 基準中表現(xiàn)非常出色,超過眾多國內(nèi)外閉源模型,與Claude 3.5 持平,與 GPT 4o 僅差 4 分。
2)此外,還有 4 個國內(nèi)大模型(深度求索DeepSeek V2 、智譜 GLM 4 、商湯 SenseChat5.0 、OPPO 的 AndesGPT )超過 GPT 4 Turbo 0409 。
3)除了互聯(lián)網(wǎng)大廠和 AI 公司,專家創(chuàng)業(yè)團隊如 Baichuan4 、 Kimi 、 MiniMax abab6.5 均有超過70 分的表現(xiàn),位列國內(nèi)大模型第一梯隊。
4)國內(nèi)絕大部分閉源模型已超過 GPT3.5Turbo 0125 。
