国产精品jvid在线观看,国产不卡a,亚洲一级大片,一级二级毛片,欧美一级视频免费看,国产一级特黄a大片免费,亚洲综合久久成人69

如果您的瀏覽器未跳轉(zhuǎn),請(qǐng)點(diǎn)擊此處進(jìn)行游戲并領(lǐng)取優(yōu)惠

今年會(huì) - jinnianhui | jinnian

新聞資訊

伴隨著“中國(guó)制造”,“中國(guó)創(chuàng)造”走向世界,jinnianhui.com將以卓越的
服務(wù)能力協(xié)助我們的客戶完成全球知識(shí)產(chǎn)權(quán)布局。

當(dāng)前位置:首頁(yè) > 資訊與資源 > 專利視點(diǎn)
返回列表頁(yè)
生成式人工智能(GenAI+)最新專利技術(shù)發(fā)展態(tài)勢(shì)系列之一——GenAI+大模型

來源:jinnianhui.com檢索分析咨詢部    發(fā)布時(shí)間:2025-03-21 13:51    點(diǎn)擊量:928

分享到: | | |

  

2024年7月,世界知識(shí)產(chǎn)權(quán)組織WIPO發(fā)布了《生成式人工智能專利態(tài)勢(shì)報(bào)告》(以下簡(jiǎn)稱:WIPO報(bào)告),報(bào)告分析了從2014年至2023年底的十年間,全球生成式人工智能(GenAI)相關(guān)專利情況,并給出了權(quán)威的結(jié)論。《WIPO報(bào)告》顯示,在這10年間,全球GenAI相關(guān)專利申請(qǐng)有5.4萬(wàn)件,其中中國(guó)的專利申請(qǐng)量以3.8萬(wàn)件占據(jù)首位,遠(yuǎn)遠(yuǎn)超過美國(guó)、韓國(guó)、日本和印度等國(guó)。由于 GenAI 技術(shù)呈現(xiàn)井噴式發(fā)展,相應(yīng)的專利申請(qǐng)量也呈現(xiàn)指數(shù)式上升,僅2023年公布的 GenAI 相關(guān)專利就超過了全部總數(shù)的1/4。相應(yīng)地,GenAI技術(shù)淘汰速度也非???,可以想見過去10年的專利技術(shù),越是新的技術(shù)越是具有參考借鑒價(jià)值。

本文將沿襲《WIPO報(bào)告》的專利分析思路,聚焦ChatGPT發(fā)布后,即2023年1月以后公開的GenAI幾個(gè)最主要的大模型相關(guān)專利數(shù)據(jù)進(jìn)行分析,為感興趣的客戶提供參考。

關(guān)注的大模型有:

1. 生成對(duì)抗網(wǎng)絡(luò)Generative adversarial networks (GAN)

2. 變分自編碼器 Variational autoencoders (VAE)

3. 基于解碼器的大型語(yǔ)言模型 decoder-based large language models (decoder-based LLM)

4. 自回歸模型 Autoregressive models(AM)

5. 擴(kuò)散模型 Diffusion models(DM)

WIPO報(bào)告》顯示,在其調(diào)研的過去10年間的 GenAI 大模型專利中,大多數(shù)專利屬于GANs。

2014年至2023年間,GANs大模型的專利家族有9700個(gè),僅2023年就有2400個(gè)專利家族公布。VAEs和LLMs的專利家族數(shù)量分列第二和第三位,2014年至2023年間分別擁有約1800和1300個(gè)新專利家族。

在專利增長(zhǎng)方面,GANs專利在過去十年中增長(zhǎng)最為強(qiáng)勁。然而,最近這一速度有所放緩。相比之下,擴(kuò)散模型(DMs)和 LLMs 在過去三年中顯示出更高的增長(zhǎng)率,擴(kuò)散模型的專利家族數(shù)量從2020年的18個(gè)增加到2023年的441個(gè),LLMs的專利家族從2020年53個(gè)增加到了2023年881個(gè)。顯然ChatGPT 等現(xiàn)代聊天機(jī)器人引發(fā)的 GenAI 熱潮增加了人們對(duì) DMs和LLMs大模型的研發(fā)投入。

一、GenAI 大模型的前世今生

2022年11月,OpenAI 推出了聊天生成預(yù)訓(xùn)練轉(zhuǎn)換器(ChatGPT),并且迅速爆火。該產(chǎn)品以強(qiáng)大的文字處理和人機(jī)交互功能迅速風(fēng)靡全球。以ChatGPT 等大語(yǔ)言模型為標(biāo)志的生成式AI 的成功,帶來了新的范式革命和廣闊的商業(yè)前景,資本市場(chǎng)持續(xù)高漲的熱情也足以彰顯它的價(jià)值。當(dāng)然,ChatGPT等大語(yǔ)言模型也不是橫空出世的,以下我們簡(jiǎn)單了解一下生成式AI的前世今生。

“GenAI+大模型”是一個(gè)結(jié)合了生成式人工智能(Generative AI)和大型語(yǔ)言模型(Large Language Model, LLM)的先進(jìn)概念。生成式人工智能(Generative AI,簡(jiǎn)稱 GenAI)是一類能夠生成新內(nèi)容(如文本、圖像、音頻等)的人工智能技術(shù)。它通過學(xué)習(xí)和理解大量數(shù)據(jù)來模擬人類的創(chuàng)造力。大型語(yǔ)言模型(Large Language Model)是自然語(yǔ)言處理領(lǐng)域中的一種深度學(xué)習(xí)模型,具有數(shù)以億計(jì)的參數(shù),能夠理解和生成自然語(yǔ)言文本。這些模型通常通過大規(guī)模語(yǔ)料庫(kù)的訓(xùn)練來提高性能。

生成式AI技術(shù)于2010年代初開始出現(xiàn),當(dāng)時(shí)的變分自動(dòng)編碼器(VAE)成為第一個(gè)廣泛用于生成逼真圖像和語(yǔ)音的深度學(xué)習(xí)模型。自動(dòng)編碼器的工作原理是將未標(biāo)記的數(shù)據(jù)編碼為壓縮表示,然后將數(shù)據(jù)解碼回其原始形式。普通自動(dòng)編碼器可應(yīng)用于多種用途,包括重建損壞或模糊的圖像。變分自動(dòng)編碼器不僅增強(qiáng)了重建數(shù)據(jù)的關(guān)鍵能力,而且還可以輸出原始數(shù)據(jù)的變化形式。

這種生成新數(shù)據(jù)的能力引發(fā)了一系列新技術(shù)的快速發(fā)展,從生成式對(duì)抗網(wǎng)絡(luò)(GAN)到擴(kuò)散模型,這些技術(shù)能夠生成更加逼真的虛構(gòu)圖像。因此,變分自動(dòng)編碼器為當(dāng)今的生成式AI奠定了基礎(chǔ)。變分自動(dòng)編碼器基于編碼器和解碼器塊構(gòu)建而成,這種架構(gòu)也是當(dāng)今大語(yǔ)言模型(LLM)的基礎(chǔ)。具體來說,編碼器將數(shù)據(jù)集壓縮為密集表示形式,在抽象空間中將相似的數(shù)據(jù)點(diǎn)排列得更緊密。解碼器從這個(gè)抽象空間中進(jìn)行采樣以創(chuàng)建新內(nèi)容,同時(shí)保留數(shù)據(jù)集的最重要特征。

Transformer將“編碼器-解碼器”架構(gòu)與文本處理機(jī)制相結(jié)合,于是形成了基于解碼器的大型語(yǔ)言模型(decoder-based LLMs)。編碼器將原始文本轉(zhuǎn)換為“嵌入”表示。解碼器將這些嵌入與模型之前的輸出相結(jié)合,并連續(xù)預(yù)測(cè)句子中的每個(gè)單詞。通過填空猜謎游戲,編碼器可以了解單詞與句子之間的關(guān)系,而無需任何人標(biāo)記詞性。Transformer甚至可以在未制定特定任務(wù)的情況下進(jìn)行預(yù)訓(xùn)練。學(xué)習(xí)這些強(qiáng)大的表示之后,就可以使用更少的數(shù)據(jù)來增強(qiáng)模型的專業(yè)化水平,以便執(zhí)行給定的任務(wù)。Transformer因其全面多樣的功能而被稱為基礎(chǔ)模型。基礎(chǔ)模型在理論上可以應(yīng)用于許多領(lǐng)域,因而提供了加速和擴(kuò)大生成式AI采用的機(jī)會(huì)。例如,大規(guī)模參數(shù)的LLM可以改變整個(gè)組織中的信息生成和共享方式。參數(shù)是在訓(xùn)練時(shí)使用的變量,有助于推斷新內(nèi)容。只需對(duì)LLM進(jìn)行適當(dāng)調(diào)整,以適應(yīng)語(yǔ)義搜索、分類、預(yù)測(cè)、摘要生成和翻譯等任即可。基礎(chǔ)模型的采用得到了一系列主流的新興AI工程最佳實(shí)踐的支持,從模型開發(fā)到快速工程,這些通用實(shí)踐和方法大幅簡(jiǎn)化了整個(gè)企業(yè)和生態(tài)系統(tǒng)的協(xié)作?;A(chǔ)模型需要大量的計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)資源,會(huì)消耗大量的能源。只有經(jīng)過持續(xù)不斷的實(shí)驗(yàn)和迭代才有可能取得成功。

自回歸模型(AM)是一種概率模型,通過對(duì)給定序列中在先觀測(cè)的每個(gè)條件概率進(jìn)行建模,來描述觀測(cè)序列的概率分布。換句話說,自回歸模型通過考慮先前的值來預(yù)測(cè)序列中的下一個(gè)值。在GenAI的背景下,自回歸模型通常用于生成新的數(shù)據(jù)樣本。自回歸模型適用于語(yǔ)言生成、圖像合成和其他生成任務(wù)。自回歸模型在應(yīng)用于自然語(yǔ)言處理任務(wù)(例如,大多數(shù)現(xiàn)代LLM,如GPT-3或GPT-4是自回歸的)和圖像生成任務(wù)(如PixelCNN)時(shí)特別成功。因此可以認(rèn)為 AM 大模型是和LLM大模型配合使用的。

擴(kuò)散模型的靈感來自擴(kuò)散的概念,擴(kuò)散在物理學(xué)中用于模擬一組粒子在兩個(gè)不同物理區(qū)域中的運(yùn)動(dòng)。用于圖像生成的擴(kuò)散模型涉及一個(gè)神經(jīng)網(wǎng)絡(luò),用于預(yù)測(cè)和去除給定噪聲圖像中的噪聲。生成過程相當(dāng)于首先對(duì)圖像應(yīng)用隨機(jī)噪聲(隨機(jī)像素),然后迭代使用神經(jīng)網(wǎng)絡(luò)去除噪聲。隨著噪聲的逐漸消除,一個(gè)新穎而有意義的圖像被構(gòu)建出來,由額外的機(jī)器學(xué)習(xí)機(jī)制控制,如圖4所示。近年來,擴(kuò)散模型取得了長(zhǎng)足的進(jìn)步,現(xiàn)在對(duì)于文本到圖像的生成非常成功,例如穩(wěn)定擴(kuò)散(Rombach等人,2021)和DALL-E模型家族(OpenAI 2021)。

生成對(duì)抗網(wǎng)絡(luò)(GAN)Goodfellow等人于2014年提出的一種用于任務(wù)生成的深度學(xué)習(xí)模型。GAN由兩部分組成,生成器(Generator)和判別器(Discriminator)。生成器是一個(gè)生成輸出圖像的神經(jīng)網(wǎng)絡(luò),判別器一個(gè)評(píng)估生成器生成的圖像真實(shí)度的神經(jīng)網(wǎng)絡(luò)。生成過程是這兩部分之間的競(jìng)爭(zhēng)。生成器改進(jìn)其輸出以誤導(dǎo)判別器,判別器試圖提高其區(qū)分真實(shí)圖像和生成圖像的能力,以避免被生成器誤導(dǎo)。因此,生成器將最大限度地提高其生成逼真圖像的能力。如今,GAN用于許多涉及圖像的任務(wù),如生成和增強(qiáng)照片級(jí)真實(shí)感圖像。

二、ChatGPT發(fā)布后GenAI大模型的發(fā)展

為了更好地了解最新的 GenAI+大模型 的技術(shù)發(fā)展情況,基于《WIPO報(bào)告》的專利分析思路,聚焦 ChatGPT 發(fā)布后,即2023年1月以后全球公開的 GenAI 幾個(gè)最主要的大模型相關(guān)專利數(shù)據(jù),了解這方面全球最新的研究成果。本文中所研究的專利是根據(jù)專利摘要、權(quán)利要求或標(biāo)題中的信息,可以明確屬于哪個(gè)大模型的 GanAI 相關(guān)專利,這和《WIPO報(bào)告》的專利篩選規(guī)則一致。但是由于所用數(shù)據(jù)庫(kù)的不同造成了檢索式略有不同,因此檢索命中數(shù)量也略有不同,但是沒有本質(zhì)變化,不會(huì)影響分析結(jié)論。

 

1 2014-2023年GenAI大模型相關(guān)專利公開時(shí)間趨勢(shì)

從圖 1 各大模型公開趨勢(shì)圖可以清晰的得知 GAN 在近10年增長(zhǎng)最為迅猛,但是2022年后增長(zhǎng)有所放緩;與之相反,2022年后 LLM 和 DM 專利公開量一改過去零星的申請(qǐng)量,其全球申請(qǐng)量呈現(xiàn)了迅速攀升的態(tài)勢(shì)。可見在OpenAI公司推出ChatGPT的同時(shí),即在2022年,GAN,LLM,DM 的專利申請(qǐng)趨勢(shì)已經(jīng)發(fā)生了異動(dòng),研發(fā)熱點(diǎn)已經(jīng)順應(yīng)市場(chǎng)應(yīng)用的需求發(fā)生了轉(zhuǎn)向。GhatGPT 并非橫空出世的,而是順勢(shì)而為,在眾多研發(fā)實(shí)體推出的解決方案中脫穎而出,從而引領(lǐng)了之后的研發(fā)方向。

另外 VAE 相關(guān)專利的公開量則在近10年呈現(xiàn)緩慢的增長(zhǎng)態(tài)勢(shì),AM 相關(guān)專利則一直只有零星的申請(qǐng)量??梢?VAE和AM兩個(gè)大模型和當(dāng)今最熱的 GenAI 應(yīng)用場(chǎng)景并不特別相關(guān)。

GAN,LLM,DM 這3種大模型的技術(shù)發(fā)展和應(yīng)用受到 ChatGPT 帶來的 AI 技術(shù)轉(zhuǎn)向的深刻影響。我們非常有必要進(jìn)一步研究ChatGPT發(fā)布后(2023年1月1日~2024年6月30日)各大模型的公開量(見圖 2)。

 

2 ChatGPT發(fā)布后各大模型的公開量

2給出了各大模型在ChatGPT發(fā)布后(2023年1月1日~2024年6月30日)的全球相關(guān)專利的公開量。雖然 GAN 相關(guān)專利的公開量的增長(zhǎng)有所放緩,但是 GAN 相關(guān)專利公開量仍然是 LLM 相關(guān)專利的兩倍。受 GhatGPT 的發(fā)布影響非常少的大模型 VAE 和 AM 在這段時(shí)間的申請(qǐng)量非常少,尤其是 AM 近10年來專利申請(qǐng)量一直都非常少,可以預(yù)見在未來沒有新的技術(shù)方向涌現(xiàn)的情況下,AM 大模型將依然并不是最主要的模型。

當(dāng)然,這里必須指出,根據(jù)專利標(biāo)題、摘要以及權(quán)利要求等信息,將5種不同的大模型的相關(guān)專利分配在不同組的方法也是有缺陷的,所有GenAI專利家族中有很大一部分不適合任何特定的大模型。許多GenAI專利的標(biāo)題、摘要以及權(quán)利要求不包含特定的大模型關(guān)鍵字,而是專注于描述專利的應(yīng)用,并且在專利說明書里面只對(duì)使用的GenAI過程進(jìn)行了一般性描述。這使得我們很難將一些專利映射到五個(gè)核心GenAI模型,同時(shí)這5種不同的大模型在技術(shù)解決方案上也有一些重疊。

因此以上分析方法可能帶來一些信息失真,我們非常有必要進(jìn)一步結(jié)合應(yīng)用領(lǐng)域、大模型訓(xùn)練/處理的數(shù)據(jù)類型、以及知名GenAI技術(shù)研發(fā)主體進(jìn)行深入分析,以獲得更加有意義的參考信息。敬請(qǐng)期待!

 

 

首頁(yè)| jinnianhui.com| 知識(shí)產(chǎn)權(quán)代理| 檢索分析咨詢| 軟件與專利信息| 法律服務(wù)| 核心團(tuán)隊(duì)| 資質(zhì)與榮譽(yù)| 資訊與資源

Copyright?2003 今年會(huì) - jinnianhui | jinnian All Rights Reserved. 京ICP備29172916號(hào)-1    公安機(jī)關(guān)備案號(hào):31010602000425

jinnianhui.com知識(shí)產(chǎn)權(quán)集團(tuán)免費(fèi)咨詢熱線: 021-51096606*888    手機(jī)號(hào):13651741972(同微信號(hào))

服務(wù)時(shí)間:(周一至周五) 09:00-12:00 13:00-17:30

微信公眾號(hào)

官網(wǎng)移動(dòng)端

jinnianhui.com 網(wǎng)站地圖