123,123,123

長期致力于定義和“管理”所有開源事務(wù)的開放源代碼倡議（OSI），周一發(fā)布了其開源AI定義（OSAID）1.0版。根據(jù)OSAID，AI模型若要被視為開源，必須提供足夠的信息，使任何人都可以“實質(zhì)性地”重建該模型。模型還必須披露與其訓練數(shù)據(jù)相關(guān)的任何重要細節(jié)，包括數(shù)據(jù)的來源、處理方式以及獲取或許可的方式。然而，Meta并不認可這一定義，認為不存在單一的開源AI定義。

開源AI終于有了“官方”定義。

OSAID還列出了開發(fā)者使用開源AI時應(yīng)享有的使用權(quán)，例如可以為任何目的使用和修改模型，而無需獲得他人許可。

OSI執(zhí)行副總裁Stefano Maffulli表示，制定開源AI官方定義主要目的是，讓政策制定者和AI開發(fā)者達成一致。

“監(jiān)管機構(gòu)已經(jīng)在關(guān)注這一領(lǐng)域。我們明確向各方利益相關(guān)者和社區(qū)進行了推廣，甚至還試圖聯(lián)系那些經(jīng)常與監(jiān)管機構(gòu)交流的組織，來獲取早期反饋。”

“開源AI是一種允許你完全理解其構(gòu)建方式的AI模型，這意味著你可以訪問所有組件，比如用于訓練和數(shù)據(jù)過濾的完整代碼。最重要的是，你應(yīng)該能夠在其基礎(chǔ)上構(gòu)建�！�

OSI并不強制施壓開發(fā)者遵守OSAID定義，但打算對那些不符合該定義卻被描述為“開源”的模型進行標記�！拔覀兿Ｍ斢腥嗽噲D濫用這個術(shù)語時，AI社區(qū)會說，‘我們不承認這是開源’，并加以糾正�！盡affulli說道。

Meta：我反對

目前，許多初創(chuàng)企業(yè)和大型科技公司，尤其是Meta，稱其AI模型發(fā)布策略為“開源”，但很少符合OSAID的標準。研究人員發(fā)現(xiàn)，許多“開源”模型實際上只是名義上開源，但實際訓練模型所需的數(shù)據(jù)是保密的，而且運行這些模型所需要的計算能力超出了許多開發(fā)者的能力范圍。

例如，Meta要求月活躍用戶超過7億的平臺獲得特殊許可才能使用其Llama模型。Maffulli公開批評Meta將其模型稱為“開源”的做法。而谷歌(168.34, 1.35, 0.81%)和微軟(426.59, -1.56, -0.36%)在與OSI討論后，已經(jīng)同意不再將不完全開放的模型稱為“開源”，但Meta并未這么做。

此外，長期宣傳其模型為“開源”的Stability AI要求年收入超過100萬美元的企業(yè)獲得企業(yè)許可，而法國AI新創(chuàng)公司Mistral的許可證則禁止將某些模型和輸出用于商業(yè)用途。

Meta自然不認同這一評估。盡管該公司參與了定義的起草過程，但對OSAID的措辭表示異議。Meta發(fā)言人稱，Llama的許可條款和隨附的可接受使用政策對有害應(yīng)用提供了防護。Meta還表示，在加州AI相關(guān)法規(guī)正在演變之際，該公司對共享模型細節(jié)的做法是“謹慎的”。

“我們在許多方面與OSI的伙伴立場一致，但我們以及業(yè)內(nèi)其他公司都不同意他們的新定義，我們認為沒有單一的開源AI定義，因為過去的開源定義無法涵蓋當今迅速發(fā)展的AI模型的復雜性。我們讓Llama免費公開使用，并通過許可和使用政策來確保安全。無論技術(shù)定義如何，我們將繼續(xù)與OSI和其他行業(yè)團體合作，增加免費AI使用的便利程度�！�

分析認為，Meta不愿公開訓練數(shù)據(jù)，很可能與其自身及大多數(shù)AI模型的開發(fā)方式有關(guān)。

AI公司從社交媒體和網(wǎng)站上收集大量圖像、音頻和視頻等數(shù)據(jù)，并以這些“公開可用數(shù)據(jù)”訓練模型。在如今競爭激烈的市場中，數(shù)據(jù)集的收集和優(yōu)化方法被視為競爭優(yōu)勢，公司常以此為由拒絕披露。

但訓練數(shù)據(jù)的細節(jié)也可能讓開發(fā)者面臨法律風險。作者和出版商聲稱，Meta使用了受版權(quán)保護的書籍進行訓練。藝術(shù)家們也對Stability AI提起訴訟，指控其使用其作品而未給予認可，將其行為比作盜竊。

因此，OSAID的開源AI定義，可能會給那些試圖順利解決訴訟的公司帶來問題，特別是如果原告和法官認為該定義足夠合理而在法庭上引用。

什么是開源AI？官方定義終于來了 Meta Llama模型沒過關(guān)

什么是開源AI？官方定義終于來了 Meta Llama模型沒過關(guān)