每經(jīng)編輯 杜宇
當?shù)貢r間周二(8月15日),人工智能研究公司OpenAI在官網(wǎng)稱,其開發(fā)了一種使用GPT-4進行內(nèi)容審核的解決方案,有望減輕人工審核員的負擔。
圖片來源:OpenAI官網(wǎng)
OpenAI表示,將GPT-4用于內(nèi)容策略開發(fā)和內(nèi)容審核決策,從而實現(xiàn)更一致的標記、更快的策略優(yōu)化反饋循環(huán),以及減少人工審核人員的參與。
OpenAI稱,內(nèi)容審核在維持數(shù)字平臺的健康方面發(fā)揮著至關重要的作用。使用GPT-4的內(nèi)容審核系統(tǒng)可以更快地迭代策略更改,將周期從幾個月縮短到幾個小時。GPT-4還能夠解釋長內(nèi)容策略文檔中的規(guī)則和細微差別,并立即適應策略更新,從而實現(xiàn)更一致的標記。
OpenAI相信,這為數(shù)字平臺的未來提供了一個更積極的愿景,在數(shù)字平臺上,人工智能可以根據(jù)特定平臺的政策幫助調(diào)節(jié)在線流量,并減輕大量人類版主的心理負擔。任何擁有OpenAI API訪問權限的人都可以實現(xiàn)這種方法來創(chuàng)建自己的人工智能輔助審核系統(tǒng)。
OpenAI一直在測試該技術,并邀請客戶也進行試驗。OpenAI表示,其工具有望幫助企業(yè)在一天左右的時間內(nèi),就完成原本需要六個月才能做完的工作。
內(nèi)容審核需要細致的努力、敏感度、對上下文的深刻理解,以及對新用例的快速適應,這使得它既耗時又具有挑戰(zhàn)性。傳統(tǒng)上,這項任務的負擔落在了人類主持人身上,他們在較小的垂直特定機器學習模型的支持下,篩選大量內(nèi)容,過濾出有毒有害的材料。這個過程本身就很慢,可能會給人類調(diào)節(jié)者帶來心理壓力。
OpenAI表示,我們正在探索使用LLM來應對這些挑戰(zhàn)。我們的大型語言模型,如GPT-4,可以理解并生成自然語言,使其適用于內(nèi)容審核。模型可以根據(jù)提供給它們的政策指導方針做出適度的判斷。
有了這個系統(tǒng),開發(fā)和定制內(nèi)容策略的過程從幾個月縮短至幾個小時。一旦制定了政策指南,政策專家就可以通過識別少量示例并根據(jù)政策為其分配標簽來創(chuàng)建一組黃金數(shù)據(jù)。然后,GPT-4讀取策略并為同一數(shù)據(jù)集分配標簽,但看不到答案。
通過檢查GPT-4的判斷與人類判斷之間的差異,政策專家可以要求GPT-4提出標簽背后的推理,分析政策定義中的歧義,解決困惑,并相應地在政策中提供進一步的澄清。我們可以重復步驟操作,直到我們對政策質(zhì)量感到滿意為止。
這個迭代過程產(chǎn)生了精細的內(nèi)容策略,這些策略被轉(zhuǎn)換為分類器,從而能夠大規(guī)模部署策略和內(nèi)容審核。
在審核能力上,OpenAI承認GPT-4的標記質(zhì)量與經(jīng)過輕度訓練的人類審核員相似,但與經(jīng)驗豐富、訓練有素的人類審核員相比仍有差距。對此,OpenAI強調(diào),審核的過程不應該完全自動化。
值得注意的是,OpenAI的工具并不是該領域第一個引入人工智能的先行者。早于2017年,谷歌的技術團隊就開發(fā)了一個基于AI的內(nèi)容審核API,名為“Perspective”,已經(jīng)被多家媒體組織所使用。
但即使如此,一些企業(yè)仍選擇將審核工作外包給其他人力公司來節(jié)省成本。
OpenAI稱,其最新的內(nèi)容審核系統(tǒng)為數(shù)字平臺的未來提供了一個更積極的愿景,即AI可以根據(jù)平臺特定的政策減輕大量人工審核人員的精神負擔。公司還透露,已經(jīng)有一些客戶在使用這一流程。
每日經(jīng)濟新聞綜合OpenAI官網(wǎng)、第一財經(jīng)、財聯(lián)社
封面圖片來源:視覺中國(16.940, -0.33, -1.91%)-VCG111419382557