每日微信報
人物專訪監(jiān)管
制造芯片
6G 運(yùn)營
大數(shù)據(jù)物聯(lián)網(wǎng)
移動互聯(lián)網(wǎng)量子
云計算互聯(lián)網(wǎng)
報告衛(wèi)星

高通：OpenAI 最小開源模型 gpt-oss-20b 可在驍龍終端運(yùn)行

2025年8月12日 07:28IT之家作者：浩渺

8 月 11 日消息，OpenAI 于 8 月 6 日推出了其最小開源模型 gpt-oss-20b，在常見基準(zhǔn)測試中與 OpenAI o3‑mini 模型取得類似結(jié)果。高通今日宣布，這是 OpenAI 首個可在搭載驍龍平臺的終端側(cè)運(yùn)行的開源推理模型。

IT之家從官方新聞稿獲悉，高通稱 gpt-oss-20b 思維鏈推理模型可直接在搭載驍龍旗艦處理器的終端上運(yùn)行。此前 OpenAI 的復(fù)雜模型僅限云端部署，這是 OpenAI 首次實(shí)現(xiàn)模型支持終端側(cè)推理。通過提前獲取模型，并結(jié)合高通 ® AI 引擎和 Qualcomm® AI Stack 進(jìn)行集成測試，我們發(fā)現(xiàn)這款 200 億參數(shù)的模型表現(xiàn)極為出色，能夠完全在終端側(cè)進(jìn)行思維鏈推理。

高通認(rèn)為這是一個關(guān)鍵轉(zhuǎn)折點(diǎn)：預(yù)示著 AI 的未來方向，即豐富復(fù)雜的助手式推理也將在本地實(shí)現(xiàn)。這也展現(xiàn)了 AI 生態(tài)系統(tǒng)的成熟性，合作伙伴和開發(fā)者可以利用驍龍?zhí)幚砥鳎瑢?shí)時采用 OpenAI 等領(lǐng)軍企業(yè)的開源創(chuàng)新成果。OpenAI 的 gpt-oss-20b 將助力終端設(shè)備利用終端側(cè)推理，帶來隱私保護(hù)和時延方面的優(yōu)勢，同時通過 AI 智能體為云端解決方案提供支持。

高通稱，通過提前獲取 gpt-oss-20b 模型，并結(jié)合 Qualcomm AI Stack 進(jìn)行集成測試，見證了該模型的卓越能力，它能完全在終端側(cè)進(jìn)行復(fù)雜推理。開發(fā)者將可通過 Hugging Face 和 Ollama 等主流平臺獲取該模型，并在搭載驍龍平臺的終端上發(fā)揮其性能。更多部署詳情即將在 Qualcomm AI Hub 上公布。

將 Ollama 的輕量級的開源 LLM 服務(wù)框架和強(qiáng)大的驍龍平臺集成，開發(fā)者和企業(yè)不僅可以直接在搭載驍龍計算平臺的終端上運(yùn)行 gpt-oss-20b 模型，還能夠進(jìn)行網(wǎng)頁搜索等多個默認(rèn)特性，無需額外配置。用戶也可以在 Ollama 上嘗試 Turbo 模式，以探索該模型的更多功能。

編輯：章芳

飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容，凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有，未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像，違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載，請必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性，并完整標(biāo)注作者信息和飛象網(wǎng)來源。
2.凡注明“來源：XXXX”的作品，均轉(zhuǎn)載自其它媒體，在于傳播更多行業(yè)信息，并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題，請在相關(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系，我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777，郵件后綴為cctime.com，冒充本站員工以任何其他聯(lián)系方式，進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為，均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。