這迫使微軟不得不對硬件資源采取配額供應(yīng)的方式,限制其他內(nèi)部 AI 工具開發(fā)團隊的使用量,從而確?;?GPT-4 的新版必應(yīng)聊天機器人和即將發(fā)布的新款 Office 工具獲得足夠的資源。這種硬件短缺的現(xiàn)狀還對微軟的客戶產(chǎn)生了影響:至少有一個客戶表示,需要等待很長時間,才能使用已經(jīng)通過微軟 Azure 云服務(wù)提供的 OpenAI 軟件。
微軟表示正在加緊添置更多硬件,以便增加 AI 計算能力,但如果速度不夠快,就有可能限制其 Azure OpenAI 服務(wù)對新客戶的吸引力。這些客戶會借助此項服務(wù)將 AI 功能添加到自己的應(yīng)用中。微軟原本在這種新的 AI 工具的商業(yè)化方面已經(jīng)領(lǐng)先于谷歌,但如果遲遲不能解決硬件短缺問題,這種優(yōu)勢也將難以發(fā)揮出來。
谷歌搶在微軟之前于本周發(fā)布了自己的 AI 輔助寫作工具,包括能夠根據(jù)簡短的提示,在谷歌 Docs 和 Sheets 中自動編寫文本的軟件。
服務(wù)器短缺正值 OpenAI 和微軟試圖快速擴大銷售范圍之際,客戶可以使用自己的數(shù)據(jù)對這種 AI 軟件進行微調(diào),從而開發(fā)圖片生成、文檔總結(jié)、搜索引擎和聊天機器人等定制化 AI 工具。
微軟已經(jīng)向 OpenAI 投資了數(shù)十億美元,有權(quán)通過 Azure OpenAI 服務(wù)向創(chuàng)業(yè)公司銷售軟件。OpenAI 也將軟件直接授權(quán)給客戶使用 —— 而作為與微軟合作的一部分,所有 OpenAI 機器學習模型都必須運行在 Azure 服務(wù)器上。這兩項服務(wù)的定價相同,每次請求收費都不到一美分。
這兩家公司在過去 3 個月推出的服務(wù)吸引了企業(yè)用戶的廣泛興趣,他們都希望將 OpenAI 的 ChatGPT 聊天機器人的底層技術(shù)整合到自家產(chǎn)品中。但是微軟 Azure OpenAI 服務(wù)的新客戶卻要面臨很長的等待時間。
硬件資源短缺的核心問題在于,GPT-4 等新的 AI 大模型需要在 GPU 上運行,這種服務(wù)器芯片可以一次性處理大量數(shù)據(jù)。為了處理這個模型的龐大計算需求,微軟已將數(shù)萬個 GPU 整合成一個個群集,分散到各個數(shù)據(jù)中心里。
在明確用戶需求量之前,微軟目前不得不將現(xiàn)有的大量 GPU 資源預留給新的必應(yīng) GPT-4 聊天機器人和即將推出的 GPT-4 Office 工具。
知情人士表示,微軟 2 月剛剛推出這項必應(yīng)智能聊天功能,目前還在加緊測算平均每天有多少人愿意使用這項服務(wù)。知情人士表示,這就導致工程師很難預測該功能所需的計算資源。
而即將推出的 Office GPT-4 工具也可能導致微軟客戶對 OpenAI 聊天機器人技術(shù)的需求大幅激增。這些新功能包括 AI 文檔總結(jié)、個性化寫作建議以及編輯建議等。
其他從事 AI 開發(fā)的微軟團隊不得不讓位于必應(yīng)和 Office,包括為各種機器學習模型的開發(fā)團隊,其中就包括微軟的圖靈自然語言生成模型,它可以理解文本,之前曾為電子郵件和 Office 應(yīng)用中的搜索工具提供底層技術(shù)。
知情人士表示,當這些團隊想要使用 GPU 開發(fā)新的 AI 工具或測試現(xiàn)有 AI 軟件時,必須向一位公司副總裁提交特別申請,獲批后才能使用硬件。
知情人士稱,有些申請需要等待幾天甚至幾周才能獲批。自 2022 年末,微軟就一直對內(nèi)部的 GPU 資源實施配額供給,但 1 月以來的等待時間越來越長。
微軟發(fā)言人在聲明中補充道,該公司正在為 Azure 等服務(wù)增加更多 AI 資源,并且遵循“優(yōu)先滿足客戶需求并根據(jù)需求進行調(diào)整的流程”。他們還補充道,微軟并不擔心 AI 資源。
至少有一個微軟客戶透露,他們也經(jīng)歷了延遲訪問的問題。市場營銷軟件創(chuàng)業(yè)公司 TouchCast 創(chuàng)始人兼 CEO Edo Segal 說:“幾乎不可能立刻使用程序”。Edo 的公司正在為多家車企開發(fā)基于 GPT 的互動式用戶手冊,而這項技術(shù)正是通過微軟 Azure 授權(quán)的。
現(xiàn)有的 AzureAI 客戶幾乎未受影響。無人駕駛汽車開發(fā)商 Cruise 和 AI 搜索創(chuàng)業(yè)公司 Perplexity 的發(fā)言人都表示,他們在使用 Azure 的 GPU 資源時并未遇到困難。
去年 11 月,微軟和 GPU 生產(chǎn)商英偉達共同宣布,微軟將新增數(shù)萬個處理器來擴大 AI 處理能力,但目前還不清楚采購進度。
這兩家公司還在周一共同宣布,Azure 的客戶很快就能搶先使用英偉達的新款 H100 GPU—— 這款產(chǎn)品尚未廣泛發(fā)布。而知情人士稱,已經(jīng)有少部分微軟內(nèi)部團隊開始使用 H100,但多數(shù)部門尚未獲得這項權(quán)限。