Gartner為何示警企業AI總體支出恐不減反增？

儘管AI推論代幣單位價格預計將大幅下滑，但由於AI代理（agent）的普及，導致每項任務的AI代幣使用量已增加5到30倍，這種總體使用量的激增可能抵銷單位成本的降低，進而使企業的AI推論總費用不減反增。

企業應如何應對AI成本與效能的挑戰？

Gartner建議企業應採行「多模型協作」策略，而非單一模型。具體做法是建立分層架構，將重複性且簡單的任務分配給小型或特定領域模型處理，而高成本、高效能的模型則應選擇性地僅用於複雜且高附加價值的工作，以同時實現成本效益與性能表現。

一句話總結：研究顧問機構Gartner今日（30日）發布警告，儘管人工智慧（AI）推論代幣的單位價格預計將大幅下滑，但由於AI應用模式的根本性改變，企業在AI方面的總體支出負擔恐將不減反增。

Gartner指出，AI推論代幣的單位價格將大幅下降，但企業AI總體支出可能因應用模式變化而持續增加。
該機構預計，到 2030 年，一個具有一兆參數的大型語言模型（LLM）推論費用，相較於 2025 年將下降超過 90%，同時相同規模模型的效率預計可提高達百倍。
Gartner高級總監分析師 Will Sommer 表示，這項顯著的成本效益提升，主要歸因於半導體與基礎設施效率改進、模型設計創新、晶片利用率提高，以及推論專用半導體與邊緣裝置的擴展。
然而，AI代理（agent）的普及正在重塑整體支出結構，導致每項任務的AI代幣使用量已比過去增加 5到30倍，這意味著儘管單位成本下降，總體使用量激增仍可能使企業的推論費用總額反而上升。
分析師 Sommer 警示，企業不應將架構上的效率不足，誤解為通用代幣價格下跌就代表進階推論能力普及，若僅依賴便宜代幣成本掩蓋系統缺陷，未來在代理導向的AI擴展階段恐將面臨發展限制。
Gartner建議，未來的AI競爭力將取決於 「多模型協作」 策略而非單一模型，企業應採行分層架構，將重複性簡單任務分配給小型模型，高成本高效能模型則選擇性用於複雜高附加價值工作，以兼顧成本效益與性能表現。

面對AI代幣價格下降與總體支出上升的矛盾，企業必須策略性地擁抱多模型協作，精準分配運算資源，才能在AI時代保持競爭優勢，避免因成本結構變化而限制發展。

Categories: 科技