一句話總結:研究顧問機構Gartner今日(30日)發布警告,儘管人工智慧(AI)推論代幣的單位價格預計將大幅下滑,但由於AI應用模式的根本性改變,企業在AI方面的總體支出負擔恐將不減反增。
核心要點
- Gartner指出,AI推論代幣的單位價格將大幅下降,但企業AI總體支出可能因應用模式變化而持續增加。
- 該機構預計,到 2030 年,一個具有一兆參數的大型語言模型(LLM)推論費用,相較於 2025 年將下降超過 90%,同時相同規模模型的效率預計可提高達 百倍。
- Gartner高級總監分析師 Will Sommer 表示,這項顯著的成本效益提升,主要歸因於半導體與基礎設施效率改進、模型設計創新、晶片利用率提高,以及推論專用半導體與邊緣裝置的擴展。
- 然而,AI代理(agent)的普及正在重塑整體支出結構,導致每項任務的AI代幣使用量已比過去增加 5到30倍,這意味著儘管單位成本下降,總體使用量激增仍可能使企業的推論費用總額反而上升。
- 分析師 Sommer 警示,企業不應將架構上的效率不足,誤解為通用代幣價格下跌就代表進階推論能力普及,若僅依賴便宜代幣成本掩蓋系統缺陷,未來在代理導向的AI擴展階段恐將面臨發展限制。
- Gartner建議,未來的AI競爭力將取決於 「多模型協作」 策略而非單一模型,企業應採行分層架構,將重複性簡單任務分配給小型模型,高成本高效能模型則選擇性用於複雜高附加價值工作,以兼顧成本效益與性能表現。
一句話結論
面對AI代幣價格下降與總體支出上升的矛盾,企業必須策略性地擁抱多模型協作,精準分配運算資源,才能在AI時代保持競爭優勢,避免因成本結構變化而限制發展。

