小型語言模型(SLM)即小語言模型,是專為高效處理語言任務而設計的神經網絡,一般被視為參數少于100億個的語言模型。小語言模型在設計上與大語言模型(LLM)核心理念相似,但模型的參數數量、整體規模較大語言模型更小。
GPT-4、Gemini等大語言模型具有優異的數據處理能力、更高的計算強度,但大語言模型對計算資源的要求較高,需要大量存儲空間,在實際中常用于云服務、數據中心、高性能計算系統等資源豐富的環境。
根據新思界產業研究中心發布的《
2025-2030年小型語言模型(SLM)行業市場深度調研及投資前景預測分析報告》顯示,相比大語言模型,小語言模型具有易部署、硬件要求低、高效靈活、成本低、能源消耗少等特點,更適用于計算資源有限的應用程序。小語言模型更勝任簡單的文檔索引、數據搜索等任務,目前已在臺式機、智能手機、智能可穿戴設備、邊緣設備等現代智能設備中已得到廣泛應用。
小語言模型是AI領域發展新熱點,科技巨頭正競相布局。目前谷歌、微軟、OpenAI、英偉達、Anthropic、Meta、Apple、阿里巴巴、vivo等企業均已布局小語言模型研發。以OpenAI公司為例,OpenAI公司提供了GPT-4o、GPT-4o mini等小語言模型,其中GPT-4o mini是OpenAI最智能、最實惠的小模型,在MMLU(文本智能和推理基準測試)中得分為82.0%。
《麻省理工科技評論》是全球最具影響力科技智庫之一,其自2001年開始評選“十大突破性技術”,在2025年“十大突破性技術”中,小語言模型入選其中,進一步體現出了小語言模型在人工智能領域的重要性和影響力。
小語言模型可以通過引入模型壓縮、高效架構、知識蒸餾、最大更新參數化、二階段預訓練等策略提升其性能。小語言模型具有獨特優點,但同時也伴隨一定局限性,如受參數量限制,小語言模型處理能力較差,在復雜的自然語言處理(NLP)領域難以達到大語言模型性能水平;由于引入模型壓縮、知識蒸餾等策略,小語言模型開發復雜性增加。
新思界
行業分析人士表示,小語言模型具有高效靈活、易于部署、成本低、能源消耗少等優勢,在部分特定領域,其已成為大語言模型的有效替代方案。作為AI領域發展新熱點,近年來,全球范圍內小語言模型成果不斷涌現,在相關企業推動下,小語言模型在智能家居、醫療保健、零售、辦公等場景逐漸實現商業化落地,產業發展已進入成熟期。