發展AI,中亞國家面臨哪些挑戰?
人工智能正成為中亞國家政治領域關鍵要素。各國正積極開發體現本國語言特色的AI模型,但普遍面臨資源有限、對外技術依賴等挑戰。
哈薩克斯坦將AI發展納入《2024-2029年人工智能發展構想》,要求打造融合哈薩克語和文化特色的語言模型,2024年通過智能數據平台開放政府數據,部署AI算力;2025年新建數據處理中心並打造一台性能達1938.41萬億次浮點運算的超級計算機。該國有24所高校及科研機構從事AI研究,6所大學正開發哈薩克語語料庫,相關科研出版物達1016篇,但資源分配不均,存在算力閒置或不足問題。
烏茲別克斯坦總統米爾濟約耶夫於2025年7月宣佈打造適配烏茲別克語和文化特色的語言模型,擬應用於醫療、金融、農業和能源等領域。同時與阿聯酋合作實施「百萬AI領軍人才計劃」,與麻省理工學院合作更新教育課程。全國運行15個數據處理中心,但烏茲別克語在互聯網佔比極低,內容不足0.1%,制約了模型訓練。
吉爾吉斯斯坦於2025年成立國家人工智能委員會,正制定本土AI模型開發戰略。高校雖開設AI課程,但覆蓋面有限,僅不到10%的理工科學生研究語言模型訓練。
塔吉克斯坦於2021年創立Tajrupt.ai人工智能學院,2025年成功研發處理塔吉克語的AI系統SoroLLM,但政府支持仍顯不足。國內開設AI課程的學校覆蓋學生不足5%,且2024年高速互聯網普及率僅為12%,塔吉克語僅佔互聯網內容的0.05%左右,制約人工智能發展。

雖然中亞各國大力發展國語,但互聯網中俄語、英語內容仍佔主導地位。此外,中亞45%的年輕人更願為接觸技術而學習英語而非母語。
人工智能的語言政策面臨著依賴全球技術的問題。全球主流模型(如GPT、BERT)主要基於英語開發,英語內容佔互聯網內容54%,俄語佔6%,而中亞各國語言總和佔比不足0.5%。《每周電腦報》(《eWeek》)2025年的一份研究顯示,印度72%的商業AI模型基於英語,哈薩克斯坦和烏茲別克斯坦金融行業80%的AI方案使用英語或俄語。
中亞語種AI模型開發麵臨的主要障礙是語料庫差距。哈薩克斯坦國家語言模型基於1.2億個標記的哈薩克語語料庫開發,遠遜於GPT-4的萬億級規模。烏茲別克斯坦語料庫含8000萬個標記。吉爾吉斯斯坦和塔吉克斯坦的語料庫更小,分別為5000萬和3000萬標記。相比之下,俄語語料庫達5億個標記,對中亞AI開發者更具吸引力。
技術主權是另一個關鍵挑戰。據世界銀行數據,2024年中亞各國研發投入佔GDP比例如下:哈薩克斯坦1.2%、烏茲別克斯坦0.8%、吉爾吉斯斯坦0.3%、塔吉克斯坦0.1%。此外,哈薩克斯坦和烏茲別克斯坦對外國技術依賴度高達90%,導致獨立開發能力受限並增加數據洩露風險。
區域競爭與合作增加了複雜性。哈薩克斯坦計劃2025年在阿斯塔納建立Alem.ai國際AI中心。烏茲別克斯坦寄望於與阿聯酋、美國的合作。吉爾吉斯斯坦和塔吉克斯坦雖相對落後,但也渴望尋求融入地區倡議。但中亞區域一體化程度仍然較低,區域內貿易僅佔15%,制約AI合作綜上所述,中亞各國AI模型正處於早期發展階段。哈薩克斯坦和烏茲別克斯坦處於領先地位,但由於資源和語料庫有限,很難與全球AI模型競爭。吉爾吉斯斯坦和塔吉克斯坦起步較晚,但也在嘗試通過教育舉措改善。
來源:bugin.info
