發展AI，中亞國家面臨哪些挑戰？

Share this

人工智能正成為中亞國家政治領域關鍵要素。各國正積極開發體現本國語言特色的AI模型，但普遍面臨資源有限、對外技術依賴等挑戰。

哈薩克斯坦將AI發展納入《2024-2029年人工智能發展構想》，要求打造融合哈薩克語和文化特色的語言模型，2024年通過智能數據平台開放政府數據，部署AI算力；2025年新建數據處理中心並打造一台性能達1938.41萬億次浮點運算的超級計算機。該國有24所高校及科研機構從事AI研究，6所大學正開發哈薩克語語料庫，相關科研出版物達1016篇，但資源分配不均，存在算力閒置或不足問題。

烏茲別克斯坦總統米爾濟約耶夫於2025年7月宣佈打造適配烏茲別克語和文化特色的語言模型，擬應用於醫療、金融、農業和能源等領域。同時與阿聯酋合作實施「百萬AI領軍人才計劃」，與麻省理工學院合作更新教育課程。全國運行15個數據處理中心，但烏茲別克語在互聯網佔比極低，內容不足0.1%，制約了模型訓練。

吉爾吉斯斯坦於2025年成立國家人工智能委員會，正制定本土AI模型開發戰略。高校雖開設AI課程，但覆蓋面有限，僅不到10%的理工科學生研究語言模型訓練。

塔吉克斯坦於2021年創立Tajrupt.ai人工智能學院，2025年成功研發處理塔吉克語的AI系統SoroLLM，但政府支持仍顯不足。國內開設AI課程的學校覆蓋學生不足5%，且2024年高速互聯網普及率僅為12%，塔吉克語僅佔互聯網內容的0.05%左右，制約人工智能發展。

雖然中亞各國大力發展國語，但互聯網中俄語、英語內容仍佔主導地位。此外，中亞45%的年輕人更願為接觸技術而學習英語而非母語。

人工智能的語言政策面臨著依賴全球技術的問題。全球主流模型（如GPT、BERT）主要基於英語開發，英語內容佔互聯網內容54%，俄語佔6%，而中亞各國語言總和佔比不足0.5%。《每周電腦報》（《eWeek》）2025年的一份研究顯示，印度72%的商業AI模型基於英語，哈薩克斯坦和烏茲別克斯坦金融行業80%的AI方案使用英語或俄語。

中亞語種AI模型開發麵臨的主要障礙是語料庫差距。哈薩克斯坦國家語言模型基於1.2億個標記的哈薩克語語料庫開發，遠遜於GPT-4的萬億級規模。烏茲別克斯坦語料庫含8000萬個標記。吉爾吉斯斯坦和塔吉克斯坦的語料庫更小，分別為5000萬和3000萬標記。相比之下，俄語語料庫達5億個標記，對中亞AI開發者更具吸引力。

技術主權是另一個關鍵挑戰。據世界銀行數據，2024年中亞各國研發投入佔GDP比例如下：哈薩克斯坦1.2%、烏茲別克斯坦0.8%、吉爾吉斯斯坦0.3%、塔吉克斯坦0.1%。此外，哈薩克斯坦和烏茲別克斯坦對外國技術依賴度高達90%，導致獨立開發能力受限並增加數據洩露風險。

區域競爭與合作增加了複雜性。哈薩克斯坦計劃2025年在阿斯塔納建立Alem.ai國際AI中心。烏茲別克斯坦寄望於與阿聯酋、美國的合作。吉爾吉斯斯坦和塔吉克斯坦雖相對落後，但也渴望尋求融入地區倡議。但中亞區域一體化程度仍然較低，區域內貿易僅佔15%，制約AI合作綜上所述，中亞各國AI模型正處於早期發展階段。哈薩克斯坦和烏茲別克斯坦處於領先地位，但由於資源和語料庫有限，很難與全球AI模型競爭。吉爾吉斯斯坦和塔吉克斯坦起步較晚，但也在嘗試通過教育舉措改善。

來源：bugin.info