摘要:近日,國家數據局印發的《數字中國建設2025年行動方案》要求,加強交通、醫療、金融、制造、農業等重點領域數據標注,建設行業高質量數據集。高質量數據集的建設依賴數據標注。清華大學數字政府與治理研究院等單位聯合發布的《智能數據標注產業發展觀察報告》(以下簡稱《報告》)指出,智能數據標注成為行業升級的關鍵路徑...
近日,國家數據局印發的《數字中國建設2025年行動方案》要求,加強交通、醫療、金融、制造、農業等重點領域數據標注,建設行業高質量數據集。
高質量數據集的建設依賴數據標注。清華大學數字政府與治理研究院等單位聯合發布的《智能數據標注產業發展觀察報告》(以下簡稱《報告》)指出,智能數據標注成為行業升級的關鍵路徑。
《報告》解釋,智能數據標注指的是通過人工智能輔助標注、自動化質檢、合成數據生成等技術,來提升效率與質量的一種標注手段。國家信息中心等機構聯合編制的《高質量數據集建設及運營前沿報告(2025年)》也提到,要建設專業化數據標注基地,并通過運用智能標注工具、組建專業標注團隊等,為人工智能訓練輸送高質量數據資源。
為什么“智能數據標注”最行?《報告》認為,盡管數據標注產業規模在不斷擴大,但它仍然面臨許多挑戰。比如,資金實力有限的中小企業面臨生存競爭挑戰、用工需求波動大、傳統人工標注模式面臨根本性變革等等。因此,深度的“人機協作”模式成為了數據標注行業的主流趨勢,也就是智能工具處理可規范化的基礎工作,而人工則專注于垂直領域和把控質量等環節。
隨著大模型技術的普及和具身智能等未來產業的興起,高質量標注數據的需求將持續增長。《報告》指出,未來,數據需求方將會越來越重視數據質量、場景多樣性和可擴展性。對此,智能標注企業需要進一步強化技術研發,深化行業應用,優化標注流程,培養高素質人才隊伍,為人工智能產業提供強大的數據支撐。
值得一提的是,中國電子信息產業發展研究院日前發布的《2025高質量數據集研究報告》顯示,我國數據標注產業產值已突破80億元,高質量數據建設進入規模化、規范化發展新階段。